RynnRCP 是阿里达摩院开源的机器人上下文协议,能降低具身智能开发门槛并打通开发全流程。RynnRCP 包含 RCP 框架和 RobotMotion 模块。RCP 框架通过能力抽象和多协议支持,将复杂硬件接口封装为标准化服务接口,实现机器人与云平台、边缘设备的高效通信。RobotMotion 模块将低频推理命令转换为高频控制信号,确保机器人运动平滑连贯,并提供仿真、调试、数据采集等功能。RynnRCP 适用工业自动化、物流仓储、服务机器人、医疗康复、农业与环境监测等场景,助力开发者快速实现机器人应用开发。
>>展开阅读
RynnEC是阿里巴巴达摩院推出的世界理解模型,专注于具身智能任务。模型基于多模态融合技术,结合视频数据和自然语言,能从多个维度解析场景中的物体,支持物体理解、空间感知和视频目标分割等功能。RynnEC无需依赖3D模型,仅靠视频序列就能建立连续的空间感知,能根据自然语言指令完成任务。模型在家庭服务机器人、工业自动化、智能安防、医疗辅助和教育培训等多个领域有广泛应用,为机器人和智能系统提供强大的语义理解能力,助力其更好地理解物理世界。
>>展开阅读
一款针对游戏 DLSS / FSR / XeSS 管理的开源工具「DLSS Swapper」支持 Steam、GOG、Epic Games 等主流游戏平台。它可以在不更新游戏的情况下,升级或降级游戏的 DLSS、FSR 和 XeSS 版本,从而优化游戏画质与性能。
>>展开阅读
喜欢折腾 All In One 系统的小伙伴应该都对这个 PVE 虚拟机系统很熟悉,可以用来创建 “万能主机”,例如可以在一台服务器或者 NAS 主机上安装多个系统,快速创建多平台环境(Windows/Linux/macOS),满足各种应用场景的需求。
>>展开阅读
GLM-4.5V是智谱推出的全球领先的开源视觉推理模型,总参数达1060亿,激活参数120亿。模型基于新一代文本基座模型GLM-4.5-Air训练而成,具备强大的视觉理解与推理能力,能处理图像、视频、文档等多种视觉内容。模型在多模态任务中表现出色,涵盖视觉问答、图像描述生成、视频理解、网页前端复刻等场景,同时支持快速响应与深度推理的灵活切换。GLM-4.5V在41个公开视觉多模态榜单中达到SOTA性能,通过高效混合训练实现全场景视觉推理,为企业和开发者提供高性价比的多模态AI解决方案。
>>展开阅读
Matrix-Game 2.0 是昆仑万维 SkyWork AI 发布的自研交互式世界模型。是业内首个开源的通用场景实时长序列交互式生成模型,模型通过视觉驱动的交互方案,能以 25 FPS 的速度在多种复杂场景中稳定生成连续视频内容,生成时长可扩展至分钟级,显著提升了连贯性和实用性。Matrix-Game 2.0 采用 3D 因果变分自编码器和多模态扩散 Transformer 架构,结合视觉编码器与用户动作指令,逐帧生成物理合理的动态视觉序列。支持用户通过简单指令(如键盘方向键、鼠标操作)自由探索和操控虚拟环境,同时保持对物理规律和场景语义的精准理解。
>>展开阅读
SkyReels-A3 是昆仑万维集团推出的音频驱动数字人创作工具。能通过简单的输入(如人像图片和语音)生成高质量的动态视频内容,让静态照片“活”起来,可以为现有视频更换台词,人物会自动对上新的口型、表情和表演。工具基于先进的DiT(Diffusion Transformer)视频扩散模型和3D变分自编码器(3D-VAE)技术,支持多模态协同生成,具备高精度音画同步和自然的动作交互能力。引入了运镜控制模块,可实现多种专业运镜效果,如推镜、拉镜、摇镜等。可以登录SkyReels官网体验。
>>展开阅读
Baichuan-M2 是百川智能推出的开源医疗增强大模型。在医疗领域表现出色,特别是在HealthBench评测中以60.1分的成绩超越了OpenAI的gpt-oss120b等众多开源模型,成为全球医疗能力最强的开源大模型。模型通过升级的AI患者模拟器和端到端强化学习技术,能模拟真实的医疗场景,生成贴近实际的医患对话数据,显著提升模型的医疗诊断能力。Baichuan-M2 进行了极致轻量化处理,量化后的模型精度接近无损,可以在RTX 4090单卡上部署,大幅降低了硬件成本。模型针对中国医学指南进行了深度优化,更符合中国临床诊疗场景的需求。
>>展开阅读
- «
- 1
- ...
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- ...
- 116
- »