RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议

作者:Jam 发布时间: August 13, 2025 分类:技术 No Comments

RynnRCP 是阿里达摩院开源的机器人上下文协议，能降低具身智能开发门槛并打通开发全流程。RynnRCP 包含 RCP 框架和 RobotMotion 模块。RCP 框架通过能力抽象和多协议支持，将复杂硬件接口封装为标准化服务接口，实现机器人与云平台、边缘设备的高效通信。RobotMotion 模块将低频推理命令转换为高频控制信号，确保机器人运动平滑连贯，并提供仿真、调试、数据采集等功能。RynnRCP 适用工业自动化、物流仓储、服务机器人、医疗康复、农业与环境监测等场景，助力开发者快速实现机器人应用开发。

>>展开阅读

RynnEC - 阿里达摩院开源的世界理解模型

作者:Jam 发布时间: August 13, 2025 分类:技术 No Comments

RynnEC是阿里巴巴达摩院推出的世界理解模型，专注于具身智能任务。模型基于多模态融合技术，结合视频数据和自然语言，能从多个维度解析场景中的物体，支持物体理解、空间感知和视频目标分割等功能。RynnEC无需依赖3D模型，仅靠视频序列就能建立连续的空间感知，能根据自然语言指令完成任务。模型在家庭服务机器人、工业自动化、智能安防、医疗辅助和教育培训等多个领域有广泛应用，为机器人和智能系统提供强大的语义理解能力，助力其更好地理解物理世界。

>>展开阅读

DLSS Swapper - 游戏 DLSS / FSR / XeSS 管理

作者:Jam 发布时间: August 13, 2025 分类:技术 No Comments

一款针对游戏 DLSS / FSR / XeSS 管理的开源工具「DLSS Swapper」支持 Steam、GOG、Epic Games 等主流游戏平台。它可以在不更新游戏的情况下，升级或降级游戏的 DLSS、FSR 和 XeSS 版本，从而优化游戏画质与性能。 20250812-3

>>展开阅读

ALL IN ONE 主机神器， PVE 虚拟机系统最新版 9.0 发布

作者:Jam 发布时间: August 12, 2025 分类:技术 No Comments

喜欢折腾 All In One 系统的小伙伴应该都对这个 PVE 虚拟机系统很熟悉，可以用来创建 “万能主机”，例如可以在一台服务器或者 NAS 主机上安装多个系统，快速创建多平台环境（Windows/Linux/macOS），满足各种应用场景的需求。 All In One 主机神器， PVE 虚拟机系统最新版 9.0 发布-1

>>展开阅读

GLM-4.5V - 智谱推出的多模态开源视觉推理模型

作者:Jam 发布时间: August 12, 2025 分类:技术 No Comments

GLM-4.5V是智谱推出的全球领先的开源视觉推理模型，总参数达1060亿，激活参数120亿。模型基于新一代文本基座模型GLM-4.5-Air训练而成，具备强大的视觉理解与推理能力，能处理图像、视频、文档等多种视觉内容。模型在多模态任务中表现出色，涵盖视觉问答、图像描述生成、视频理解、网页前端复刻等场景，同时支持快速响应与深度推理的灵活切换。GLM-4.5V在41个公开视觉多模态榜单中达到SOTA性能，通过高效混合训练实现全场景视觉推理，为企业和开发者提供高性价比的多模态AI解决方案。

>>展开阅读

Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型

作者:Jam 发布时间: August 12, 2025 分类:技术 No Comments

Matrix-Game 2.0 是昆仑万维 SkyWork AI 发布的自研交互式世界模型。是业内首个开源的通用场景实时长序列交互式生成模型，模型通过视觉驱动的交互方案，能以 25 FPS 的速度在多种复杂场景中稳定生成连续视频内容，生成时长可扩展至分钟级，显著提升了连贯性和实用性。Matrix-Game 2.0 采用 3D 因果变分自编码器和多模态扩散 Transformer 架构，结合视觉编码器与用户动作指令，逐帧生成物理合理的动态视觉序列。支持用户通过简单指令（如键盘方向键、鼠标操作）自由探索和操控虚拟环境，同时保持对物理规律和场景语义的精准理解。

>>展开阅读

SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

作者:Jam 发布时间: August 11, 2025 分类:技术 No Comments

SkyReels-A3 是昆仑万维集团推出的音频驱动数字人创作工具。能通过简单的输入（如人像图片和语音）生成高质量的动态视频内容，让静态照片“活”起来，可以为现有视频更换台词，人物会自动对上新的口型、表情和表演。工具基于先进的DiT（Diffusion Transformer）视频扩散模型和3D变分自编码器（3D-VAE）技术，支持多模态协同生成，具备高精度音画同步和自然的动作交互能力。引入了运镜控制模块，可实现多种专业运镜效果，如推镜、拉镜、摇镜等。可以登录SkyReels官网体验。

>>展开阅读

Baichuan-M2 - 百川智能推出开源的医疗增强大模型

作者:Jam 发布时间: August 11, 2025 分类:技术 No Comments

Baichuan-M2 是百川智能推出的开源医疗增强大模型。在医疗领域表现出色，特别是在HealthBench评测中以60.1分的成绩超越了OpenAI的gpt-oss120b等众多开源模型，成为全球医疗能力最强的开源大模型。模型通过升级的AI患者模拟器和端到端强化学习技术，能模拟真实的医疗场景，生成贴近实际的医患对话数据，显著提升模型的医疗诊断能力。Baichuan-M2 进行了极致轻量化处理，量化后的模型精度接近无损，可以在RTX 4090单卡上部署，大幅降低了硬件成本。模型针对中国医学指南进行了深度优化，更符合中国临床诊疗场景的需求。

>>展开阅读

Jam's Blog II

JamLee.Life 心情演绎

RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议

RynnEC - 阿里达摩院开源的世界理解模型

DLSS Swapper - 游戏 DLSS / FSR / XeSS 管理

ALL IN ONE 主机神器， PVE 虚拟机系统最新版 9.0 发布

GLM-4.5V - 智谱推出的多模态开源视觉推理模型

Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型

SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

Baichuan-M2 - 百川智能推出开源的医疗增强大模型