RynnEC - 阿里达摩院开源的世界理解模型

RynnEC是阿里巴巴达摩院推出的世界理解模型,专注于具身智能任务。模型基于多模态融合技术,结合视频数据和自然语言,能从多个维度解析场景中的物体,支持物体理解、空间感知和视频目标分割等功能。RynnEC无需依赖3D模型,仅靠视频序列就能建立连续的空间感知,能根据自然语言指令完成任务。模型在家庭服务机器人、工业自动化、智能安防、医疗辅助和教育培训等多个领域有广泛应用,为机器人和智能系统提供强大的语义理解能力,助力其更好地理解物理世界。RynnEC - 阿里达摩院开源的世界理解模型

>>展开阅读

DLSS Swapper - 游戏 DLSS / FSR / XeSS 管理

一款针对游戏 DLSS / FSR / XeSS 管理的开源工具「DLSS Swapper」支持 Steam、GOG、Epic Games 等主流游戏平台。它可以在不更新游戏的情况下,升级或降级游戏的 DLSS、FSR 和 XeSS 版本,从而优化游戏画质与性能。20250812-3

>>展开阅读

GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V是智谱推出的全球领先的开源视觉推理模型,总参数达1060亿,激活参数120亿。模型基于新一代文本基座模型GLM-4.5-Air训练而成,具备强大的视觉理解与推理能力,能处理图像、视频、文档等多种视觉内容。模型在多模态任务中表现出色,涵盖视觉问答、图像描述生成、视频理解、网页前端复刻等场景,同时支持快速响应与深度推理的灵活切换。GLM-4.5V在41个公开视觉多模态榜单中达到SOTA性能,通过高效混合训练实现全场景视觉推理,为企业和开发者提供高性价比的多模态AI解决方案。GLM-4.5V - 智谱推出的多模态开源视觉推理模型

>>展开阅读

Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型

Matrix-Game 2.0 是昆仑万维 SkyWork AI 发布的自研交互式世界模型。是业内首个开源的通用场景实时长序列交互式生成模型,模型通过视觉驱动的交互方案,能以 25 FPS 的速度在多种复杂场景中稳定生成连续视频内容,生成时长可扩展至分钟级,显著提升了连贯性和实用性。Matrix-Game 2.0 采用 3D 因果变分自编码器和多模态扩散 Transformer 架构,结合视觉编码器与用户动作指令,逐帧生成物理合理的动态视觉序列。支持用户通过简单指令(如键盘方向键、鼠标操作)自由探索和操控虚拟环境,同时保持对物理规律和场景语义的精准理解。Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型

>>展开阅读