Matrix-Game 2.0 是昆仑万维 SkyWork AI 发布的自研交互式世界模型。是业内首个开源的通用场景实时长序列交互式生成模型,模型通过视觉驱动的交互方案,能以 25 FPS 的速度在多种复杂场景中稳定生成连续视频内容,生成时长可扩展至分钟级,显著提升了连贯性和实用性。Matrix-Game 2.0 采用 3D 因果变分自编码器和多模态扩散 Transformer 架构,结合视觉编码器与用户动作指令,逐帧生成物理合理的动态视觉序列。支持用户通过简单指令(如键盘方向键、鼠标操作)自由探索和操控虚拟环境,同时保持对物理规律和场景语义的精准理解。
>>展开阅读
OpenAI创始人Sam Altman(山姆·奥特曼)描绘了AI的下一阶段:AI不再是被动等待指令的工具,而是主动提供帮助的“人生操作系统”(“LifeOS”),它通过长期积累对你的了解,将“记住你的一生”,预测你的需求,为你规划生活,甚至理解你的情绪变化,能够在任何时间任何地点为你提供所需的服务。
>>展开阅读
SkyReels-A3 是昆仑万维集团推出的音频驱动数字人创作工具。能通过简单的输入(如人像图片和语音)生成高质量的动态视频内容,让静态照片“活”起来,可以为现有视频更换台词,人物会自动对上新的口型、表情和表演。工具基于先进的DiT(Diffusion Transformer)视频扩散模型和3D变分自编码器(3D-VAE)技术,支持多模态协同生成,具备高精度音画同步和自然的动作交互能力。引入了运镜控制模块,可实现多种专业运镜效果,如推镜、拉镜、摇镜等。可以登录SkyReels官网体验。
>>展开阅读
Baichuan-M2 是百川智能推出的开源医疗增强大模型。在医疗领域表现出色,特别是在HealthBench评测中以60.1分的成绩超越了OpenAI的gpt-oss120b等众多开源模型,成为全球医疗能力最强的开源大模型。模型通过升级的AI患者模拟器和端到端强化学习技术,能模拟真实的医疗场景,生成贴近实际的医患对话数据,显著提升模型的医疗诊断能力。Baichuan-M2 进行了极致轻量化处理,量化后的模型精度接近无损,可以在RTX 4090单卡上部署,大幅降低了硬件成本。模型针对中国医学指南进行了深度优化,更符合中国临床诊疗场景的需求。
>>展开阅读
Qwen-Flash 是阿里巴巴通义千问系列推出的高性能、低成本的语言模型,专为快速响应和高效处理简单任务设计。基于先进的 Mixture-of-Experts (MoE) 架构,通过稀疏专家网络实现高效的计算资源分配,能在处理不同任务时智能选择并激活最合适的专家模块,大幅提升推理速度和性能表现。Qwen-Flash 特别适合需要快速生成文本、代码等场景,例如智能客服、代码辅助开发等。
>>展开阅读
Claude Opus 4.1 是 Anthropic 公司推出的先进大型语言模型,专为高效处理复杂任务而设计。模型在编程领域表现出色,能生成高质量代码,支持长达 32k 的单次输出,适应多种编程风格。模型具备强大的自主决策能力,能协调复杂的企业工作流程,管理多渠道营销活动。在内容创作方面,支持生成自然流畅的文本,尤其擅长创意写作。Claude Opus 4.1 的推理能力非常出色,支持即时响应和逐步推理,用户根据需求灵活选择。模型安全性极高,无害响应率高达 98.76%,能有效拒绝违规请求。Claude Opus 4.1在多个基准测试中表现优异,是目前领先的语言模型之一。
>>展开阅读
Genie 3 是谷歌 DeepMind 推出的新一代通用世界模型,支持实时生成高度动态且连贯的虚拟世界。Genie 3 能模拟物理现象、自然生态系统,还支持创建奇幻场景和历史场景。用文本提示,用户能改变世界的状态,比如调整天气或添加新物体。Genie 3 的视觉一致性可维持数分钟,视觉记忆能追溯到一分钟前,为 AI 智能体提供理想的训练环境。Genie 3用自回归生成技术,逐帧生成画面,确保环境的动态性和丰富性。Genie 3在教育、娱乐、AI 研究等领域展现出巨大的应用潜力。
>>展开阅读
今天推荐一款同样支持 Office / WPS 免费 AI 插件「DocEasy」从内容创作到文档编辑的全方位智能解决方案。只需描述您的需求,通过 AI 可以生成高质量内容,助您快速完成创作。
>>展开阅读
- «
- 1
- ...
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- ...
- 20
- »