最近到客户公司驻场服务,发现一个现象:经理级别以上的,基本不怎么使用AI,也多数不懂怎么使用,而执行层,尤其是那些文案、设计、做短视频剪辑的“牛马们”,反而用得最多。这让我想起之前看的谷歌一份报告中写到,有高达90%的软件工程师已在工作中使用AI,OpenAI的数据也表明,近40%的工作对话与写作辅助相关。自AI爆发以来,这个工具好像以前所未有的速度渗透进执行层工作的每一个缝隙。但一个悖论也随之浮现:当AI这把“利器”宣称要解放生产力时,为何手握它的“牛马”们没有变得更轻松,反而显得更忙碌了?
>>展开阅读
Audio2Face是NVIDIA开源的能将音频输入转化为逼真的3D面部动画AI工具。通过分析音频中的语音特征,如音素和语调,生成精确的唇部同步和细腻的情感表达,为虚拟角色赋予生动的人类表情。开发者可以免费获取Audio2Face的模型和SDK,将其集成到游戏、3D应用或其他项目中,快速创建高保真角色动画。NVIDIA还开源了Audio2Face训练框架,让开发者能使用自己的数据对模型进行微调和定制,以满足特定需求。例如,开发者可以训练出符合特定角色表演风格、语言或情感表达的模型。Audio2Face提供了针对Autodesk Maya和Unreal Engine 5的插件,方便用户在这些主流3D软件中直接使用该技术。
>>展开阅读
Hunyuan3D-Omni(混元3D-Omni)是腾讯混元3D团队开源的3D资产生成框架,通过多种控制信号实现精准的3D模型生成。基于Hunyuan3D 2.1架构,引入了统一的控制编码器,可处理点云、骨骼姿态、边界框等多种控制信号,避免信号混淆。该框架采用渐进式、难度感知的采样策略进行训练,优先采样难度较高的信号,提升模型对缺失输入的鲁棒性。Hunyuan3D-Omni支持边界框、骨骼姿态、点云、体素等多种控制方式,可生成具有特定姿态的人物模型、符合边界框约束的模型等,有效解决了传统3D生成中的扭曲、细节缺失等问题。在游戏、影视、设计等领域具有广阔的应用前景,为创作者提供更精确的控制能力,提升3D资产生成的精度和鲁棒性。
>>展开阅读
Neovate Code 是蚂蚁集团支付宝体验技术部开源的智能编程助手,通过人工智能技术提升开发效率。具备对话式开发功能,开发者可以通过自然语言描述需求,Neovate Code 能理解并生成相应的代码。支持规则文件定制,开发者可以通过 AGENTS.md 文件为项目定义特定规则和行为,实现个性化开发。Neovate Code 提供会话管理功能,支持跨会话继续和恢复工作,方便开发者在不同时间点继续开发任务。支持多种主流模型和提供商,如 OpenAI、Anthropic、Google 等,用户可以根据需求选择合适的模型。其斜杠命令功能为常用操作提供了快速入口,输出样式可自定义代码更改的呈现方式。
>>展开阅读
DeepSeek-V3.1-Terminus 是 DeepSeek 团队推出的人工智能语言模型,是 DeepSeek-V3.1 的升级版本。模型在语言一致性、代码生成和搜索能力等方面进行优化,能更准确地处理中英文混杂内容,生成更规范的文本,提升编程辅助和信息检索的效率。模型适用内容创作、知识问答、编程辅助、学习辅导和数据分析等多种场景,为用户提供高效、准确的智能服务,为开发者和用户提供便捷的使用途径。
>>展开阅读
WebWeaver是阿里巴巴通义团队推出的新型双智能体框架,隶属通义DeepResearch家族,主要用在开放性深度研究,能模拟人类研究过程,分为规划和写作两个智能体。规划智能体负责探索和生成大纲,写作智能体则负责内容合成。WebWeaver核心创新在于动态大纲优化,将研究大纲作为“活文档”,在搜索与大纲细化间循环,使研究方向随新发现动态演变。WebWeaver基于分层合成方法,逐节构建报告,确保报告连贯、准确且深度依托来源。
>>展开阅读
Lucy Edit 是开源的 AI 视频编辑工具,由 Decart AI 开发。允许用户通过简单的自然语言描述来编辑视频,例如“将人物换成北极熊”或“把场景变成2D卡通风格”,无需复杂的微调或使用遮罩。Lucy Edit 支持多种编辑类型,包括服装更换、角色替换、物体插入和场景更换等,能保留视频中人物或物体的动作和整体构图,使编辑后的视频看起来自然流畅。Lucy Edit 基于 Wan2.2 5B 架构,具有零样本学习能力,用户无需对特定任务进行大量训练或手动标注视频片段,即可直接使用文本描述开始编辑。
>>展开阅读
GPT-5-Codex 是 OpenAI 推出的强大的编程优化模型,基于 GPT-5 进一步强化,专为软件工程师设计。模型能快速生成高质量代码,支持多种编程语言,且能优化现有代码提升性能。在代码审查方面,模型能精准发现关键缺陷,提供详细的审查报告,帮助开发者快速定位和修复问题。GPT-5-Codex 具备出色的交互式编程能力,支持在交互式会话中快速响应简单任务。模型支持多模态输入,能处理图片输入,适用前端设计和 UI 任务,支持展示工作进度的截图,为开发者提供直观反馈。
>>展开阅读
- «
- 1
- ...
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- ...
- 20
- »