AI，让牛马更“牛马”

作者:Jam 发布时间: September 28, 2025 分类:日志 No Comments

最近到客户公司驻场服务，发现一个现象：经理级别以上的，基本不怎么使用AI，也多数不懂怎么使用，而执行层，尤其是那些文案、设计、做短视频剪辑的“牛马们”，反而用得最多。这让我想起之前看的谷歌一份报告中写到，有高达90%的软件工程师已在工作中使用AI，OpenAI的数据也表明，近40%的工作对话与写作辅助相关。自AI爆发以来，这个工具好像以前所未有的速度渗透进执行层工作的每一个缝隙。但一个悖论也随之浮现：当AI这把“利器”宣称要解放生产力时，为何手握它的“牛马”们没有变得更轻松，反而显得更忙碌了？

>>展开阅读

Audio2Face - NVIDIA开源的AI 3D面部动画生成模型

作者:Jam 发布时间: September 27, 2025 分类: No Comments

Audio2Face是NVIDIA开源的能将音频输入转化为逼真的3D面部动画AI工具。通过分析音频中的语音特征，如音素和语调，生成精确的唇部同步和细腻的情感表达，为虚拟角色赋予生动的人类表情。开发者可以免费获取Audio2Face的模型和SDK，将其集成到游戏、3D应用或其他项目中，快速创建高保真角色动画。NVIDIA还开源了Audio2Face训练框架，让开发者能使用自己的数据对模型进行微调和定制，以满足特定需求。例如，开发者可以训练出符合特定角色表演风格、语言或情感表达的模型。Audio2Face提供了针对Autodesk Maya和Unreal Engine 5的插件，方便用户在这些主流3D软件中直接使用该技术。

>>展开阅读

Hunyuan3D-Omni - 腾讯混元开源的3D模型生成框架

作者:Jam 发布时间: September 27, 2025 分类:技术 No Comments

Hunyuan3D-Omni（混元3D-Omni）是腾讯混元3D团队开源的3D资产生成框架，通过多种控制信号实现精准的3D模型生成。基于Hunyuan3D 2.1架构，引入了统一的控制编码器，可处理点云、骨骼姿态、边界框等多种控制信号，避免信号混淆。该框架采用渐进式、难度感知的采样策略进行训练，优先采样难度较高的信号，提升模型对缺失输入的鲁棒性。Hunyuan3D-Omni支持边界框、骨骼姿态、点云、体素等多种控制方式，可生成具有特定姿态的人物模型、符合边界框约束的模型等，有效解决了传统3D生成中的扭曲、细节缺失等问题。在游戏、影视、设计等领域具有广阔的应用前景，为创作者提供更精确的控制能力，提升3D资产生成的精度和鲁棒性。

>>展开阅读

Neovate Code - 蚂蚁开源的智能编程助手

作者:Jam 发布时间: September 25, 2025 分类:技术 No Comments

Neovate Code 是蚂蚁集团支付宝体验技术部开源的智能编程助手，通过人工智能技术提升开发效率。具备对话式开发功能，开发者可以通过自然语言描述需求，Neovate Code 能理解并生成相应的代码。支持规则文件定制，开发者可以通过 AGENTS.md 文件为项目定义特定规则和行为，实现个性化开发。Neovate Code 提供会话管理功能，支持跨会话继续和恢复工作，方便开发者在不同时间点继续开发任务。支持多种主流模型和提供商，如 OpenAI、Anthropic、Google 等，用户可以根据需求选择合适的模型。其斜杠命令功能为常用操作提供了快速入口，输出样式可自定义代码更改的呈现方式。

>>展开阅读

DeepSeek-V3.1-Terminus - DeepSeek推出的最新版AI模型

作者:Jam 发布时间: September 25, 2025 分类:技术 No Comments

DeepSeek-V3.1-Terminus 是 DeepSeek 团队推出的人工智能语言模型，是 DeepSeek-V3.1 的升级版本。模型在语言一致性、代码生成和搜索能力等方面进行优化，能更准确地处理中英文混杂内容，生成更规范的文本，提升编程辅助和信息检索的效率。模型适用内容创作、知识问答、编程辅助、学习辅导和数据分析等多种场景，为用户提供高效、准确的智能服务，为开发者和用户提供便捷的使用途径。 1758598466-1758598466-DeepSeek-V3.1-Terminus-website-2.png

>>展开阅读

WebWeaver - 阿里通义开源的新型双智能体框架

作者:Jam 发布时间: September 22, 2025 分类:技术 No Comments

WebWeaver是阿里巴巴通义团队推出的新型双智能体框架，隶属通义DeepResearch家族，主要用在开放性深度研究，能模拟人类研究过程，分为规划和写作两个智能体。规划智能体负责探索和生成大纲，写作智能体则负责内容合成。WebWeaver核心创新在于动态大纲优化，将研究大纲作为“活文档”，在搜索与大纲细化间循环，使研究方向随新发现动态演变。WebWeaver基于分层合成方法，逐节构建报告，确保报告连贯、准确且深度依托来源。

>>展开阅读

Lucy Edit - 开源的AI视频编辑工具，自然语言描述编辑

作者:Jam 发布时间: September 22, 2025 分类:技术 No Comments

Lucy Edit 是开源的 AI 视频编辑工具，由 Decart AI 开发。允许用户通过简单的自然语言描述来编辑视频，例如“将人物换成北极熊”或“把场景变成2D卡通风格”，无需复杂的微调或使用遮罩。Lucy Edit 支持多种编辑类型，包括服装更换、角色替换、物体插入和场景更换等，能保留视频中人物或物体的动作和整体构图，使编辑后的视频看起来自然流畅。Lucy Edit 基于 Wan2.2 5B 架构，具有零样本学习能力，用户无需对特定任务进行大量训练或手动标注视频片段，即可直接使用文本描述开始编辑。

>>展开阅读

GPT-5-Codex - OpenAI推出的最强编程模型

作者:Jam 发布时间: September 20, 2025 分类:技术 No Comments

GPT-5-Codex 是 OpenAI 推出的强大的编程优化模型，基于 GPT-5 进一步强化，专为软件工程师设计。模型能快速生成高质量代码，支持多种编程语言，且能优化现有代码提升性能。在代码审查方面，模型能精准发现关键缺陷，提供详细的审查报告，帮助开发者快速定位和修复问题。GPT-5-Codex 具备出色的交互式编程能力，支持在交互式会话中快速响应简单任务。模型支持多模态输入，能处理图片输入，适用前端设计和 UI 任务，支持展示工作进度的截图，为开发者提供直观反馈。

>>展开阅读

Jam's Blog II

JamLee.Life 心情演绎

AI，让牛马更“牛马”

Audio2Face - NVIDIA开源的AI 3D面部动画生成模型

Hunyuan3D-Omni - 腾讯混元开源的3D模型生成框架

Neovate Code - 蚂蚁开源的智能编程助手

DeepSeek-V3.1-Terminus - DeepSeek推出的最新版AI模型

WebWeaver - 阿里通义开源的新型双智能体框架

Lucy Edit - 开源的AI视频编辑工具，自然语言描述编辑

GPT-5-Codex - OpenAI推出的最强编程模型