HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

作者:Jam 发布时间: August 29, 2025 分类:技术 No Comments

HunyuanVideo-Foley 是腾讯混元团队开源的视频音效生成模型，支持为无声视频添加精准匹配的音效。模型基于大规模数据集训练，用多模态扩散变换器架构，结合表征对齐损失函数和音频VAE优化技术，能生成高质量、层次丰富的音效。模型适用短视频创作、电影制作、广告创意、游戏开发等场景，能显著提升内容的沉浸感和吸引力，让创作更高效、更专业。

>>展开阅读

Jam's Blog II

JamLee.Life 心情演绎

HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型