Qwen3-ASR-Flash - 阿里通义千问推出的系列语音识别模型

作者:Jam 发布时间: September 9, 2025 分类:技术 No Comments

Qwen3-ASR-Flash 是阿里巴巴最新推出的高精度语音识别模型，基于 Qwen3 基座模型，经海量多模态数据训练而成。支持 11 种语言和多种口音，包括普通话、四川话、闽南语、吴语、粤语等方言，以及英式、美式英语等。核心特性包括领先的识别准确率、惊艳的歌声识别能力（错误率低于 8%）、定制化识别（用户可提供背景文本获得定制化结果）、语种识别与非人声拒识，以及在复杂声学环境中的高鲁棒性。用户可通过 ModelScope、Hugging Face 和阿里云百炼 API 免费体验该模型。

>>展开阅读

Jam's Blog II

JamLee.Life 心情演绎

Qwen3-ASR-Flash - 阿里通义千问推出的系列语音识别模型