Qwen3-ASR-Flash 是阿里巴巴最新推出的高精度语音识别模型,基于 Qwen3 基座模型,经海量多模态数据训练而成。支持 11 种语言和多种口音,包括普通话、四川话、闽南语、吴语、粤语等方言,以及英式、美式英语等。核心特性包括领先的识别准确率、惊艳的歌声识别能力(错误率低于 8%)、定制化识别(用户可提供背景文本获得定制化结果)、语种识别与非人声拒识,以及在复杂声学环境中的高鲁棒性。用户可通过 ModelScope、Hugging Face 和阿里云百炼 API 免费体验该模型。
>>展开阅读
Qwen3-Max-Preview 是通义千问发布的最新旗舰大语言模型。是 Qwen3 系列中参数量最大的模型,参数规模超过 1 万亿。模型在推理、指令跟随、多语言支持和长尾知识覆盖等方面有重大改进,支持超过 100 种语言,中英文理解能力出色。在数学推理、编程和科学推理等任务中表现出色,能更可靠地遵循复杂指令,减少幻觉,生成更高质量的响应。用户可以通过 Qwen Chat 网页免费体验,也可以通过阿里云百炼平台的 API 进行调用。
>>展开阅读
Seedream 4.0 是字节跳动推出的先进图像生成与编辑模型,以生成与编辑一体化为核心,具备精准指令编辑、高度特征保持、深度意图理解等强大功能。用户通过自然语言描述需求,能快速生成高质量图像,创意设计、广告制作和艺术创作,都能轻松应对。模型支持多图输入输出,能生成连贯图像序列,满足漫画、分镜等多帧创作需求。Seedream 4.0 支持生成超高清图像,确保细节清晰,为专业创作提供有力支持,是创作者的得力助手。访问豆包APP P图功能和即梦AI(模型内测中,部分用户可以使用)即可体验最新模型。
>>展开阅读
rStar2-Agent是微软开源的先进的人工智能数学推理模型,在AIME24测试中达到80.6%的准确率,展现出强大的数学问题解决能力。模型具备科学推理能力,在GPQA-Diamond基准测试中达到60.9%的准确率。模型通过智能体强化学习进行训练,具备高效工具调用能力,支持根据问题需求自动调用合适工具,如代码执行工具,提升问题解决效率。模型训练过程采用多阶段强化学习,结合GRPO-RoC算法,优化工具使用,大幅降低成本。
>>展开阅读
FineVision 是 Hugging Face 开源的视觉语言数据集,为训练先进的视觉语言模型。包含 1730 万张图像、2430 万个样本、8890 万轮对话和 95 亿个答案标记。数据集聚合了来自 200 多个来源的数据,具有多模态和多轮对话的特点,支持视觉和语言的结合。每张图像都配有文本标题,有助于模型理解和生成自然语言。FineVision 在 10 项基准测试中帮助模型平均提升了超过 20% 的性能。使用 Hugging Face 的 datasets 库可以轻松加载和使用数据集。
>>展开阅读
Claudable 是基于 Next.js 的开源 Web 应用构建器,结合了 Claude Code 和 Cursor CLI 的先进 AI 代理能力,以及 Lovable 简单直观的应用构建体验。用户只需用自然语言描述需求,Claudable 能快速生成生产就绪的 Next.js 代码,支持即时预览和热重载,无需复杂的设置即可开始构建。提供美观的 UI 生成、一键部署到 Vercel、自动设置版本控制和持续部署、连接生产就绪的 PostgreSQL 数据库等功能。
>>展开阅读

>>展开阅读
在线代码托管平台「GitHub」旨在为开发者提供版本控制和协作工具。不过对于新手用户来说全英文界面上手难度比较高,所以有开发者制作了一款扩展插件油猴脚本,实现 GitHub 界面的全面中文化。使用方法,先安装 Tampermonkey 插件,再导入 GitHub 中文化脚本。
>>展开阅读
- «
- 1
- ...
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- ...
- 116
- »