项目级代码生成结果出炉!o3/Claude3.7领跑,R1跻身第一梯队 作者:Jam 发布时间: March 3, 2025 分类:技术 No Comments 测评方案见:项目级代码生成测评基准发布。本次测评基于大模型“裁判团”的合作,全方位评价了国内外12个大模型在项目级代码生成任务上的能力,任务涵盖包括了游戏开发、工具和管理系统等5大类应用场景。以下为详细测评报告。>>展开阅读