国产AI逆袭！阿里Qwen3.7-Max编程能力首超Claude Opus 4.6，登顶全球第二

Qwen3.7-Max编程榜单成绩

全球权威编程榜单Code Arena最新成绩出炉，阿里旗舰模型Qwen3.7-Max以1541分的高分力压Claude Opus 4.6，在大模型厂商中排名全球第二，仅次于Claude系列。这是国产大模型在编程领域的历史性突破！

🏆 核心要点：Qwen3.7-Max的成绩有多硬核？

据IT之家5月26日消息，全球权威三方编程榜单Code Arena于5月25日更新榜单，阿里旗舰模型Qwen3.7-Max得分1541分，在全球模型榜单中排名第四，仅次于claude-opus-4-7-thinking、claude-opus-4-7和claude-opus-4-6-thinking三款Claude系列模型。

这意味着阿里Qwen3.7-Max的编程能力已经正式超越了claude-opus-4-6模型，同时也是国产大模型在该榜单上的历史最好成绩。不仅如此，Qwen3.7-Max还超过了glm-5.1、kimi-k2.6等强劲对手，稳坐国产第一的宝座。

Code Arena榜单详情

🔬 榜单含金量：为什么Code Arena如此权威？

Code Arena是目前全球人工智能领域含金量最高、最权威的编程大模型（LLM）能力评估榜单之一。与传统的学术化选择题测试不同，该榜单直接评估模型在生成、调试、重构复杂代码时的实际编程能力。

更为关键的是，为防止刷榜（Anti-Gaming），Code Arena采用用户随机盲测机制，模型无法提前获知考题，这意味着模型必须具备真正的硬核代码生成能力，无法通过针对性的数据训练来”作弊”。这种评测方式使得该榜单的结果具有极高的可信度和参考价值。

Design Arena榜单排名

🌟 全面开花：Qwen3.7-Max设计能力同样亮眼

除了编程能力的大幅突破，阿里Qwen3.7-Max在最新放出的Design Arena榜单中同样取得了耀眼成绩，位列第十名。Design Arena以及其图像侧的Image Arena和LMArena，作为基于真实用户盲测的AI模型评测平台，在当前AI行业中具有极高的含金量，被业界称为”AI界的奥林匹克”。

Design Arena评测详情