阿里通义AI四款产品齐发，全球开源榜单斩获佳绩

在本周的科技界，阿里巴巴通义团队以一连串震撼发布，强势登顶Github开源榜单，掀起了一场AI技术的风暴。

从7月22日至25日，通义团队连续推出了四款重量级产品，分别是Qwen3-235B非思考版本、Qwen3-Coder编程模型、Qwen3-235B-A22B-Thinking-2507推理模型，以及WebSailor AI Agent框架。这四款产品分别覆盖了基础模型、编程模型、推理模型和智能体领域，均迅速攀升至各自领域的开源榜单前列。

权威机构Artificial Analysis对通义团队的最新成果给予了高度评价，认为通义千问3已成为全球最智能的非思考基础模型。非思考模式下的Qwen3-235B模型，在多项关键测试中表现卓越，不仅超越了众多顶级开源模型，甚至领先某些顶级闭源模型。

尤其Qwen3模型在Agent能力上展现出非凡实力，在BFCL测评中表现突出，这标志着模型在理解复杂指令、自主规划、调用工具完成任务的能力上达到了新高度。Agent能力被视为未来AI应用的核心竞争力，通义团队的这一突破无疑为AI技术的发展开辟了新的道路。

7月23日发布的Qwen3-Coder编程模型，更是在全球开发者社区引发了轰动。这款基于MoE架构的编程模型，拥有480B总参数和35B激活参数，原生支持256K上下文，可扩展至1M。在开发者最为关注的SWE-bench Verified基准测试中，Qwen3-Coder取得了开源模型的最佳表现，展现了强大的编程能力。

科技界领袖纷纷为Qwen3-Coder点赞，Perplexity CEO Aravind Srinivas称赞其成果令人惊叹，开源正在获胜。推特创始人Jack Dorsey也表示，Qwen3与Goose搭配使用效果极佳，进一步证明了Qwen3-Coder的强大实力。

与此同时，阿里通义实验室还开源了WebSailor AI Agent框架，直接对标OpenAI的Deep Research产品。这款框架在BrowseComp-en/zh测试中性能显著优于所有开源智能体，可媲美专属闭源模型。WebSailor采用复杂任务生成和强化学习模块的双重技术架构，能够在海量信息中进行高效检索和推理，打破了闭源系统在信息检索领域的垄断地位。

最后，7月25日发布的Qwen3-235B-A22B-Thinking-2507推理模型，成为本周发布的重磅压轴产品。该模型在AIME25、LiveCodeBench v6、WritingBench和PolyMATH等多项基准测试中均取得了优异成绩，展现了强大的推理能力。OpenRouter数据显示，阿里千问的API调用量在过去几天暴涨，已超过1000亿tokens，进一步证明了市场对阿里开源模型的认可度。

全球网友对通义团队的最新成果也给予了高度评价，有网友直接表示中国的开源AI技术已经达到了世界领先水平。AI Thinkers更是评论道，中国刚刚发布了一款怪物级的AI模型，这一评价无疑是对通义团队最新成果的最高赞誉。

文章采集于互联网

搜索

阿里通义AI四款产品齐发，全球开源榜单斩获佳绩