在本周的科技界,阿里巴巴通义团队以一连串震撼发布,强势登顶Github开源榜单,掀起了一场AI技术的风暴。
从7月22日至25日,通义团队连续推出了四款重量级产品,分别是Qwen3-235B非思考版本、Qwen3-Coder编程模型、Qwen3-235B-A22B-Thinking-2507推理模型,以及WebSailor AI Agent框架。这四款产品分别覆盖了基础模型、编程模型、推理模型和智能体领域,均迅速攀升至各自领域的开源榜单前列。
权威机构Artificial Analysis对通义团队的最新成果给予了高度评价,认为通义千问3已成为全球最智能的非思考基础模型。非思考模式下的Qwen3-235B模型,在多项关键测试中表现卓越,不仅超越了众多顶级开源模型,甚至领先某些顶级闭源模型。
尤其Qwen3模型在Agent能力上展现出非凡实力,在BFCL测评中表现突出,这标志着模型在理解复杂指令、自主规划、调用工具完成任务的能力上达到了新高度。Agent能力被视为未来AI应用的核心竞争力,通义团队的这一突破无疑为AI技术的发展开辟了新的道路。
7月23日发布的Qwen3-Coder编程模型,更是在全球开发者社区引发了轰动。这款基于MoE架构的编程模型,拥有480B总参数和35B激活参数,原生支持256K上下文,可扩展至1M。在开发者最为关注的SWE-bench Verified基准测试中,Qwen3-Coder取得了开源模型的最佳表现,展现了强大的编程能力。
科技界领袖纷纷为Qwen3-Coder点赞,Perplexity CEO Aravind Srinivas称赞其成果令人惊叹,开源正在获胜。推特创始人Jack Dorsey也表示,Qwen3与Goose搭配使用效果极佳,进一步证明了Qwen3-Coder的强大实力。
与此同时,阿里通义实验室还开源了WebSailor AI Agent框架,直接对标OpenAI的Deep Research产品。这款框架在BrowseComp-en/zh测试中性能显著优于所有开源智能体,可媲美专属闭源模型。WebSailor采用复杂任务生成和强化学习模块的双重技术架构,能够在海量信息中进行高效检索和推理,打破了闭源系统在信息检索领域的垄断地位。
最后,7月25日发布的Qwen3-235B-A22B-Thinking-2507推理模型,成为本周发布的重磅压轴产品。该模型在AIME25、LiveCodeBench v6、WritingBench和PolyMATH等多项基准测试中均取得了优异成绩,展现了强大的推理能力。OpenRouter数据显示,阿里千问的API调用量在过去几天暴涨,已超过1000亿tokens,进一步证明了市场对阿里开源模型的认可度。
全球网友对通义团队的最新成果也给予了高度评价,有网友直接表示中国的开源AI技术已经达到了世界领先水平。AI Thinkers更是评论道,中国刚刚发布了一款怪物级的AI模型,这一评价无疑是对通义团队最新成果的最高赞誉。
文章采集于互联网