更新时间:2025-09-24 12:35:58 编辑:丁丁小编
来源:点击查看
简介
【太平洋科技快讯】9月24日消息,阿里通义千问团队正式推出Qwen3-Max模型,这是该团队迄今为止规模最大、能力最强的AI大模型。该模型总参数超过1T,预训练使用了高达36T tokens的数据。
Qwen3-Max包含三个版本:Base、Instruct和Thinking思。其中,Qwen3-Max-Instruct正式版已经上线Qwen Chat并在阿里云百炼提供API服务。
根据官方公布的信息,Qwen3-Max-Instruct的预览版在LMArena文本排行榜上稳居全球前三,超越了GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。
在专注于解决现实编程挑战的基准测试SWE-Bench Verified上,Qwen3-Max-Instruct取得了高达69.6分的优秀成绩。在评估智能体工具调用能力的Tau2-Bench上,它以74.8分超越Claude Opus 4与DeepSeek-V3.1。
Qwen3-Max-Thinking作为推理增强版本,虽仍在训练中,但已展现出非凡潜力。该版本通过集成代码解释器并运用并行测试时计算技术,展现了前所未有的推理能力。在极具挑战性的数学推理基准测试中,如AIME 25和HMMT,Qwen3-Max-Thinking均取得了满分的优异成绩,这表明其在复杂逻辑推理方面具有突出能力。
Qwen3-Max沿用了Qwen3系列的模型结构设计范式,使用了global-batch load balancing loss。这一架构使训练过程稳定平滑,没有出现loss尖刺。在训练效率方面,PAI-FlashMoE 多级流水并行策略优化下Qwen3-Max-Base的模型MFU相比Qwen2.5-Max-Base相对提升30%。同时,其支持1M长上下文训练,在长序列训练场景中表现出色。
目前,用户可以通过Qwen Chat官网直接与Qwen3-Max-Instruct模型对话,其API也已开放使用。这一万亿参数级大模型的正式发布,标志着中国在全球AI大模型竞争中的地位进一步提升,为各行各业提供更强大的AI能力支持。