深夜突袭！阿里Qwen全球登顶，第一手实测来了

首页 > 文章列表 > 深夜突袭！阿里Qwen全球登顶，第一手实测来了

深夜突袭！阿里Qwen全球登顶，第一手实测来了

更新时间：2025-04-29 14:17:54 编辑：丁丁小编
来源：点击查看

简介

AI圈又经历了一场“深夜突袭”！主角？正是那个以迭代神速闻名的阿里巴巴——他们放出了Qwen3系列大模型，直接把枪口对准了像DeepSeek这样的顶尖选手，甚至大有猛击Gemini 2.5 Pro之势，更是全球首个开源的混合推理模型，并且支持119种语言和方言，还支持MCP协议，一出手就直接登顶了全球开源模型的王座！

消息一出，开发者社区瞬间“爆火”，热度直接拉满！

这次的“豪华套餐”都有啥？

告别单一参数的“傻大个”，Qwen3这次玩起了“组合拳”，带来了两种类型的模型：

MoE（混合专家）模型（2款），包含旗舰担当Qwen3-235B-A22B，总参数高达2350亿+，但实际激活参数为220亿+，性能强劲；另一款是“小钢炮”Qwen3-30B-A3B，拥有300亿总参数和30亿激活参数，效率惊人。

MoE模型就像聘请了一群专家，工作时只调用最相关的几位，从而节省时间和资源。

Dense（密集）模型（6款），涵盖了从Qwen3-32B到Qwen3-0.6B共六款不同规模的模型，能够满足各种算力需求，真正做到了丰俭由人，并且都展现出优秀的“能效比”。

性能表现？主打一个“能效比”！

性能方面，旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中表现出了极具竞争力的结果。

更令人称道的是效率的提升，例如30B的MoE模型Qwen3-30B-A3B，仅用相当于32B Dense模型10%的激活参数，就取得了更优的性能。

甚至连小模型Qwen3-4B也能匹敌上一代Qwen2.5-72B-Instruct的性能，实现了用更少资源完成更多任务。此外，Qwen3的Dense模型在同等尺寸下，整体性能也超越了参数量更大的Qwen2.5同类模型，尤其在数理、代码、推理方面表现更强。

不只是参数，还有“思考的艺术”！

Qwen3的核心亮点不仅在于参数的提升，更在于其创新的思考艺术：双重思考模式。

遇到复杂问题时，模型会像“老教授”一样进行深入推理，而面对简单问题时，则会迅速响应，追求效率。用户还可以动态控制和切换思考模式，实现了对模型“思考预算”的精细化管理。

此外，Qwen3具备全球化视野，支持119种语言和方言，实现了真正的“沟通无障碍”。

其Agent能力也得到显著强化，支持MCP，在工具调用和代码执行等方面进行了优化，使其更擅长扮演“智能助理”的角色，与环境交互解决问题。

开源！马上就能用

最重要的是，Qwen3系列强大的模型，包括预训练基础模型和后训练的对话模型，现在全部开源，用户可以通过Hugging Face、魔搭社区（ModelScope）、Kaggle等主流平台免费下载并进行商业使用。

开发者还可以通过阿里云百炼平台调用API，并推荐使用SGLang、vLLM等框架进行部署。对于希望在本地体验的用户，Ollama、LMStudio、MLX、llama.cpp、KTransformers等工具也已提供支持。

普通用户则可以通过通义官网或app直接体验，夸克也即将接入。

上手实测，一样聪明也一样笨

每次新模型都少不了实测环节，不过老实说现在大模型卷到这个程度，从普通用户视角来看其实都差不多，懂的都懂，不懂的都不懂。

各家的差异主要还是在背后的资源调用上，比拼谁更省钱。所以，我们也就拿几个小测试看看乐子。

就拿这个数字母测试来说，对于我们能免费用到的大部分模型，没有一个能通过测试。

同样的，Qwen3虽然能识别到这张梗图中的大部分关键信息，但没有识别最关键的信息：即东云名乃对于自己机器人身份的纠结。

回望千问路，感慨“卷”与“韧”

聊完新秀Qwen3，让我们稍微放慢脚步，回顾一下“千问”这一路走来的历程。

2023年Qwen1.0：刚问世时，它还像个懵懂少年，回答问题总带着“我知道一点点”的谦虚。用户吐槽：“这AI像是刚毕业的实习生，简历上的技能全靠Ctrl+C/V。”

2024年Qwen2.0：经过海量数据训练后，它开始展现锋芒，尤其在代码生成领域惊艳四座。程序员们感叹：“以前debug靠经验，现在debug靠Qwen2。”

2025年Qwen3.0：如今的Qwen3已经进化成“老司机”模式，不仅能处理复杂任务，还能玩梗、写段子，甚至帮人策划相亲话题。

这一路，真不容易。

想想看，全球AI领域“百模大战”的硝烟从未散去，前有GPT系列、Claude系列、Gemini系列这样的国际巨头，后有国内众多奋起直追的优秀模型。要在这样的“修罗场”里杀出一条血路，不仅需要雄厚的资金投入（训练大模型烧钱是出了名的），更需要顶尖的技术积累（算法、数据、算力缺一不可）和清晰的战略定力。

阿里巴巴选择了一条颇具挑战但也充满潜力的道路：坚持开源。这在商业逻辑上可能需要更大的魄力，但从长远来看，开源能够汇聚全球开发者的智慧，加速技术迭代和应用落地，构建强大的生态。Qwen系列每一次重要的更新，都伴随着对开源社区的贡献，这种“边跑边分享”的模式，赢得了不少开发者的尊重。

从追赶到并跑，甚至在某些方面开始领跑，千问系列的发展，是中国AI力量崛起的一个缩影。它告诉我们，即使在最前沿、竞争最激烈的科技领域，只要有持续的投入、正确的方向和足够的韧性，就能不断突破，创造惊喜。

看着Qwen3在各大榜单上“屠榜”，看着GitHub上因它而“沸腾”的讨论，我们不禁感慨：AI的发展速度实在太快了，快到让人觉得“昨天刚学废，今天又来了新的”。但这或许就是科技进步的魅力所在吧——永远充满未知，永远值得期待。

未来已来，只是分布不均。而Qwen3，正努力让这未来的“算力”和“智力”，变得更加触手可及。

简介

热门文章