更新时间:2025-04-29 14:17:54 编辑:丁丁小编
来源:点击查看
简介
AI圈又经历了一场“深夜突袭”!主角?正是那个以迭代神速闻名的阿里巴巴——他们放出了Qwen3系列大模型,直接把枪口对准了像DeepSeek这样的顶尖选手,甚至大有猛击Gemini 2.5 Pro之势,更是全球首个开源的混合推理模型,并且支持119种语言和方言,还支持MCP协议,一出手就直接登顶了全球开源模型的王座!
消息一出,开发者社区瞬间“爆火”,热度直接拉满!
这次的“豪华套餐”都有啥?
告别单一参数的“傻大个”,Qwen3这次玩起了“组合拳”,带来了两种类型的模型:
MoE(混合专家)模型(2款),包含旗舰担当Qwen3-235B-A22B,总参数高达2350亿+,但实际激活参数为220亿+,性能强劲;另一款是“小钢炮”Qwen3-30B-A3B,拥有300亿总参数和30亿激活参数,效率惊人。
MoE模型就像聘请了一群专家,工作时只调用最相关的几位,从而节省时间和资源。
Dense(密集)模型(6款),涵盖了从Qwen3-32B到Qwen3-0.6B共六款不同规模的模型,能够满足各种算力需求,真正做到了丰俭由人,并且都展现出优秀的“能效比”。
性能表现?主打一个“能效比”!
性能方面,旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中表现出了极具竞争力的结果。
更令人称道的是效率的提升,例如30B的MoE模型Qwen3-30B-A3B,仅用相当于32B Dense模型10%的激活参数,就取得了更优的性能。
甚至连小模型Qwen3-4B也能匹敌上一代Qwen2.5-72B-Instruct的性能,实现了用更少资源完成更多任务。此外,Qwen3的Dense模型在同等尺寸下,整体性能也超越了参数量更大的Qwen2.5同类模型,尤其在数理、代码、推理方面表现更强。
不只是参数,还有“思考的艺术”!
Qwen3的核心亮点不仅在于参数的提升,更在于其创新的思考艺术:双重思考模式。
遇到复杂问题时,模型会像“老教授”一样进行深入推理,而面对简单问题时,则会迅速响应,追求效率。用户还可以动态控制和切换思考模式,实现了对模型“思考预算”的精细化管理。
此外,Qwen3具备全球化视野,支持119种语言和方言,实现了真正的“沟通无障碍”。
其Agent能力也得到显著强化,支持MCP,在工具调用和代码执行等方面进行了优化,使其更擅长扮演“智能助理”的角色,与环境交互解决问题。
开源!马上就能用
最重要的是,Qwen3系列强大的模型,包括预训练基础模型和后训练的对话模型,现在全部开源,用户可以通过Hugging Face、魔搭社区(ModelScope)、Kaggle等主流平台免费下载并进行商业使用。
开发者还可以通过阿里云百炼平台调用API,并推荐使用SGLang、vLLM等框架进行部署。对于希望在本地体验的用户,Ollama、LMStudio、MLX、llama.cpp、KTransformers等工具也已提供支持。
普通用户则可以通过通义官网或app直接体验,夸克也即将接入。
上手实测,一样聪明也一样笨
每次新模型都少不了实测环节,不过老实说现在大模型卷到这个程度,从普通用户视角来看其实都差不多,懂的都懂,不懂的都不懂。
各家的差异主要还是在背后的资源调用上,比拼谁更省钱。所以,我们也就拿几个小测试看看乐子。
就拿这个数字母测试来说,对于我们能免费用到的大部分模型,没有一个能通过测试。
同样的,Qwen3虽然能识别到这张梗图中的大部分关键信息,但没有识别最关键的信息:即东云名乃对于自己机器人身份的纠结。
回望千问路,感慨“卷”与“韧”
聊完新秀Qwen3,让我们稍微放慢脚步,回顾一下“千问”这一路走来的历程。
2023年Qwen1.0:刚问世时,它还像个懵懂少年,回答问题总带着“我知道一点点”的谦虚。用户吐槽:“这AI像是刚毕业的实习生,简历上的技能全靠Ctrl+C/V。”
2024年Qwen2.0:经过海量数据训练后,它开始展现锋芒,尤其在代码生成领域惊艳四座。程序员们感叹:“以前debug靠经验,现在debug靠Qwen2。”
2025年Qwen3.0:如今的Qwen3已经进化成“老司机”模式,不仅能处理复杂任务,还能玩梗、写段子,甚至帮人策划相亲话题。
这一路,真不容易。
想想看,全球AI领域“百模大战”的硝烟从未散去,前有GPT系列、Claude系列、Gemini系列这样的国际巨头,后有国内众多奋起直追的优秀模型。要在这样的“修罗场”里杀出一条血路,不仅需要雄厚的资金投入(训练大模型烧钱是出了名的),更需要顶尖的技术积累(算法、数据、算力缺一不可)和清晰的战略定力。
阿里巴巴选择了一条颇具挑战但也充满潜力的道路:坚持开源。这在商业逻辑上可能需要更大的魄力,但从长远来看,开源能够汇聚全球开发者的智慧,加速技术迭代和应用落地,构建强大的生态。Qwen系列每一次重要的更新,都伴随着对开源社区的贡献,这种“边跑边分享”的模式,赢得了不少开发者的尊重。
从追赶到并跑,甚至在某些方面开始领跑,千问系列的发展,是中国AI力量崛起的一个缩影。它告诉我们,即使在最前沿、竞争最激烈的科技领域,只要有持续的投入、正确的方向和足够的韧性,就能不断突破,创造惊喜。
看着Qwen3在各大榜单上“屠榜”,看着GitHub上因它而“沸腾”的讨论,我们不禁感慨:AI的发展速度实在太快了,快到让人觉得“昨天刚学废,今天又来了新的”。但这或许就是科技进步的魅力所在吧——永远充满未知,永远值得期待。
未来已来,只是分布不均。而Qwen3,正努力让这未来的“算力”和“智力”,变得更加触手可及。