登录
首页 > 文章列表 > AI圈又炸锅了!Claude 4突然发布,连跑7小时不带喘气

更新时间:2025-05-24 10:15:05 编辑:丁丁小编
来源:点击查看

简介

AI圈真是好戏连台,瓜田丰收!上周Claude的系统提示词意外曝光那点事儿,估计还在不少人的吃瓜列表里呢,这周Anthropic就直接不按常理出牌,万众瞩目的Claude 4正式发布! 这波操作,直接把大家的注意力又给强势拉回来了。

主角是两位超能打的新秀:Claude Opus 4和Claude Sonnet 4。它们一出场,直接在编程、推理和AI智能体上把行业天花板又捅高了一截,业界顶尖名不虚传!

连续编程7小时不带喘

要说这次更新中最耀眼、最能激起讨论热情的明星,那必须是旗舰型号Claude Opus 4。这家伙最让人津津乐道的,已经不仅仅是“聪明”二字可以概括,更是它那股“一张蓝图绘到底,不达目的不罢休”的惊人牛劲和持久耐力。

全球知名的企业软件巨头乐天(Rakuten) 把一个复杂度极高、要求极严的开源代码重构任务交给了Opus 4。在众人瞩目之下,Opus 4硬是展现出了超乎想象的自主性,连续不断地敲了整整7个小时的代码,而且整个过程中性能输出稳如磐石,丝毫不见疲态!

光这一个例子,就足以让业界对其持久作战能力和对复杂上下文的深刻理解能力刮目相看。

这种“超长待机”、深度记忆和精细规划的能力,意味着在那些需要长时间投入、多步骤推理的超级复杂任务中,能够更出色地理解并一步步执行那些错综复杂的计划。比如在之前广受关注的“Claude玩宝可梦”实验的进阶挑战里,Opus 4就展现出了远超前辈们的长期记忆和策略规划水平,可以连续玩24小时,而前辈只能玩45分钟。

Claude 4新技傍身,招招致命

此番Claude 4的升级,绝非简单的数字游戏,其内核深处蕴藏着诸多引人注目的技术看点,每一处都可能孕育着AI应用的新范式。首先,其核心的“双模”思考机制,让Opus 4和Sonnet 4都成了能屈能伸的“混合型”选手。

它们既能对你的指令做出迅雷不及掩耳的近乎即时响应,满足你对效率的极致追求;也能在遭遇那些盘根错节的复杂问题时,沉稳地切换到“扩展思维”模式,投入更多算力进行更深层次、更耗时间的细致推理,力求挖掘出最周全、最精准的解决方案。

更进一步地,Opus 4新增的“外挂”记忆功能堪称一大亮点,被形象地称为“记忆文件”。只要你授予相应权限,当Opus 4处理本地文件时,就能智能地从中提取关键信息,并妥善存入这些专属的“记忆文件”中。

这意味着,它再也不怕在冗长的对话或持续数天的项目中“聊着聊着就断片儿”,对于那些需要长期追踪进度、保持上下文连贯性的复杂应用场景,这简直是革命性的福音!

不仅如此,新模型还装备了强大的工具使用能力(目前尚处于Beta测试阶段),这意味着Claude 4学会了在需要时主动“调用工具”。

当它在思考棘手问题、感觉自身知识储备不足时,可以像人类专家一样,主动去调用网页搜索这类外部工具来搜集最新信息或特定数据,实现边思考边查资料的动态学习过程,甚至还能同时调度和使用好几个工具协同作战,解决问题的能力边界得到了极大拓展!

当然,用户体验的提升也离不开指令理解能力的MAX化,新模型现在能更懂你的心思了,那些曾经可能让AI挠头的复杂指令,如今也能被精准拿捏。而且,它们还学会了一项贴心的“思维摘要”技能:在某些极端复杂的思考过程之后,系统会调用一个相对小巧的模型,将冗长、曲折的思考链路高度浓缩成一段精华摘要,让你能一目了然地洞悉其决策逻辑。

不过,Anthropic也提到,大多数情况下,模型的思考过程都相当简练高效,直接展示也完全没问题,这个摘要功能更像是一杯小甜水。

尤其值得称道的是,新模型在执行那些需要AI自主完成的多步骤任务时,其“钻空子”或利用捷径达成目标的不良行为倾向,相较于上一代 Sonnet 3.7 大幅减少了65%,这意味着它们在工作中表现得更踏实、更可靠,也更能忠实地执行用户的意图。

两大模型各有千秋

这次发布的 Claude Opus 4 和 Claude Sonnet 4 各有侧重,如同倚天剑和屠龙刀,共同构成了 Claude 4 系列的强大战力,能够满足不同用户的精细化需求。

作为当之无愧的性能王者,Claude Opus 4就是专为啃那些最硬的骨头、攻克那些最复杂的高难度任务而生的。其编程能力直接拉满,在业界公认的SWE-bench(软件工程基准测试,得分高达72.5%)和Terminal-bench(终端操作基准测试,得分43.2%)上都取得了傲视群雄的领先成绩。

如果你需要AI深度参与到专业级编码、错综复杂的科学研究、严谨的法律文档分析或是需要极强逻辑推理的战略规划中,那么Opus 4无疑是你的不二之选。

而Claude Sonnet 4则出色地扮演了性能与效率之间的平衡大师角色。它在SWE-bench上也取得了令人瞩目的72.7%的好成绩,相较于上一代的Sonnet 3.7进步堪称巨大。它能更精准地响应你的指令,输出高质量的内容。

对于那些在日常工作中既需要AI给出专业、可靠的回答与支持,又希望兼顾响应速度和运营成本效益的用户和企业而言,Sonnet 4提供了一个极具吸引力的明智之选。

Claude Code 正式版重磅来袭

除了模型本身的惊艳升级,Anthropic这次还给全球开发者带来了一个期待已久的重磅礼物:Claude Code正式版全面上线! 这可不是一个简单的、只能帮你补全几行代码的小工具,它的目标是成为你真正的智能编程副驾驶。

Claude Code能够帮助你深入理解、轻松浏览和精准修改整个庞大的代码库,让你能把那些耗时费力的工程任务,比如修复棘手的bug、从零开始实现新功能、进行大规模的代码重构、编写全面的测试用例,甚至是跨多个文件进行复杂修改等,都放心地交给AI来高效完成。

现在,这款强大的Claude Code已经能与开发者们朝夕相处的“老朋友”——VS Code和JetBrains这些主流集成开发环境(IDE)无缝集成,直接在你的编辑器里提供智能建议和修改。Anthropic还发布了可扩展的Claude Code SDK,这意味着有能力的开发者和团队可以利用其核心智能体来构建属于自己的、定制化的AI Agent和应用程序。

Sonnet 4直接免费了

激动人心的消息是,从今天起,所有Anthropic的付费用户(涵盖Pro、Max、Team 和 Enterprise 各级套餐)都可以立即上手体验Claude Opus 4和Claude Sonnet 4这两大神器的全部威力。

当然,Anthropic也非常照顾广大开发者和普通用户,即便是免费用户,也能使用Claude Sonnet 4。

开发者社区这次更是收到了一个“大礼包”:Anthropic的API也迎来了重磅更新,一口气推出了代码执行工具、MCP连接器和文件API三大新功能,更有长达一小时的提示缓存能力作为锦上添花的特性,这些都将为开发者们构建更为强大、更为智能的AI应用注入前所未有的强劲动力。

至于大家最关心的价格嘛,Anthropic在这方面保持了一贯的透明和诚意,API定价策略与之前的系列产品保持一致,力求让更多人能用得起顶尖的AI技术:

Claude Opus 4:输入$15/百万Token,输出$75/百万Token。

Claude Sonnet 4:输入$3/百万Token,输出$15/百万Token。

AI的“科技树”一天比一天点得高,Claude 4这样的“神装”还会不断出新,总会有更好的下一个。现在Claude 4能玩24小时的宝可梦,那你们说以后AI会不会沉迷游戏啊(doge)。

热门文章