登录
首页 > 文章列表 > 2025年AI指数报告:斯坦福HAI揭示AI最新进展

更新时间:2025-08-26 16:57:02 编辑:丁丁小编
来源:点击查看

简介

斯坦福 HAI 最近发布了一份长达 456 页的《2025 年人工智能指数报告》,这份报告详细展示了人工智能领域的最新进展和趋势。以下是报告中提到的几点关键内容:

人工智能的强大表现

人工智能在新基准测试 MMMU、GPQA 和 SWE-bench 中的表现令人瞩目,得分分别提高了 18.8%、48.9% 和 67.3%。不仅如此,人工智能系统在生成高质量视频方面取得了重大进展,有时甚至在限时编程任务中超过了人类。MMMU 是一个专为大学水平的多学科多模态理解和推理设计的基准,旨在评估基础模型的多模态理解能力。GPQA 则是一个由不同领域专家编写的具有挑战性的多项选择题数据集,难度极高,即使是博士级别的专家,准确率也只有 65%。而 SWE-bench 则用于评估大型语言模型在处理真实世界软件问题上的表现。

人工智能的强大表现图表

人工智能的效率和经济性

参数更少的小型人工智能模型的能力不断增强,在短短两年内,参数数量减少了约 100 倍,但在 MMLU 测试中的得分仍超过 60%。此外,开源模型与闭源模型之间的性能差距也在缩小,有些基准测试中的差距从 8% 降至仅 1.7%。从 2022 年 11 月到 2024 年 10 月,达到 GPT-3.5 水平的系统的推理成本下降了 280 倍以上。硬件成本每年下降 30%,能源效率每年提高 40%。像 DeepSeek 这样的稀疏模型的开发,使得整个系统更加高效,因为只有相关的参数会被激活来回答用户的查询。随着小型但能力强大的 AI 模型不断涌现,AI 模型训练的要求降低,成本效益高的分布式训练有望在未来十年成为主流,目前已有一些顶尖项目在不同的理论框架下开展相关研究。

人工智能效率和经济性图表

人工智能融入日常生活

人工智能正在日益融入我们的日常生活中。2023 年,美国食品药品监督管理局(FDA)批准了 223 款人工智能辅助医疗设备,而 2015 年这一数字仅为 6 款。在道路上,自动驾驶汽车不再是实验品,Waymo 每周提供超过 15 万次自动驾驶服务,而百度的 Apollo Go 无人驾驶出租车车队也在中国多个城市投入运营。

人工智能融入日常生活图表

企业在人工智能领域的投资

企业在人工智能领域的投资大幅增加,推动了创纪录的投资和应用。2024 年,78% 的组织正在使用人工智能,而前一年这一比例为 55%。越来越多的研究证实,人工智能能够提高生产力,并有助于缩小整个劳动力队伍中的技能差距。然而,随着人工智能导致客户期望值呈指数级增长,现有解决方案会在一夜之间显得过时,从而使现有企业失去适应的机会,产品市场匹配崩溃的情况会更频繁地发生。

全球对人工智能的乐观情绪

尽管全球对人工智能的乐观情绪上升,但亚洲人对人工智能更为乐观。在中国、印度尼西亚和泰国等国家,大多数人认为人工智能产品和服务利大于弊。而在加拿大、美国和荷兰等地,乐观情绪则相对较低。不过,自 2022 年以来,一些此前持怀疑态度的国家的乐观情绪显著增长,包括德国、法国、加拿大、英国和美国。

全球对人工智能的乐观情绪图表

人工智能在科研中的影响力

人工智能在科研中的影响力日益增强,已成为推动科学进步的重要驱动力。这在重大科学奖项中有所体现:两项诺贝尔奖分别授予了在深度学习(物理学)和将其应用于蛋白质折叠(化学)方面做出贡献的研究,而图灵奖则表彰了在强化学习方面的开创性贡献。人工智能正以指数级、出乎意料的速度飞速发展,这对大多数人来说意义非凡。因此,人工智能安全也变得越来越重要。虽然人工智能让伪造变得更容易,但密码学则让伪造变得更加困难。期待着那些能够利用区块链的原生属性(可验证性和透明性)来构建这一领域实用解决方案的项目。

热门文章