更好的炒股配资平台李飞飞团队456页报告：中美AI模型性能近乎持平系统推理成本降至280分之一

发布日期：2025-04-12 22:55 点击次数：162

4月8日更好的炒股配资平台，由李飞飞联合领导的斯坦福大学以人为本人工智能研究所（Stanford HAI）发布了《2025年人工智能指数报告》（Artificial Intelligence Index Report 2025）。这份长达456页的报告，深入剖析了2024年全球人工智能行业的发展态势，揭示了12大关键趋势。图片来源：斯坦福大学以人为本人工智能研究所官网报告认为，AI正变得更高效、更普惠。随着小模型性能飙升，达到GPT-3.5水平的系统推理成本在过去两年间下降到了原来的280

　　4月8日更好的炒股配资平台，由李飞飞联合领导的斯坦福大学以人为本人工智能研究所（Stanford HAI）发布了《2025年人工智能指数报告》（Artificial Intelligence Index Report 2025）。这份长达456页的报告，深入剖析了2024年全球人工智能行业的发展态势，揭示了12大关键趋势。
图片来源：斯坦福大学以人为本人工智能研究所官网
　　报告认为，AI正变得更高效、更普惠。随着小模型性能飙升，达到GPT-3.5水平的系统推理成本在过去两年间下降到了原来的280分之一。
　　报告还指出，中国高性能AI模型的数量和质量不断提升，中美AI模型性能近乎持平。与此同时，中国在AI领域论文数量和专利数量上保持领先地位。
　　AI性能飙升，表现逐渐接近人类
　　2023年，研究人员推出了MMMU、GPQA和SWE-bench等颇具挑战性的新基准测试，用于测试AI系统的极限。
　　测试发现，仅仅一年后，AI系统的性能便实现大幅跃升——在MMMU测试中得分提升18.8个百分点；在GPQA测试中提高48.9个百分点；SWE-bench测试里更是提升了67.3个百分点。
　　从整体趋势来看，AI在各大领域的表现逐渐接近人类，甚至在某些情形下，AI智能体能在限时编程任务中超越人类。
在部分评测指标上，AI技术性能表现与人类水平的对比图片来源：《2025年人工智能指数报告》
　　然而，复杂的推理对于AI模型而言，仍然是一个挑战。
　　在处理类似国际数学奥林匹克竞赛题目这类任务时，AI模型表现出色。但面对诸如PlanBench等复杂推理基准测试时，却仍显得吃力。即使面对那些已知存在正解的逻辑任务，AI也经常无法可靠地解决逻辑任务，这极大限制了AI在对精度要求极高的高风险行业中的应用。
各大模型在PlanBench基准测试上的正确率图片来源：《2025年人工智能指数报告》
　　全球AI投资飙升
　　2024年，生成式AI在全球范围内吸引了339亿美元的私人投资，与2023年相比，增长幅度达到18.7%。
　　与此同时，企业对AI的采用率显著提升，从2023年的55%上升至2024年的78%。越来越多的研究结果表明，AI不仅能够有效提升生产力，在多数情况下，还能缩小劳动力的技能差距。
　　值得关注的是，将生成式AI应用于至少一项业务职能的企业数量出现了激增。2023年，这一比例仅为33%，而到了2024年，该比例跃升至71%，增幅超过一倍。
2017年至2024年，将AI应用于至少一项业务职能企业的比例不断上升图片来源：《2025年人工智能指数报告》
　　中美模型性能近乎持平
　　数据显示，美国在AI模型的数量上处于领先地位。2024年，总部位于美国的机构拥有40个知名AI模型，超过中国（15个）和法国（3个）。
图片来源：《2025年人工智能指数报告》
　　不过，报告强调，中美模型之间的性能差距正在迅速缩小。以MMLU和HumanEval等主流基准测试结果来看，2023年，中美顶尖模型之间的性能差距还在两位数，然而到了2024年，这一差距已大幅缩小，几乎处于同一水平。
　　与此同时，中国在AI领域论文数量和专利数量上依旧保持领先地位。
　　小模型性能飙升，推理成本降至280分之一
　　报告指出，AI正变得更加高效、经济实惠和易于获取。
　　随着小模型性能提升，达到GPT-3.5水平的系统推理成本在过去两年间下降至280分之一。在硬件层面，成本每年下降30%，而能源效率每年提高40%。
　　2022年，在MMLU基准测试中，得分超60%的最小模型是PaLM，参数量为5400亿。到了2024年，微软Phi-3-mini仅用38亿参数，就取得了同样的实力。这代表，两年多的时间里模型参数减少了142倍。
　　此外，开源模型正在迎头赶上，与闭源模型的差距逐渐缩小。2023年，开源模型明显落后于闭源模型。而到2024年，这一差距几乎消失。2024年1月初，顶尖闭源模型在大模型竞技场排行榜上以8.0%的成绩超过了顶尖开源模型。而到2025年2月，这一差距已缩小至1.7%。
2022年至2024年，在MMLU上得分高于60%的小模型图片来源：《2025年人工智能指数报告》
　　中国对AI的态度最乐观
　　在对AI的态度方面，中国是全球主要国家和地区中最乐观的。
　　报告显示，2024年中国有83%的人认为AI产品和服务利大于弊，排在后面的是印度尼西亚（80%）和泰国（77%）。相比之下，美国（39%）、加拿大（40%）等的乐观情绪远低于中国。
2022年至2024年，各国认为“使用AI产品和服务利大于弊”的比例图片来源：《2025年人工智能指数报告》
　　不过，从整体趋势而言，各国对于AI的乐观情绪正逐渐升温，特别是在一些曾对AI最持怀疑态度的国家。数据显示，自2022年起，美国认为“使用AI产品和服务利大于弊”的比例提升了4%，加拿大增长了8%，法国增长了10%。
三分之二受访者称AI将在未来3至5年对日常生活产生显著影响
　　从医疗保健到交通运输，AI正迅速从实验室走向日常生活。
　　2023年，美国食品药品监督管理局（FDA）批准了223款AI医疗设备，而2015年仅有6款。
1995年至2023年FDA批准的AI医疗设备数量图片来源：《2025年人工智能指数报告》
　　道路交通同样因AI技术发生着日新月异的变化。自动驾驶汽车不再只是实验，而是逐步驶入现实生活。
　　美国最大的运营商之一Waymo每周提供超过15万次自动驾驶服务，而百度旗下的“萝卜快跑”（Apollo Go）无人驾驶出租车队已在中国多个城市正式投入运营。
　　此外，人们对AI融入日常生活的期待与认可度正在上升。据统计更好的炒股配资平台，全球范围内，有多达三分之二的受访者认为，在未来三到五年内，AI产品及服务将对日常生活产生显著影响。

更好的炒股配资平台李飞飞团队456页报告：中美AI模型性能近乎持平系统推理成本降至280分之一

推荐资讯

友情链接：

更好的炒股配资平台 李飞飞团队456页报告：中美AI模型性能近乎持平 系统推理成本降至280分之一

推荐资讯

友情链接：

更好的炒股配资平台李飞飞团队456页报告：中美AI模型性能近乎持平系统推理成本降至280分之一