• 网上实盘配资网_十大正规实盘配资平台_可查的实盘配资公司

更好的炒股配资平台 李飞飞团队456页报告:中美AI模型性能近乎持平 系统推理成本降至280分之一

发布日期:2025-04-12 22:55    点击次数:152

4月8日更好的炒股配资平台,由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了《2025年人工智能指数报告》(Artificial Intelligence Index Report 2025)。这份长达456页的报告,深入剖析了2024年全球人工智能行业的发展态势,揭示了12大关键趋势。 图片来源:斯坦福大学以人为本人工智能研究所官网 报告认为,AI正变得更高效、更普惠。随着小模型性能飙升,达到GPT-3.5水平的系统推理成本在过去两年间下降到了原来的280

  • 更好的炒股配资平台 李飞飞团队456页报告:中美AI模型性能近乎持平 系统推理成本降至280分之一

      4月8日更好的炒股配资平台,由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了《2025年人工智能指数报告》(Artificial Intelligence Index Report 2025)。这份长达456页的报告,深入剖析了2024年全球人工智能行业的发展态势,揭示了12大关键趋势。

    CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuJyQIfZqLibhibIicPQ2O4YiaR5P372yfOsNBlxqaCjw1mSMwTaN2j8yvTg.png

    图片来源:斯坦福大学以人为本人工智能研究所官网

      报告认为,AI正变得更高效、更普惠。随着小模型性能飙升,达到GPT-3.5水平的系统推理成本在过去两年间下降到了原来的280分之一。

      报告还指出,中国高性能AI模型的数量和质量不断提升,中美AI模型性能近乎持平。与此同时,中国在AI领域论文数量和专利数量上保持领先地位。

      AI性能飙升,表现逐渐接近人类

      2023年,研究人员推出了MMMU、GPQA和SWE-bench等颇具挑战性的新基准测试,用于测试AI系统的极限。

      测试发现,仅仅一年后,AI系统的性能便实现大幅跃升——在MMMU测试中得分提升18.8个百分点;在GPQA测试中提高48.9个百分点;SWE-bench测试里更是提升了67.3个百分点。

      从整体趋势来看,AI在各大领域的表现逐渐接近人类,甚至在某些情形下,AI智能体能在限时编程任务中超越人类。

    CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuDnjWlmF4HxkIibrUvNcW5U2NvzSrOqdrn3E3HAjyic5Y24EibkUoGPujQ.png

    在部分评测指标上,AI技术性能表现与人类水平的对比图片来源:《2025年人工智能指数报告》

      然而,复杂的推理对于AI模型而言,仍然是一个挑战。

      在处理类似国际数学奥林匹克竞赛题目这类任务时,AI模型表现出色。但面对诸如PlanBench等复杂推理基准测试时,却仍显得吃力。即使面对那些已知存在正解的逻辑任务,AI也经常无法可靠地解决逻辑任务,这极大限制了AI在对精度要求极高的高风险行业中的应用。

    CFF20LXzkOyN00ZI2y8fDJNkp68HnqTu83W711jRLvbuKGh5bYnhgsllIClDALrZMiaxfVx3SSXN1aScqUz1mTA.png

    各大模型在PlanBench基准测试上的正确率图片来源:《2025年人工智能指数报告》

      全球AI投资飙升

      2024年,生成式AI在全球范围内吸引了339亿美元的私人投资,与2023年相比,增长幅度达到18.7%。

      与此同时,企业对AI的采用率显著提升,从2023年的55%上升至2024年的78%。越来越多的研究结果表明,AI不仅能够有效提升生产力,在多数情况下,还能缩小劳动力的技能差距。

      值得关注的是,将生成式AI应用于至少一项业务职能的企业数量出现了激增。2023年,这一比例仅为33%,而到了2024年,该比例跃升至71%,增幅超过一倍。

    CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuRN92iagqoRF88QZGA82iaVv5UOgc6icAtBLbia9RicUYGMkt0GevcITFgjw.png

    2017年至2024年,将AI应用于至少一项业务职能企业的比例不断上升图片来源:《2025年人工智能指数报告》

      中美模型性能近乎持平

      数据显示,美国在AI模型的数量上处于领先地位。2024年,总部位于美国的机构拥有40个知名AI模型,超过中国(15个)和法国(3个)。

    CFF20LXzkOyN00ZI2y8fDJNkp68HnqTucVy6U9cqNIZRt46DnQicNbUJbUPC1jxCrB1KiaiaTRGPU496ka2sibvfJg.png

    图片来源:《2025年人工智能指数报告》

      不过,报告强调,中美模型之间的性能差距正在迅速缩小。以MMLU和HumanEval等主流基准测试结果来看,2023年,中美顶尖模型之间的性能差距还在两位数,然而到了2024年,这一差距已大幅缩小,几乎处于同一水平。

      与此同时,中国在AI领域论文数量和专利数量上依旧保持领先地位。

      小模型性能飙升,推理成本降至280分之一

      报告指出,AI正变得更加高效、经济实惠和易于获取。

      随着小模型性能提升,达到GPT-3.5水平的系统推理成本在过去两年间下降至280分之一。在硬件层面,成本每年下降30%,而能源效率每年提高40%。

      2022年,在MMLU基准测试中,得分超60%的最小模型是PaLM,参数量为5400亿。到了2024年,微软Phi-3-mini仅用38亿参数,就取得了同样的实力。这代表,两年多的时间里模型参数减少了142倍。

      此外,开源模型正在迎头赶上,与闭源模型的差距逐渐缩小。2023年,开源模型明显落后于闭源模型。而到2024年,这一差距几乎消失。2024年1月初,顶尖闭源模型在大模型竞技场排行榜上以8.0%的成绩超过了顶尖开源模型。而到2025年2月,这一差距已缩小至1.7%。

    CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuxjufQpjqtp8Bd1IMiaictIYic2YeyO7qRHjBPHorGOdib937IbK2e9FzHA.png

    2022年至2024年,在MMLU上得分高于60%的小模型图片来源:《2025年人工智能指数报告》

      中国对AI的态度最乐观

      在对AI的态度方面,中国是全球主要国家和地区中最乐观的。

      报告显示,2024年中国有83%的人认为AI产品和服务利大于弊,排在后面的是印度尼西亚(80%)和泰国(77%)。相比之下,美国(39%)、加拿大(40%)等的乐观情绪远低于中国。

    CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuYyt6yV7ibKoM2CnMAP8cdncPGqURa5zrbeh1DBgibQL9QrcEsWoL5zdw.png

    2022年至2024年,各国认为“使用AI产品和服务利大于弊”的比例图片来源:《2025年人工智能指数报告》

      不过,从整体趋势而言,各国对于AI的乐观情绪正逐渐升温,特别是在一些曾对AI最持怀疑态度的国家。数据显示,自2022年起,美国认为“使用AI产品和服务利大于弊”的比例提升了4%,加拿大增长了8%,法国增长了10%。

    三分之二受访者称AI将在未来3至5年对日常生活产生显著影响

      从医疗保健到交通运输,AI正迅速从实验室走向日常生活。

      2023年,美国食品药品监督管理局(FDA)批准了223款AI医疗设备,而2015年仅有6款。

    CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuW5I80fjWndEcdyE8MqejuZtWicr8IOvuWD7ZIeWKBFezGL0sknNVUIg.png

    1995年至2023年FDA批准的AI医疗设备数量图片来源:《2025年人工智能指数报告》

      道路交通同样因AI技术发生着日新月异的变化。自动驾驶汽车不再只是实验,而是逐步驶入现实生活。

      美国最大的运营商之一Waymo每周提供超过15万次自动驾驶服务,而百度旗下的“萝卜快跑”(Apollo Go)无人驾驶出租车队已在中国多个城市正式投入运营。

      此外,人们对AI融入日常生活的期待与认可度正在上升。据统计更好的炒股配资平台,全球范围内,有多达三分之二的受访者认为,在未来三到五年内,AI产品及服务将对日常生活产生显著影响。



推荐资讯

  • 股市怎么加杠杆? 法本信息实控人方拟减持 3个半月前刚完成3.2亿元套现

    股市怎么加杠杆? 中国经济网北京7月28日讯 法本信息(300925.SZ)近日发布公告称,公司于近日收到新余市嘉嘉通创新投资合伙企业(有限合伙)(以下简称“嘉嘉通”)、新余市耕读邦创新投资合伙企业(有限合伙)(以下简称“耕读邦”)、新余市木加林创新投资合伙企业(有限合伙)(以下简称“木加林”)出具的《关于股份减持计划的告知函》。 嘉嘉通、耕读邦、木加林计划...

  • 哪个股票能杠杆 “北京未来企业家实训营”开营 瞄准未来产业赛道

    中新网北京7月25日电 “北京未来企业家实训营”启动仪式25日在北京大学(全球大学生创新创业中心)举行。本次实训营为期3个月哪个股票能杠杆,吸引了100余名民营企业家参与。 在首都大力发展新质生产力的蓬勃浪潮中,北京丰台勇立潮头、积极作为。“北京未来企业家实训营”作为“丰台·学子回家”的重磅活动,以“百人·一季”“三平台·五步走”培训体系为核心,通过搭建大咖...

  • 杠杆股市 锂矿概念爆发,永杉锂业、天齐锂业涨停,赣锋锂业等走高

    锂矿概念24日强势上扬杠杆股市,截至发稿,盛新锂能、西藏矿业、永杉锂业、天齐锂业涨停,华友钴业涨近9%,中矿资源、赣锋锂业涨超7%。 消息面上,据报道,近期江西宜春市自然资源局下发关于编制储量核实报告的通知,要求8宗涉锂资源矿权按要求及时编制矿种变更储量核实报告,科学合理确定开采主矿种。7月17日,藏格矿业公告收到《关于责令立即停止锂资源开发利用活动的通知》...

  • 重庆股票配资 你了解“感觉统合”吗?为什么要进行感统训练?深圳哪些医院可以做感统干预_孩子_触觉_能力

    感觉统合训练(简称“感统训练”)是一种通过科学设计的游戏与活动 ,帮助儿童大脑有效整合来自身体和环境的感官信息(如触觉、听觉、视觉、前庭觉、本体觉等)重庆股票配资,从而改善行为、学习能力和情绪管理的干预方法。 1、感统训练的核心目标 (1)提升大脑对感觉信息的处理能力:帮助孩子正确接收、解读和回应来自身体和外界的信息。 (2)改善行为与学习能力:增强注意力、...

  • 配资天眼查门户网站 2025年暑期档单日大盘票房再破2亿元

    (原标题:2025年暑期档单日大盘票房再破2亿元)配资天眼查门户网站 人民财讯7月19日电,据灯塔专业版,截至21时31分,今日大盘票房突破2.03亿元配资天眼查门户网站,超过6月1日,刷新今年暑期档(6月—8月)单日票房最高成绩,同时也是今年暑期档第二次单日大盘票房突破2亿元。...