此份报告虽然调研的是企业生成式 AI 发展现状在美国市场的现状,但在基础设施层、应用层以及行业采用AI的原因与现状,也与国内现状与偏好相似,推荐阅读。
此次内容有3种阅读形式:视频(音频)版本、英文报告版本链接、中文翻译版本见下方。
▶ 报告出处:Menlo Ventures
▶ 原文链接:https://menlovc.com/perspective/2025-the-state-of-generative-ai-in-the-enterprise/
AI 到底是“大繁荣”还是“大泡沫”?
尽管人们普遍担心投资过热,但AI在企业中的普及速度,在现代软件历史上是绝无仅有的。
在将近三年的时间里,人工智能领域一直享有坚定的市场信心和创纪录的资金流入。这股浪潮让英伟达成为了全球市值最高的公司。那些开发基础大模型的公司已经承诺,将在人工智能基础设施上投入近1万亿美元。风险投资也重新回升至历史高点,且近一半的资金都集中在少数几家顶尖的人工智能实验室中。
然而,这种狂热情绪后来达到了顶峰。麻省理工学院的一项研究声称,95%的生成式人工智能项目都以失败告终。这一消息在今年夏天引发了市场动荡,也暴露出在巨额资本支出的压力下,市场情绪是多么容易发生转变。关于“泡沫”的流言也随之变得震耳欲聋。
考虑到投入资金的巨大规模,这些担忧并非没有道理。但从需求端来看,情况却大不相同:我们最新的市场数据表明,人工智能已被广泛采用,不仅带来了真实的收入,还实现了大规模的生产力提升。这预示着,这并非一场虚幻的泡沫,而是真正的产业繁荣。
自2023年以来,企业级人工智能的市场规模已从17亿美元飙升至37亿美元。目前,它已占据全球SaaS市场6%的份额,其增长速度超过了历史上任何一类软件。
在Menlo Ventures发布的第三份年度《企业生成式人工智能现状报告》中,我们对约500名美国企业决策者进行了调研。我们将这些见解与生成式人工智能市场的“自下而上”模型相结合,研究范围涵盖了模型接口(API)、基础设施以及各类应用软件。自2023年起,我们的团队持续追踪人工智能的演进历程——从早期的尝试性实验,到如今在企业中的广泛部署。这使我们能够从多年期的视角,审视这场变革的演进速度与覆盖规模。
资金流向:企业把钱花在了哪里?
我们的数据显示,2025年各企业在生成式人工智能上的支出达到了370亿美元,相比2024年的115亿美元增长了3.2倍。其中最大的一笔支出,共计190亿美元,投向了“应用层”,即那些直接面向用户、利用底层人工智能模型开发的软件产品。在ChatGPT发布仅三年的时间里,这一领域就已占据了整个软件市场超过6%的份额。
这种增长已远超少数几个AI聊天应用的范围,而是触及了经济领域的每一个角落。根据我们的统计,目前至少有10款产品的年度经常性收入(ARR)超过了10亿美元,另有50款产品超过了1亿美元。领跑市场的是提供底层技术支持的接口商(如Anthropic、OpenAI和谷歌),但资金正越来越多地流向编程、销售、客户服务、人力资源等部门级解决方案,以及从医疗、法律到创作者经济等各个垂直行业。
2025年,企业在人工智能领域的支出中,有一半以上流向了人工智能应用。这表明,现代企业正优先考虑获得眼前的生产力提升,而非长期的基础设施投资。
AI 如何深入企业:通往生产级 AI 之路
经过三年的摸索,企业应用人工智能的路径已初具雏形。早期的先行者并没有现成的经验可循,而现在,已经出现了一些明显区别于传统SaaS的模式。企业更倾向于直接购买成熟的产品而非自己动手开发;同时,他们的购买意愿也更加强烈。此外,人工智能正以企业软件领域罕见的规模,通过“产品驱动增长”的模式被广泛采用。
企业倾向于“买”而不是“造”
曾几何时,主流观点认为企业会自己动手开发大部分人工智能解决方案。比如,彭博社在2022年为金融行业训练了 BloombergGPT,沃尔玛在2024年为零售业开发了 Wallaby。当时各团队都信心满满,认为只要有足够的数据、行业经验和技术框架,在公司内部就能搞定一切。
然而,数据记录了这种信心的转变:2024年,仍有47%的人工智能方案是企业自建的,53%是买来的。而到了今天,76%的人工智能应用场景都是通过购买实现的,而非内部自建。 尽管企业仍在持续投入资金进行内部开发,但现成的 AI 解决方案由于能更快投入生产并产生即时价值,正逐渐占据主导地位,与此同时,企业的技术架构也正趋于成熟。
去年,各家企业在“自建”还是“购买”人工智能系统上还犹豫不决,各占一半。而到了今天,随着企业内部自建系统的逐步成熟以及对复杂性的认知增加,越来越多的企业选择直接将现成的 AI 解决方案投入到实际生产中使用。
AI 客户的转化率更高
企业用户在对待人工智能时,表现出了极高的购买意愿。我们发现,一旦一家机构决定开始考察某项 AI 解决方案,其最终成交并投入使用的概率几乎是传统软件的两倍:47% 的 AI 项目能最终落地生产,而传统软件SaaS这一比例仅为 25%。 这种极高的转化率反映了企业用户坚定的决心,以及 AI 带来的立竿见影的价值。
我们的调研数据还显示,大多数机构都会列出一长串潜在的 AI 应用清单——通常有 10 个甚至更多——但他们最终会把精力集中在那些能短期内提高生产力或节省成本的项目上。虽然企业目前发现的“对内使用场景”(占 59%)略多于“对外客户场景”(占 41%),但这两类项目的落地速度几乎一样快。这说明,投资于内部运营的 AI 和投资于客户创新的 AI,都能同样稳健地带来回报。
AI用户的成交转化率为 47%,而传统SaaS仅为 25%。这表明 AI 带来的即时价值已经足够巨大,甚至足以让企业“抄近路”,绕过标准的采购审批流程。
PLG模式:个人用户驱动AI普及的速度是传统软件的4倍
在公司统一的采购渠道之外,AI解决方案正越来越多地通过基层个人用户而非公司高管进入企业。我们发现,在所有企业级 AI 应用的支出中,有 27% 是通过“产品驱动增长”(PLG)模式实现的,这一比例几乎是传统软件(7%)的 4 倍。
而这一数字仍属保守估计。若计入“影子AI采用”——即员工使用个人信用卡购买ChatGPT Plus等工具,其中约27%的使用与工作相关——由PLG模式推动的工具,可能占企业AI应用支出的近40%。
在人工智能领域,“产品驱动增长”(PLG)模式触达并转化企业用户的速度,远比传统软件要快。在任何正式的签约流程开始之前,真实的日常使用就已经证明了 AI 的价值。
在人工智能领域,这种“产品驱动增长”的模式进入大型企业的速度更快,而且比以前的传统软件走得更远,比如 Cursor 这家公司,连一个专门跑大客户的业务员都没招,一年的收入就实打实地做到了 2 亿美元;还有一家叫n8n 的公司,它是先让技术圈里的人免费用,等一家公司里已经有几百个员工天天都在用它的软件干活了,才不慌不忙地去跟人家老板签正式合同收钱;另外像 ElevenLabs、Gamma 和 Wispr Flow 这些现在挺出名的公司,也全是靠着这种“让好产品自己说话”的法子,轻轻松松就把买卖做大了。
程序员和技术团队特别吃这一套。他们往往是先自己发现这些好用的“小工具”,在日常干活中觉得真省力气,于是形成了从下往上的呼声,最后逼着公司不得不补签一份大合同。Lovable、OpenRouter 和 fal 也是如此,当产品经理和工程师们已经离不开这些工具时,非正式的小打小闹就变成了正式的企业合作协议。
创业公司 vs.行业巨头:新兴势力在AI应用领域反超
在人工智能的应用软件领域,初创公司已经取得了决定性的领先优势。根据我们的数据显示,今年初创公司每赚到 2 美元,那些行业老牌巨头才只能赚到 1 美元。目前,初创公司已经占据了 63% 的市场份额,而去年这个数字只有 36%,去年还是老牌巨头占大头。
按理说,这种事儿本来不该发生。那些老牌巨头拥有稳固的销售渠道、深厚的数据积累、长期的客户关系、规模庞大的销售团队,还有数不清的账面资金。然而在实际竞争中,那些“打娘胎里出来就搞 AI”的初创公司,在一些增长最快的软件领域,表现得比那些庞然大物般的对手要出色得多。
产品与工程领域(初创公司占有71%的份额): 代码生成(指让 AI 帮着写程序)是初创公司反败为胜的典型例子。原本,微软旗下的 GitHub Copilot 是这个领域的先行者,占据了所有的先天优势。然而,一家名叫 Cursor 的初创小公司却抢走了大量的市场份额。原因是 Cursor 动作更快、功能更好——它抢在微软之前,实现了让 AI 理解整个工程代码、同时修改多个文件、让用户更方便地确认修改内容以及直接用大白话下达指令。更重要的是,Cursor 的态度很开放,不选边站队,这让程序员们能在第一时间用上最新、最厉害的 AI 模型,比如 Claude 3.5),而不必像用微软产品那样,被局限在微软指定的合作伙伴里。这种“快鱼吃慢鱼”的产品速度形成了一个良性循环:Cursor 先赢得了底层程序员的心,然后这些程序员就把这款工具带进了公司,变成了大生意。
销售领域(初创公司占据了78%的市场份额):像 Clay 和 Actively 这样打娘胎里就搞 AI 的公司,之所以能赢,是因为他们专攻那些老牌软件。这些活儿包括搜集客户资料、写那种掏心窝子的个性化邮件,还有从网页、社交媒体和电子邮件里打听消息,而这些乱糟糟的信息是老牌系统根本处理不了的。通过把这些系统之外的活儿全给包圆了,这些 AI 小公司成了销售员们每天真正打交道的人,短时间内就让那些老旧的记录系统靠边站了,长期来看,他们甚至想取代那些老字号,自己当老大。
财务与运营领域(初创公司占据了91%的市场份额):在像财务这样规矩森严、出不得半点差错的领域,像 Intuit、QuickBooks 这样的老牌软件巨头,因为对准确性的要求极高,反而束缚了手脚,导致他们很难快速推出真正的人工智能产品。虽然目前这个领域的总投入还不算大,但老牌巨头的这种“迟钝”给小公司留出了巨大的空间。像 Rillet、Campfire 和 Numeric 这样的创业公司趁虚而入,直接开发了“以人工智能为核心”的新型管理系统,能实现实时自动化和智能化处理。他们能赢,就是因为老牌公司转身太慢,拿不出真正像样的下一代产品。
下面的图表显示了这种竞争态势在企业各个部门之间的差异,每个部门都有自己专门的工具。那些每天要处理零散、繁重数据的部门,因为这些活儿特别适合让机器代劳,所以他们成了采用人工智能的领头羊。而在那些对“稳当”要求极高、需要跟旧系统深度捆绑、且各部门协作极其复杂的领域,老牌巨头的地位依然稳固,因为在这些地方,系统的可靠性比新技术的快速迭代更重要。
初创公司在那些需要脑筋灵活、求新求变的部门,比如市场调研、销售、营销和产品部门如鱼得水;而老牌巨头则在技术基建和数据科学这些地方稳坐泰山,因为在这些领域,系统的稳当和各个部件之间的严丝合缝,比速度更重要。
当我们顺着产业链往下看,情况就变得不一样了。在基础设施层,局势更加复杂。我们的数据显示,老牌巨头依然占据着 56% 的市场份额,因为许多开发 AI 应用的人,依然习惯在那些他们信任了多年的数据平台上进行构建。虽然像 Temporal、Supabase、Neon 和 Pinecone 这样打娘胎里就搞 AI 基础建设的新公司增长势头惊人,但像 Databricks、Snowflake、MongoDB 和 Datadog 这样的老牌巨头也同样享受到了强劲的增长反弹——因为哪怕是那些最新的 AI 应用开发者,在管理数据、编排流程和监控运行状况时,首选的依然是这些已经成名多年的老牌平台。
在人工智能应用领域,初创公司占据了统治地位,他们每赚 2 美元,老牌巨头才赚 1 美元;然而,在企业的基础设施支出方面,钱依然更倾向于流向那些底蕴深厚的老牌巨头。
AI应用软件:一个190亿美元的大市场
2025 年,人工智能应用层共吸纳了 190 亿美元的资金,占到了生成式 AI 总支出的一半以上。这些钱主要花在了以下三个领域:
部门级 AI(73 亿美元): 专门为特定的工作岗位设计的工具,比如专门帮程序员写代码的,或者帮销售员找客户的。
行业级 AI(35 亿美元): 针对特定行业的工具,比如专门给医生看的医疗 AI,或者给银行用的金融 AI。
通用型 AI(84 亿美元): 这类工具不分行当,谁都能用,主要是为了帮大家伙儿提高干活效率。
部门级AI:写代码是生成式AI的第一个“杀手锏”
2025 年,各部门在 AI 上的支出达到了 73 亿美元,比去年翻了 4.1 倍。其中,“写代码”是表现最亮眼的领域,花了 40 亿美元(占了整个部门 AI 支出的 55%)。这让它成了整个 AI 应用市场里最大的一个单项分类。剩下的钱则分给了:IT 部门(10%)、市场营销(9%)、客户服务(9%)、设计(7%)以及人力资源(5%)。
编写代码已经成为部门级人工智能中脱颖而出的“爆款”应用场景。现在的投资高度集中在那些能最快看到成效的地方:产品和工程团队目前占据了绝大部分的开支。
当 AI 模型的能力达到足以产生经济价值的水平时,写代码便成为了 AI 第一个真正的“必买场景”——特别是 Anthropic 公司的 Sonnet 3.5 模型在 2024 年中旬的发布,彻底引爆了这个领域。紧接着,大规模的普及就开始了:目前有 50% 的程序员每天都在使用 AI 工具(在那些最拔尖的公司里,这个比例甚至达到了 65%)。其中,“自动补全代码”的市场规模长到了 23 亿美元,而“AI 程序员智能体”和“AI 建站工具”更是从无到有,实现了爆发式增长。由于在软件开发的整个过程中都用上了 AI,现在的技术团队反映,干活速度提高了 15% 以上。这些工具各司其职:从原型设计(Lovable)、代码重构(Open Hands)、设计转代码(Weaver)、质量保障(Meticulous)、代码评审与合并请求处理(Graphite)、站点可靠性工程(Resolve)、部署发布(Harness),AI 全都能包圆了。
写代码领域的支出从 5.5 亿美元飙升至 2025 年的 40 亿美元,这反映了 AI 能力的跨越式增长:现在的模型已经能够读懂整个工程的所有代码,并且能独立完成好几步复杂的任务。这意味着写代码的 AI 不再只是解决某个小问题的“创可贴”,而是变成了一个能全自动化干活的“全能管家”。
虽然写代码一项就占据了各部门人工智能支出的半壁江山,数额高达 40 亿美元,但这项技术也正在许多其他企业部门中迅速普及。其中,IT 运维工具的支出达到了 7 亿美元,因为技术团队开始利用 AI 来自动响应系统故障并管理基础设施;营销平台的支出达到了 6.6 亿美元,主要受 AI 生成内容和Campaign优化的驱动;客户成功工具也吸纳了 6.3 亿美元,主要用于 AI 处理工单分发、分析客户情绪以及进行主动的客户关怀。这些类别之所以受青睐,是因为它们针对的都是那些重复性极高的工作流程,用了 AI 之后,效率的提升是立竿见影且能通过数据衡量的。下面的市场地图展示了在这共计 73 亿美元的部门级 AI 投资中,都有哪些厉害的公司脱颖而出,瓜分了这一市场。
在 2025 年,针对各类具体职能的 AI 初创公司正在各个岗位领域迅速崛起。在总额高达 73 亿美元的部门级 AI 支出中,这些初创公司已经抢占了相当可观的市场份额。
垂直AI:医疗领域一马当先
2025 年,垂直领域AI共吸纳了 35 亿美元的资金,几乎是 2024 年的12 亿美元的三倍。如果按行业细分来看,光是医疗行业就占了整个垂直AI 支出的近一半——大约 15 亿美元。这个数字不仅比去年的 4.5 亿美元翻了三倍还多,甚至比排在它后面的四个行业加起来的开销还要大。
今年,各垂直行业的 AI 投资总额达到了 35 亿美元,几乎是去年的三倍。其中,医疗行业表现最为突出,占据了 15 亿美元,不仅拿下了 43% 的市场份额,而且其一家的支出比排在它后面的四个行业加起来还要多。
医疗行业向来动作迟缓,因为它的采购流程特别长,而且到处都是条条框框的规矩。但是,在经历了多年越来越沉重的行政负担、利润被不断摊薄以及长期的人手短缺之后,医疗系统反而成了整个经济领域中对 AI 自动化需求最强烈的地方。
当前AI支出主要集中在行政及临床周边工作流,其中尤以“环境语音记录员”(ambient scribes)为引领。该记录员市场在2025年规模已达6亿美元,同比增长2.4倍,除市场领导者Nuance旗下的DAX Copilot外,还催生了两家新晋独角兽企业——Abridge与Ambience。鉴于临床医生平均每提供5小时诊疗服务,便需花费约1小时进行病历记录,而此类语音记录工具可将文书工作时间减少逾50%,从而显著减轻行政负担,使医生得以专注于其执业范围内最具价值的临床工作。
除了医疗行业,人工智能正开始渗透到经济的几乎每一个领域。在 Eve 等公司的带领下,法律 AI 已经成长为一个 6.5 亿美元的市场;创作者工具达到了 3.6 亿美元;政府部门也投入了 3.5 亿美元。在那些以前不怎么受软件公司待见的行业,AI 的普及势头反而最猛:这些领域过去全靠人工处理那些杂乱无章的活儿,原本只能指望人力服务,但现在靠生成式 AI 就能实现自动化。下面的市场地图重点展示了在这些领域打拼的公司,它们都在争夺今年企业投入到垂直 AI中的那 35 亿美元市场份额。
到 2025 年,垂直 AI已经成长为一个规模达 35 亿美元的庞大市场,投资金额是去年的三倍。这些公司充分证明了:专门为人工智能而生的软件,正像雨后春笋般涌现,开始为经济生活中的每一个行业提供服务。
通用型 AI:助手类产品的开支让智能体类产品相形见绌
通用型 AI 领域的总支出达到了 84 亿美元,这使它依然成为 AI 应用层中规模最大且增长最快的类别,规模较去年增长了 5.3 倍。其中,“AI 助手”(Copilots)以 86% 的市场份额(约 72 亿美元)占据绝对主导地位——领头的主要是企业版的 ChatGPT、办公版 Claude 以及微软的 Copilot。而像 Salesforce Agentforce、Writer 和 Glean 这样的“AI 智能体”(Agent)平台占据了 10% 的份额(约 7.5 亿美元);剩下的 5%(约 4.5 亿美元)则由 Granola 和 Fyxer 等个人办公效率工具瓜分。
虽然目前“通用型 AI 助手”(Copilots)占据主导地位,但随着“AI 智能体”(Agents)的功能变得日益强大,我们可以预见,未来的趋势将从“提供辅助”转向“全面自动化”。
AI 基础设施:180 亿美元砸向“铁锹和铲子”
我们的数据显示,2025 年人工智能的基础设施层共吸纳了 180 亿美元的资金——这占据了所有生成式 AI 支出的一半,相比 2024 年的 92 亿美元整整翻了一倍。这笔巨款主要分成了三类:
基础模型接口(125 亿美元):这是所有 AI 应用背后的“大脑”引擎,为它们提供核心智能。
模型训练基础设施(40 亿美元):这是专门给顶尖实验室和大型企业用来“教”AI 学习新本事、进行行业适配的硬件底座。
数据管理基础设施(15 亿美元): 负责数据的存储、提取和调度,像桥梁一样把大模型和企业的业务系统连接起来。
大模型市场份额:Anthropic成为企业市场新霸主
基础模型领域的格局在今年发生了决定性的转变,Anthropic出人意料地取代了 OpenAI,成为了企业市场的领导者。据我们估计,Anthropic现在占据了企业大模型支出的 40%,而这一数字在去年仅为 24%,前年更是只有 12%。与之形成鲜明对比的是,OpenAI 在企业市场的份额几乎缩水了一半,从 2023 年的 50%下降到了目前的 27%。谷歌(Google)则表现不俗,其市场份额从 2023 年的 7% 跃升至 2025 年的 21%。目前,这三家公司合计占据了企业级大模型 API 使用量的 88%,剩下的 12% 则由 Meta 的 Llama、Cohere、Mistral 以及其他一众规模较小的服务商瓜分。
通过这些多维度的视角,我们可以清晰地看到大模型生态系统是如何发生演变的:堆叠柱状图展示了市场份额变动的剧烈程度,趋势线凸显了领先服务商背后的增长势头,而编程代码的市场份额则揭示了各大厂商目前争夺竞争优势的关键阵地。
Anthropic 的崛起,主要归功于它在编程市场中那令人惊叹且持久的统治力。据估计,它目前在该市场占据了 54% 的份额,而 OpenAI 仅占 21%。就在六个月前,它的份额还是 42%,这一快速增长在很大程度上要归功于其编程工具 Claude Code 的大受欢迎。
事实上,从 2024 年 6 月发布 Claude Sonnet 3.5 开始,Anthropic 在大模型编程榜单上的冠军宝座已经坐了整整 18 个月,这在业内几乎是无与伦比的。即便当谷歌在 2025 年 11 月中旬发布 Gemini 3 Pro 时,虽然谷歌自家的报告显示它在大多数评估中都领先,但唯独在衡量编程真本事的“SWE-bench Verified”测试中,它依然输给了 Claude Sonnet 4.5。仅仅一周后,Anthropic 就发布了 Claude Opus 4.5,再次拉开了差距,刷新了代码生成的最高纪录,重新确立了其在该领域的最强地位。
开源模型:企业采用进度落后于整个生态系统
尽管今年没能跟上最前沿的研发节奏,Llama 依然是企业中应用最广泛的开源模型。但由于该模型陷入了停滞——包括自 2025 年 4 月发布 Llama 4 以来就再没有重大更新——这导致开源模型在企业市场的整体份额从去年的 19% 下降到了如今的 11%。
企业依然保持谨慎,更倾向于选择“闭源”模型。目前,开源大模型仅占据了 11% 的市场份额,但开发人员正在不断突破边界——他们不仅在生产环境中使用中国开发的模型,还在大规模测试新的技术架构。
尽管中国的开源模型在今年取得了令人瞩目的进步,并且在初创公司中越来越受欢迎,但大型企业对其仍保持着极度审慎的态度。总的来看,中国模型仅占大模型API总使用量的 1%(约占企业开源模型使用量的 10%)。
在大型企业之外,AI 的采用情况则截然不同。vLLM 和 OpenRouter,这两个深受初创公司和独立开发者青睐的平台数据显示,通义千问(Qwen)、DeepSeek(V3、R1)、月之暗面、MiniMax 以及智谱 AI 的 GLM 正在迅速普及。不过,DeepSeek 的使用量在 R1 发布初期经历了一波猛增后,目前已经趋于平稳。
体量较小的模型通义千问3和 GLM 特别受欢迎,因为它们能够以较小的规模展现出足以媲美超大型模型的竞争性能。例如,Airbnb在其面向用户的 AI 功能中大量使用了千问;而 Cursor 则将该模型作为其内部模型开发的开源基座。
开源大模型Tokens的使用分布持续演变,在过去的一年中,中国模型在开发者群体中的认可度和使用量有了显著增长。
AI 基础设施:现代AI技术栈仍处于开发阶段
尽管大家都在大谈特谈“智能体”,但实际投入使用的技术架构却简单得令人惊讶:仅有 16% 的企业部署和 27% 的初创公司部署属于真正的“智能体”——即那种大模型能够自主规划并执行行动、观察反馈并调整自身行为的系统。相比之下,大多数系统仍是围绕着单一模型调用的固定顺序或基于路由的工作流构建的。这种技术上的青涩也体现在定制化模式上。目前,“提示词设计”(Prompt design)仍是最主流的技术手段,其次是“检索增强生成”(RAG)。而更高级的方法——如Fine-tuning、工具调用、上下文工程以及强化学习——仍属于小众领域,主要由最尖端的前沿团队在使用。
剥去那些天花乱坠的炒作,大多数所谓的“AI 智能体”本质上只是围绕着模型调用的一些简单的“如果...那么...”逻辑。这种简单的架构虽然能应付当下的使用场景,但它也揭示了我们目前所处的阶段是多么早期。
由于基于大模型的应用架构仍在缓慢演进,目前的现代 AI 技术体系与去年相比大体相似。到目前为止,最大的受益者是那些正在扩展其受信任的数据和基础设施平台的“老牌巨头”(Incumbents):包括 Databricks、Snowflake、MongoDB 和 Datadog。
另一方面,初创公司的活跃点主要集中在“推理”和“算力”领域,在此领域,原生AI厂商直接与超大规模云厂商的开发者平台展开竞争。诸如Fireworks、Baseten、Modal和Together等推理平台,凭借性能与开发者体验胜出——它们提供Serverless、高吞吐量的开源模型接口,并通过手写或融合算子内核、优化的推理服务栈,以及精细化调度的GPU集群,实现推理速度提升2倍以上。
在技术栈的更上层,以LangChain、Braintrust和Judgment Labs为代表的新一代可观测性与工具链厂商,正着力构建AI的运行时可观测层——其切入点在于开发流程中的关键环节,包括效果评估(evals)、执行追踪(tracing)与持续学习(continuous learning)。下图所示市场图谱,呈现了当前构建生成式AI应用底层基础能力的核心厂商。
企业在 AI 基础设施领域投入了 180 亿美元,涵盖了基础模型、训练系统,以及数据与编排层。这张市场图谱展示了在这些技术环节中提供服务的各家公司。
下一步是什么?2026 年预测
在 2025 年,人工智能已成为历史上规模扩张最快的软件类别。基于我们在整个生态系统中观察到的情况,我们对未来一年提出了五项预测。
AI 在日常实际编程任务中的表现将超过人类。大语言模型的技能增长并不会陷入停滞,尤其是在数学和编程等可验证的领域。在这些领域,顶尖模型将持续进化,变得越来越强。
杰文斯悖论(Jevon’s paradox)将持续生效:尽管由于推理量的量级增长带动了推理成本的持续下降,但生成式 AI 的净支出仍将继续上升。
基准测试将持续饱和,但无法完全体现模型的真实效能: “刷榜型”模型将无法长期留住用户。
在编程等前沿应用场景中,用户对价格其实并不敏感: 为了追求更强的性能,他们愿意支付更高的费用。
除编程之外,模型将在另一个重大应用领域获得广泛采用。
可解释性与治理将走向主流。 随着 AI 智能体自主权和决策能力的增强,解释并治理其决策过程的能力将变得愈发重要,而这一需求正来自于使用 AI 的用户。我们预计,政府将要求智能体在产生结果时提供“可解释的决策过程”和“审计日志”。像 Goodfire 这样致力于让神经网络可解释、可引导的公司,对企业来说将变得越来越重要。
模型终于向“边缘”(终端设备)迁移。受低延迟需求、隐私与安全以及其他因素的推动,计算将持续向设备端(手机、电脑等)迁移,越来越多非前沿模型的成本将趋近于 0。谷歌、苹果和三星等移动设备制造商将推出专用的低功耗 GPU 算力,让您的手机无需联网、无需支付额外费用,即可实现极速的 AI 推理。
两年前,当生成式 AI 还大多局限于试点项目和概念验证阶段时,我们发布了第一份《企业生成式 AI 现状》报告。我们致力于用真实的数据来揭示幕后真相,这些数据直接源于企业的实际买家,而非分析师的预测或厂商的宣传。我们的初衷,是想从喧嚣的杂音中寻找真实的信号。
今年的调研结果明确显示:这种转变已不再是推测。企业 AI 现已成为一个价值 370 亿美元的市场——也是软件历史上增长最快的类别。在各行各业,AI 已经成为工作完成方式的核心。各大企业看到了真实的投资回报,正准备成倍增加投入。
数据来源与研究方法
调研方法
本报告综合了一项针对 495 名美国企业 AI 决策者的调研结果。该调研是与一家独立研究机构合作,于 2025 年 11 月 7 日至 25 日期间进行的。受访者包括C-suite、工程与产品副总裁,以及在正积极使用 AI 工具的企业中负责 AI 采购和开发决策的技术负责人。
市场规模测算模型
我们的市场规模测算结合了企业 AI 决策者的调研数据与对生成式 AI 生态系统的分析。我们通过行业领域、公司类型(初创公司与老牌巨头)以及市场进入模式(产品驱动型与企业销售型)对公司进行分类。我们参考了公开信息、行业报告及市场分析,以评估 AI 领域的整体收入分布。
统计范围
生成式 AI 的支出包括:基础模型、模型训练基础设施、AI 基础设施,以及来自初创公司和老牌巨头的 AI 应用。本统计不包括:芯片(如英伟达)、推理与模型托管服务(如亚马逊 AWS、谷歌 GCP、微软 Azure、Fireworks 等),以及内置于现有软件方案中的 AI 功能(如 Intuit Assist 等)。
大语言模型市场份额
大语言模型的市场份额,是根据生产环境中的接口(API)使用比例,所估算出的实际投入资金。调研受访者报告了其 AI 工作负载中各模型的使用占比。我们根据每家企业及初创应用的规模对调研回复进行了加权处理,并结合已公开的财务报告进行了交叉验证。
局限性
市场测算结果代表了我们截至 2025 年 12 月的最高评估水平。调研样本仅限于美国企业。针对私营公司的营收估算,是基于公开数据和行业分析得出的。
扫码关注我们
311