当前,央国企的AI建设重点正从早期的算力、模型等基础资源投入,深入至场景应用与价值创造阶段,而智能体平台已成为承接这一转型的核心载体。
3月27日,由和利时、蓝凌联合举办的AI转型联合春茗会在北京圆满举行,爱分析联合创始人兼首席分析师张扬受邀出席活动,基于爱分析与多家央企的服务与交流经验,张扬以“智能体平台-企业未来的数字员工操作系统”为主题进行了分享。本次分享围绕AI智能体落地中的核心挑战、选型策略与未来趋势展开,以期为企业的实际落地提供参考。
分享嘉宾:爱分析联合创始人兼首席分析师 张扬
01 知识治理是智能体成败关键
自2024年起,国资委开始为央企设定AI+专项行动KPI,当年KPI相对容易达成,但2025年则趋于紧张,而2026年更为严峻。目前央企AI+专项行动主要围绕四个核心点展开:算力、模型、场景和焕新社区。其中,算力、模型和焕新社区方面较易达成KPI,而场景建设则相对困难,且央企之间在场景竞争上尤为激烈。
举例来说,已有一家央企对外公开表示,基于开源产品搭建了企业智能体平台,已上线2000个场景。然而,国资委AI+专项行动中高价值场景的目标为1000个。由此可见,场景建设已成为央企AI竞争最激烈的方向。央企在落地场景过程中主要面临几个核心问题。
首先是定义场景的价值。央企要评估场景是通用办公场景还是核心生产场景,而核心生产场景价值更高。因此,如何实现核心场景是许多甲方首要关心的问题。其次是如何落地,除了考量场景价值外,更关键的是如何通过系统或平台统一管理数百个场景。这便是智能体平台的核心价值之一,即对场景进行管理和落地实施。根据我们这几年对上百家央国企的落地调研,以下是2025年与2026年数据的对比。
央国企Agent落地进展分为四个阶段:观望学习、探索可研、试点速赢和全面推广。
2025年,已有29%的调研企业进入试点阶段,即至少建立了几个POC场景或生产场景。而到2026年初,这29%中仅有13%进展到全面推广。这表明,超过一半的央国企在从试点到全面推广之间,需要至少一年以上的时间,过程中存在诸多风险。调研显示,智能体项目的成功率在央国企内部约为70%,即近三分之一的项目会失败。失败原因主要归因于数据质量或底层知识质量。
也就是说,智能体平台的核心并非低代码流程节点问题,而是知识治理能力,包括自动化治理能力和可持续治理能力。去年不少央国企基于开源产品搭建智能体平台,但开源产品在知识治理方面基本空白,这成为落地应用中的致命问题。因此,我们建议,知识治理是智能体落地的前提和标准。
02 、企业AI目标从裁员转向流程重构
在实际落地过程中,AI究竟要解决哪些具体的业务痛点?有几个观察可以与大家分享。下图展示了2025年与2026年的调研数据对比。
第一个核心目标始终是降本。自2024年以来,我们便探讨AI的核心价值在于降本,央国企对此反应迅速,到去年调研时,绝大多数企业已将AI与降本紧密关联。2026年,这一比例依然维持高位,但其内涵已发生变化。
早期,大家理解的“降本”多与裁员、减少人力投入相关。而现在,越来越多企业的理解是业务本身能否实现运营流程自动化,也就是说一项业务能否由少数核心员工借助AI从头到尾完成,而非依赖过去复杂的、人力驱动的流程。因此,企业不再单一地将降本等同于裁员,其核心关注点转变为:在AI介入后,业务逻辑和流程是否能降低对人的要求或依赖。这正成为越来越多央国企的关注焦点。
正是基于这一变化,近期如OpenClaw的发布,对一些大型央企触动较大。去年DeepSeek等模型展现出思维链能力时,已有科技厂商开始提出业务流程自主规划的概念,但当时绝大多数企业难以接受用自主化的AI流程来解决内部业务问题。因为在传统观念中,业务流程理应由专家设定规则,以确保其可控、可视、可追溯。然而,今年随着类似技术的突破,许多甲方已经开始认真思考,未来的业务流程是否还必须100%由专家设定?而这正好与我们刚才所讲的,降本目标从裁员向业务流程变革的转变相通。越来越多的甲方开始意识到,部分场景或许可以考虑采用自主化的AI流程。这一点,是未来企业在规划智能体平台时需核心考量的关键。
另一个显著变化是合规问题的优先级大幅提升。2025年时,合规可能尚未进入前五关注点,而今年已跃升至第四位。这是因为许多央国企在落地初期,场景多聚焦于通用办公领域。但正如之前提到的,央企更希望AI应用于核心生产业务。从办公场景切入核心生产业务存在难度,而安全业务或合规业务恰好是一个理想的过渡地带。不同行业对此有不同体现,例如能源类煤炭企业会大力开展安监场景建设。这虽非其最核心的开采或炼化环节,但已非常贴近生产业务。因此,在自身核心生产场景周边的合规、风控领域建设更多场景,成为普遍思路。这类场景既贴近核心业务,又规避了通用场景的普适性短板。这可能是合规越来越受关注的主要出发点。
总体来看,今年企业在规划场景时,会越来越多地考虑合规方向。这是从落地场景角度观察到的趋势。最后是关于央国企实际的AI投入预算。今年,大部分央国企的整体IT预算预计仍会保持小幅增长,它们也是各行业中少数能维持预算正增长的甲方群体。
图中所示比例为AI预算占整体IT预算的比重。数据显示,最主要的区间集中在20%-30%,即约有四分之一的IT预算投入AI领域,这包括了硬件、软件及服务。
因此,若企业规划今年预算,可参考约25%的这一比例。当然,在这25%的AI预算中,算力相关投入仍是最大头,占比至少40%-50%。以上是我们对央国企今年实际落地AI时核心目标与考量的理解。
03 、记忆是智能体平台选型的必备功能模块
接下来重点谈谈对智能体平台的理解。首先分享下近期备受关注的OpenClaw对智能体平台的影响,这是许多甲方客户近期交流的核心话题。一方面已经采购了平台的甲方,会担心投入打水漂。另一方面计划今年采购的甲方,则在观望当前是否为合适的时机。因此我们需要梳理清楚,这类新技术究竟带来了哪些启示与具体影响。
关于工作流的变革是第一个重点。过去及当前产品主要依赖手动配置的低代码拖拉拽式工作流,而未来的终局无疑是智能化的自主工作流。当下我们正处于两者之间的过渡阶段。基于此,我们认为已购置的低代码平台短期内难以被取代,其作为资产的价值依然存在。但企业选型时需重点考量一个常被忽略的中间态,即高代码平台。
工作流并非只有手动与全自动两个极端,对开发者更友好的高代码选项是一个重要的过渡形态。因为即便是未来的智能工作流,也必然从简单场景起步,难以一蹴而就深入复杂核心业务。而在落地核心业务时,甲方常发现其逻辑嵌套过于复杂,拖拉拽的方式难以实现,甚至效率不如直接编码。因此建议甲方在选型时,应考虑平台是否具备高代码工作能力,这关乎投资的长效性。
关于记忆功能是第二个关键。当前企业智能体的记忆多限于单次对话的上下文记忆。而未来一定会向长期记忆演进,包括组织层面与个人层面的记忆。这带来两个思考方向。一是当前企业普遍建设智能体应用商店,旨在提供标准化应用服务全员。二是新技术促使我们思考另一条路,即为每位员工配备具备个性化记忆的智能体。因此,企业需要明确,所选平台未来必须拥有记忆模块。
尽管其最终形态可能很简单,但这一模块是智能体平台演进的基础能力,应成为下一阶段选型的重要考量。关于安全合规是第三点建议,这本质是本地优先问题。安全合规虽非核心业务需求,却是企业落地必须满足的基石标准。目前市面多数企业级平台在安全合规上仅实现基础功能,细粒度权限控制未必完善。而在强调本地调用、需访问大量内部资源的架构下,安全要求实则更高。因此评估平台时,其在服务器端与本地端的安全合规能力,应成为一个高优先级的判断维度。以上便是在新模型影响下,企业评估智能体平台时需要着重考量的三个方向。
04 、企业购买智能体平台,到底在买什么?
企业采购智能体平台,其核心动机究竟是什么?这便跳脱出单纯央国企的视角,而是所有企业在考量时都会面对的问题。根据我们的调研,企业客户大致可分为三类,其出发点因角色而异。
CEO的考量多源于战略层面的影响,例如对技术浪潮的紧迫感,或担忧错失时代机遇,从而推动一些全员性的变革。因此,CEO在推动智能体项目时,往往倾向于发起全员创新大赛,或关注组织层面的效能指标。这类需求最终会落到IT部门,转化为对平台与应用的建设任务。由于其视角宏观,不直接绑定具体的业务指标,反而相对容易启动和落地。
第二类典型的驱动角色是CIO,其采购动机多从IT治理与资产管理的角度出发。核心诉求在于实现架构的统一,避免智能体应用成为新的信息孤岛,并确保组件可复用、合规性可保障。CIO希望将所有智能体置于统一的架构下进行管理。
而最具挑战性的是第三类,即解决具体的业务问题,尤其是业务高管所关注的流程变革。这无疑是智能体落地中最难、也最核心的环节。因为它往往涉及对既有SOP的调整,牵动多方利益,且流程变革本身充满不确定性。因此,尽管最终采购决策常由IT负责人做出,但我们建议在落地初期,应优先考虑CEO与CIO层面的需求,而非直接强攻业务难题。虽然解决业务问题的方向正确,但实际项目中,直接深入业务层常会遇到巨大阻力。我们建议的实施路径,恰好对应上述三类角色。
第一步,呼应CEO的全员性需求,将平台作为创新试验田,鼓励广泛使用。实践中,许多企业正是通过这种方式,自下而上地挖掘出了高价值场景,这比纯粹自上而下拆解业务流程更为顺畅。第二步,对应CIO的诉求,着手建设统一平台,具体落地一些智能体应用,将前期发现的场景雏形实现。第三步,才是深入业务腹地,变革端到端的业务流程,打造数字化员工。这三步顺序,与采购平台时的三层动机一一对应。
05 、智能体平台竞争格局
具体到落地时的选型指标,这是我们基于持续评测工作形成的一个核心评估框架,主要围绕两大环节展开。
首先是智能体应用开发,这关系到构建应用的难易程度与最终效果。其次是智能体的运行,这直接决定了所能带来的业务价值。在开发环节,有几个关键点值得关注。
第一点是高代码平台能力。
第二点是智能体平台预装的组件库。组件库大致可分为两类,一类是技术型组件,例如去年备受关注的MCP,这类组件迭代很快,可能今年就演变为Skill,因此并非选型的核心差异点。更值得关注的是业务组件,它们能让你在落地业务时,基于现有组件快速修改适配。例如,许多企业的经营平台会提供合同审核、招标评比等通用业务组件。拥有这类业务组件库的智能体平台,通常实用价值更高。
第三点是辅助开发工具,目前主要以RAG为核心。评估RAG能力时,可关注其三步流程,即文档的接入解析、检索与生成。其中,解析环节自有模型的比例是关键差异点。有些厂商拥有自研的解析模型,这构成了核心价值。例如在工业领域,处理复杂的图纸文档时,先进的解析模型能直接将图纸连同上下文信息加载进来,省去了前期繁琐的知识治理与切片工作,这在不同智能体平台间是显著的区别。检索准确率与召回率相对可控,而在复杂业务形态时的解析能力,才是真正的分水岭。运行部分则涉及我们之前提到的记忆、权限等能力。
基于这些,我们抽象出四个核心能力维度,供大家在选型或进行POC测试时参考,分别是业务应用构建、知识治理、安全合规和交付落地。
我们也对行业内的各类厂商进行了分析。从当前智能体平台落地效果看,云大厂依然占据优势,他们兼具模型能力与过去的PaaS平台基础。我们进行了七到八个场景的POC测试,包括设备运维等垂直场景和制度报告等通用场景。从平台能力综合表现来看,大厂和基模厂商整体更优。在垂直领域,管理软件厂商表现不错,可归为第二梯队。而独立的开发平台,其产品功能目前面临一定压力,主要竞争对手正是这些大厂。因此我们认为,独立第三方的开发平台,未来在智能体平台领域的影响力可能会逐渐减弱。
从长远看,在类似OpenClaw这样的模型出现前,开源或独立开发平台相比大厂有近一年的先发窗口期。但在此之后,率先推出具备强大组件的智能体平台的,已经变成了大厂。因此,在选型时,独立开发平台在可持续性方面可能需要打一个问号。以上是我们对选型框架与厂商格局的理解。
06 、智能体服务计费模式正从单一订阅走向多元混合
最后,分享下关于按结果交付模式,甲方客户时常会问及未来是否将全面过渡到按结果付费。虽然都称为按结果交付,但内部仍可细分为多种类型。我们大致将其归纳为四种象限。
第一象限是按Outcome方式付费,这是最纯粹的按结果付费模式。但这在国内还比较少见,核心原因在于它对厂商而言,可能只适用于超大客户。因为每个客户的KPI与目标各异,商务条款均需单独洽谈。国外在客服等领域有一些实践,但也并非主流。尽管这是各方理想的未来方向。
第二象限是按工作量计费,这在人力资源等部门已有应用。例如AI面试,线下单次面试的人力成本约为数百元,那么线上面试服务可能会按线下成本的某个比例报价。企业使用多少次,就支付多少费用。在许多大规模校园招聘中,这类AI面试官已上线。这种模式适用于流程相对简单、通用的场景,如HR、法务等领域。
第三象限则是传统的SaaS模式,即按订阅付费。而未来,甲方与厂商签订的合同很可能是复合计价模式。目前我们已经看到有SaaS加工作量的组合,也有SaaS加TOKEN的组合,当然也有纯按成果付费的。整体上,未来厂商与企业会越来越多地寻求一种共赢状态。甲方认可厂商应获得合理利润,厂商也认为甲方的定制化需求与项目交付成本是可控的,这可能是更顺畅的长期合作状态。
第四象限是按TOKEN使用量付费,是目前落地较多的模式。这尤其在智能体平台方向可能有延伸空间。我们最初观察到按TOKEN付费的案例,是近期备受关注的GEO。许多企业采用GEO服务时,正是按TOKEN计费,因为它需要监测大量的Query在不同模型中的反馈,按实际消耗的TOKEN量计费最为合理。这种方式使得企业觉得与厂商议价时更透明、更容易沟通,因为消耗量可测量,焦点在于商定合理的利润空间。因此,目前我们看到越来越多的计费模式在向按TOKEN付费转变。
总结来看,当前智能体平台无疑是央国企落地人工智能应用时的必要选择。无论从CEO的战略视角,还是CIO的技术治理视角,这一平台都不可或缺。关键在于选型时应聚焦几个核心要点,包括我们反复讨论的知识治理问题、工作流程变革问题以及安全合规保障问题。这些是大家在评估和选择平台时,建议重点关注的方面。
毕业于清华大学及香港中文大学,杭州市金融科技创新项目应用案例专家评委,原投中集团副总裁。十余年金融行业从业经验,在爱分析媒体平台发文超过 500 篇,有很深的行业影响力。
184