央国企智能体平台，找到的路与踩过的坑

当前，央国企的AI建设重点正从早期的算力、模型等基础资源投入，深入至场景应用与价值创造阶段，而智能体平台已成为承接这一转型的核心载体。

3月27日，由和利时、蓝凌联合举办的AI转型联合春茗会在北京圆满举行,爱分析联合创始人兼首席分析师张扬受邀出席活动，基于爱分析与多家央企的服务与交流经验，张扬以“智能体平台-企业未来的数字员工操作系统”为主题进行了分享。本次分享围绕AI智能体落地中的核心挑战、选型策略与未来趋势展开，以期为企业的实际落地提供参考。

分享嘉宾：爱分析联合创始人兼首席分析师张扬

01 知识治理是智能体成败关键

自2024年起，国资委开始为央企设定AI+专项行动KPI，当年KPI相对容易达成，但2025年则趋于紧张，而2026年更为严峻。目前央企AI+专项行动主要围绕四个核心点展开：算力、模型、场景和焕新社区。其中，算力、模型和焕新社区方面较易达成KPI，而场景建设则相对困难，且央企之间在场景竞争上尤为激烈。

举例来说，已有一家央企对外公开表示，基于开源产品搭建了企业智能体平台，已上线2000个场景。然而，国资委AI+专项行动中高价值场景的目标为1000个。由此可见，场景建设已成为央企AI竞争最激烈的方向。央企在落地场景过程中主要面临几个核心问题。

首先是定义场景的价值。央企要评估场景是通用办公场景还是核心生产场景，而核心生产场景价值更高。因此，如何实现核心场景是许多甲方首要关心的问题。其次是如何落地，除了考量场景价值外，更关键的是如何通过系统或平台统一管理数百个场景。这便是智能体平台的核心价值之一，即对场景进行管理和落地实施。根据我们这几年对上百家央国企的落地调研，以下是2025年与2026年数据的对比。

央国企Agent落地进展分为四个阶段：观望学习、探索可研、试点速赢和全面推广。

2025年，已有29%的调研企业进入试点阶段，即至少建立了几个POC场景或生产场景。而到2026年初，这29%中仅有13%进展到全面推广。这表明，超过一半的央国企在从试点到全面推广之间，需要至少一年以上的时间，过程中存在诸多风险。调研显示，智能体项目的成功率在央国企内部约为70%，即近三分之一的项目会失败。失败原因主要归因于数据质量或底层知识质量。

也就是说，智能体平台的核心并非低代码流程节点问题，而是知识治理能力，包括自动化治理能力和可持续治理能力。去年不少央国企基于开源产品搭建智能体平台，但开源产品在知识治理方面基本空白，这成为落地应用中的致命问题。因此，我们建议，知识治理是智能体落地的前提和标准。

02 、企业AI目标从裁员转向流程重构

在实际落地过程中，AI究竟要解决哪些具体的业务痛点？有几个观察可以与大家分享。下图展示了2025年与2026年的调研数据对比。

第一个核心目标始终是降本。自2024年以来，我们便探讨AI的核心价值在于降本，央国企对此反应迅速，到去年调研时，绝大多数企业已将AI与降本紧密关联。2026年，这一比例依然维持高位，但其内涵已发生变化。

早期，大家理解的“降本”多与裁员、减少人力投入相关。而现在，越来越多企业的理解是业务本身能否实现运营流程自动化，也就是说一项业务能否由少数核心员工借助AI从头到尾完成，而非依赖过去复杂的、人力驱动的流程。因此，企业不再单一地将降本等同于裁员，其核心关注点转变为：在AI介入后，业务逻辑和流程是否能降低对人的要求或依赖。这正成为越来越多央国企的关注焦点。

正是基于这一变化，近期如OpenClaw的发布，对一些大型央企触动较大。去年DeepSeek等模型展现出思维链能力时，已有科技厂商开始提出业务流程自主规划的概念，但当时绝大多数企业难以接受用自主化的AI流程来解决内部业务问题。因为在传统观念中，业务流程理应由专家设定规则，以确保其可控、可视、可追溯。然而，今年随着类似技术的突破，许多甲方已经开始认真思考，未来的业务流程是否还必须100%由专家设定？而这正好与我们刚才所讲的，降本目标从裁员向业务流程变革的转变相通。越来越多的甲方开始意识到，部分场景或许可以考虑采用自主化的AI流程。这一点，是未来企业在规划智能体平台时需核心考量的关键。

另一个显著变化是合规问题的优先级大幅提升。2025年时，合规可能尚未进入前五关注点，而今年已跃升至第四位。这是因为许多央国企在落地初期，场景多聚焦于通用办公领域。但正如之前提到的，央企更希望AI应用于核心生产业务。从办公场景切入核心生产业务存在难度，而安全业务或合规业务恰好是一个理想的过渡地带。不同行业对此有不同体现，例如能源类煤炭企业会大力开展安监场景建设。这虽非其最核心的开采或炼化环节，但已非常贴近生产业务。因此，在自身核心生产场景周边的合规、风控领域建设更多场景，成为普遍思路。这类场景既贴近核心业务，又规避了通用场景的普适性短板。这可能是合规越来越受关注的主要出发点。

总体来看，今年企业在规划场景时，会越来越多地考虑合规方向。这是从落地场景角度观察到的趋势。最后是关于央国企实际的AI投入预算。今年，大部分央国企的整体IT预算预计仍会保持小幅增长，它们也是各行业中少数能维持预算正增长的甲方群体。

图中所示比例为AI预算占整体IT预算的比重。数据显示，最主要的区间集中在20%-30%，即约有四分之一的IT预算投入AI领域，这包括了硬件、软件及服务。

因此，若企业规划今年预算，可参考约25%的这一比例。当然，在这25%的AI预算中，算力相关投入仍是最大头，占比至少40%-50%。以上是我们对央国企今年实际落地AI时核心目标与考量的理解。

03 、记忆是智能体平台选型的必备功能模块

接下来重点谈谈对智能体平台的理解。首先分享下近期备受关注的OpenClaw对智能体平台的影响，这是许多甲方客户近期交流的核心话题。一方面已经采购了平台的甲方，会担心投入打水漂。另一方面计划今年采购的甲方，则在观望当前是否为合适的时机。因此我们需要梳理清楚，这类新技术究竟带来了哪些启示与具体影响。

关于工作流的变革是第一个重点。过去及当前产品主要依赖手动配置的低代码拖拉拽式工作流，而未来的终局无疑是智能化的自主工作流。当下我们正处于两者之间的过渡阶段。基于此，我们认为已购置的低代码平台短期内难以被取代，其作为资产的价值依然存在。但企业选型时需重点考量一个常被忽略的中间态，即高代码平台。

工作流并非只有手动与全自动两个极端，对开发者更友好的高代码选项是一个重要的过渡形态。因为即便是未来的智能工作流，也必然从简单场景起步，难以一蹴而就深入复杂核心业务。而在落地核心业务时，甲方常发现其逻辑嵌套过于复杂，拖拉拽的方式难以实现，甚至效率不如直接编码。因此建议甲方在选型时，应考虑平台是否具备高代码工作能力，这关乎投资的长效性。

关于记忆功能是第二个关键。当前企业智能体的记忆多限于单次对话的上下文记忆。而未来一定会向长期记忆演进，包括组织层面与个人层面的记忆。这带来两个思考方向。一是当前企业普遍建设智能体应用商店，旨在提供标准化应用服务全员。二是新技术促使我们思考另一条路，即为每位员工配备具备个性化记忆的智能体。因此，企业需要明确，所选平台未来必须拥有记忆模块。

尽管其最终形态可能很简单，但这一模块是智能体平台演进的基础能力，应成为下一阶段选型的重要考量。关于安全合规是第三点建议，这本质是本地优先问题。安全合规虽非核心业务需求，却是企业落地必须满足的基石标准。目前市面多数企业级平台在安全合规上仅实现基础功能，细粒度权限控制未必完善。而在强调本地调用、需访问大量内部资源的架构下，安全要求实则更高。因此评估平台时，其在服务器端与本地端的安全合规能力，应成为一个高优先级的判断维度。以上便是在新模型影响下，企业评估智能体平台时需要着重考量的三个方向。

04 、企业购买智能体平台，到底在买什么？

企业采购智能体平台，其核心动机究竟是什么？这便跳脱出单纯央国企的视角，而是所有企业在考量时都会面对的问题。根据我们的调研，企业客户大致可分为三类，其出发点因角色而异。

CEO的考量多源于战略层面的影响，例如对技术浪潮的紧迫感，或担忧错失时代机遇，从而推动一些全员性的变革。因此，CEO在推动智能体项目时，往往倾向于发起全员创新大赛，或关注组织层面的效能指标。这类需求最终会落到IT部门，转化为对平台与应用的建设任务。由于其视角宏观，不直接绑定具体的业务指标，反而相对容易启动和落地。

第二类典型的驱动角色是CIO，其采购动机多从IT治理与资产管理的角度出发。核心诉求在于实现架构的统一，避免智能体应用成为新的信息孤岛，并确保组件可复用、合规性可保障。CIO希望将所有智能体置于统一的架构下进行管理。

而最具挑战性的是第三类，即解决具体的业务问题，尤其是业务高管所关注的流程变革。这无疑是智能体落地中最难、也最核心的环节。因为它往往涉及对既有SOP的调整，牵动多方利益，且流程变革本身充满不确定性。因此，尽管最终采购决策常由IT负责人做出，但我们建议在落地初期，应优先考虑CEO与CIO层面的需求，而非直接强攻业务难题。虽然解决业务问题的方向正确，但实际项目中，直接深入业务层常会遇到巨大阻力。我们建议的实施路径，恰好对应上述三类角色。

第一步，呼应CEO的全员性需求，将平台作为创新试验田，鼓励广泛使用。实践中，许多企业正是通过这种方式，自下而上地挖掘出了高价值场景，这比纯粹自上而下拆解业务流程更为顺畅。第二步，对应CIO的诉求，着手建设统一平台，具体落地一些智能体应用，将前期发现的场景雏形实现。第三步，才是深入业务腹地，变革端到端的业务流程，打造数字化员工。这三步顺序，与采购平台时的三层动机一一对应。

05 、智能体平台竞争格局

具体到落地时的选型指标，这是我们基于持续评测工作形成的一个核心评估框架，主要围绕两大环节展开。

首先是智能体应用开发，这关系到构建应用的难易程度与最终效果。其次是智能体的运行，这直接决定了所能带来的业务价值。在开发环节，有几个关键点值得关注。

第一点是高代码平台能力。

第二点是智能体平台预装的组件库。组件库大致可分为两类，一类是技术型组件，例如去年备受关注的MCP，这类组件迭代很快，可能今年就演变为Skill，因此并非选型的核心差异点。更值得关注的是业务组件，它们能让你在落地业务时，基于现有组件快速修改适配。例如，许多企业的经营平台会提供合同审核、招标评比等通用业务组件。拥有这类业务组件库的智能体平台，通常实用价值更高。

第三点是辅助开发工具，目前主要以RAG为核心。评估RAG能力时，可关注其三步流程，即文档的接入解析、检索与生成。其中，解析环节自有模型的比例是关键差异点。有些厂商拥有自研的解析模型，这构成了核心价值。例如在工业领域，处理复杂的图纸文档时，先进的解析模型能直接将图纸连同上下文信息加载进来，省去了前期繁琐的知识治理与切片工作，这在不同智能体平台间是显著的区别。检索准确率与召回率相对可控，而在复杂业务形态时的解析能力，才是真正的分水岭。运行部分则涉及我们之前提到的记忆、权限等能力。

基于这些，我们抽象出四个核心能力维度，供大家在选型或进行POC测试时参考，分别是业务应用构建、知识治理、安全合规和交付落地。

我们也对行业内的各类厂商进行了分析。从当前智能体平台落地效果看，云大厂依然占据优势，他们兼具模型能力与过去的PaaS平台基础。我们进行了七到八个场景的POC测试，包括设备运维等垂直场景和制度报告等通用场景。从平台能力综合表现来看，大厂和基模厂商整体更优。在垂直领域，管理软件厂商表现不错，可归为第二梯队。而独立的开发平台，其产品功能目前面临一定压力，主要竞争对手正是这些大厂。因此我们认为，独立第三方的开发平台，未来在智能体平台领域的影响力可能会逐渐减弱。

从长远看，在类似OpenClaw这样的模型出现前，开源或独立开发平台相比大厂有近一年的先发窗口期。但在此之后，率先推出具备强大组件的智能体平台的，已经变成了大厂。因此，在选型时，独立开发平台在可持续性方面可能需要打一个问号。以上是我们对选型框架与厂商格局的理解。

06 、智能体服务计费模式正从单一订阅走向多元混合

最后，分享下关于按结果交付模式，甲方客户时常会问及未来是否将全面过渡到按结果付费。虽然都称为按结果交付，但内部仍可细分为多种类型。我们大致将其归纳为四种象限。

第一象限是按Outcome方式付费，这是最纯粹的按结果付费模式。但这在国内还比较少见，核心原因在于它对厂商而言，可能只适用于超大客户。因为每个客户的KPI与目标各异，商务条款均需单独洽谈。国外在客服等领域有一些实践，但也并非主流。尽管这是各方理想的未来方向。

第二象限是按工作量计费，这在人力资源等部门已有应用。例如AI面试，线下单次面试的人力成本约为数百元，那么线上面试服务可能会按线下成本的某个比例报价。企业使用多少次，就支付多少费用。在许多大规模校园招聘中，这类AI面试官已上线。这种模式适用于流程相对简单、通用的场景，如HR、法务等领域。

第三象限则是传统的SaaS模式，即按订阅付费。而未来，甲方与厂商签订的合同很可能是复合计价模式。目前我们已经看到有SaaS加工作量的组合，也有SaaS加TOKEN的组合，当然也有纯按成果付费的。整体上，未来厂商与企业会越来越多地寻求一种共赢状态。甲方认可厂商应获得合理利润，厂商也认为甲方的定制化需求与项目交付成本是可控的，这可能是更顺畅的长期合作状态。

第四象限是按TOKEN使用量付费，是目前落地较多的模式。这尤其在智能体平台方向可能有延伸空间。我们最初观察到按TOKEN付费的案例，是近期备受关注的GEO。许多企业采用GEO服务时，正是按TOKEN计费，因为它需要监测大量的Query在不同模型中的反馈，按实际消耗的TOKEN量计费最为合理。这种方式使得企业觉得与厂商议价时更透明、更容易沟通，因为消耗量可测量，焦点在于商定合理的利润空间。因此，目前我们看到越来越多的计费模式在向按TOKEN付费转变。

总结来看，当前智能体平台无疑是央国企落地人工智能应用时的必要选择。无论从CEO的战略视角，还是CIO的技术治理视角，这一平台都不可或缺。关键在于选型时应聚焦几个核心要点，包括我们反复讨论的知识治理问题、工作流程变革问题以及安全合规保障问题。这些是大家在评估和选择平台时，建议重点关注的方面。

毕业于清华大学及香港中文大学，杭州市金融科技创新项目应用案例专家评委，原投中集团副总裁。十余年金融行业从业经验，在爱分析媒体平台发文超过 500 篇，有很深的行业影响力。