• 正文
  • 相关推荐
申请入驻 产业图谱

从“算力焦虑”到“开箱即用”:剧透KADC 2026,开发者如何抓住AI Agent新基座?

19小时前
651
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

当下,AI很火,大家热议算力芯片和模型。但很多AI开发者,正在陷入一种“无效内卷”:集群规模越堆越大,Agent启动却越来越慢;向量检索动不动卡死,加再多服务器也解决不了问题。这不是算力不够,是架构不对。

很多人有个误区——一提到AI Agent,就觉得是GPU/NPU的事。但实际上,Agent的冷启动、记忆检索、沙箱拉起、多任务调度,这些高并发、低时延的“脏活累活”,全跑在通用计算底座上。AI芯片负责“算得快”,通用计算负责“管得住、调得动、跑得稳”。智能体时代,已经从智算主导进入到智算与通算协同的新阶段。

那通用计算要如何变革,才能应对开发者痛点?

我最近追了鲲鹏昇腾开发者大会(KADC 2026)会前的鲲鹏昇腾创享月的多场直播,发现涉及通用计算鲲鹏系统的干货密度很高,几位专家先讲解,后解答问题,直播形式很新颖。而且,鲲鹏专家对上述开发者痛点的答案很清晰:不只是造更快的CPU,而是重新定义算力的组织方式——超节点架构+软件全面开源,让开发者真正做到“开箱即用”。

临近5月22日-23日即将在北京中关村国际创新中心举行的KADC 2026,我们从AI开发者的核心痛点出发思考一下,通用算力体系应该怎样变革,才能为产业提供一个超越传统体系、更适应AI未来的新选择和新基石?

01三大痛点:堆服务器换不来好Agent

从AI应用开发者的吐槽来看,目前他们主要面临三大痛点。先细说第一个痛点,规模与效率的矛盾。传统思路很简单——算力不够,服务器来凑。但Agent场景下,每个实例启动都要拉镜像、读数据、初始化内存。你加再多的机器,冷启动延迟还是下不来;向量检索的数据量一大,照样卡成狗。很多开发者感觉集群越搭越大,效率不升反降。

第二个痛点是记忆和安全的“基础设施真空”。Agent要干活就得有记忆。但现在大部分方案是把记忆当“缓存”扔给Redis或者简单文本处理——数据散落在各处,Agent想读取信息效率极低;共享与隔离机制不健全,出了问题没法追责;多Agent之间记忆更新完全是静态的,没有版本控制和事务保证,一个Agent改了状态,另一个根本感知不到。更别提安全问题了——记忆被篡改怎么办?企业敢用吗?

第三个痛点:迁移和调优的门槛太高。很多开发者不是不想尝试新架构,而是迁移工作太复杂:改代码、适配中间件、调参数……光SQL改造就能耗掉好几天。开发者真正想做的,是使用计算基础设施快速把业务跑起来,而且要跑得很稳定、很安全,而不是花大量时间死磕底层适配。

三个痛点总结成一句话,旧的通用计算架构和工具链,已经撑不起Agent时代的需求了。

02硬件应对:鲲鹏超节点,架构变革

鲲鹏生态给出的解法,不是简单地发布一款更快的CPU,而是从两个维度同时动手:硬件上重构系统架构,软件上全面开源开放。

先说硬件。此次创享月第一场直播的主题就是“鲲鹏超节点,为AI Infra而生”。核心技术就是大家熟悉的灵衢互联——它打破了传统服务器的物理边界,实现以数据为中心的全互联架构。

这是什么意思呢?以前每台服务器守着自己的一亩三分地,内存、设备都是独享的,跨节点访问慢得要命。现在通过灵衢互联,内存可以跨节点借、设备可以跨节点用、访问路径大幅缩短——大带宽、低时延、内存统一编址、内存语义访问,把一堆独立的服务器变成一个“紧耦合的大系统”。

也就是说,灵衢带来的内存语义直接访问,不是“打电话”要等接通,而是“直接走过去拿”。这就是消息语义和内存语义的本质区别。

这个变化落到实际场景,提升非常直观,一是AI Agent场景,实现容器冷启动达到亚秒级,百亿千维向量检索性能提升20%;二是在搜推广场景,实现RPC时延下降50%,内存池带宽提升4倍,KVC/Emb时延下降60%;三是数据库大数据、虚拟化等传统业务也能获得全新解决方案。

举个例子,在金融交易场景,鼠标点击一瞬间的时延,对投资机构意味着大笔资金的得与失。鲲鹏超节点的低时延能力,正在满足这些极速交易的需求。

可以看出,鲲鹏不是在修修补补,而是在重新盖一套房子——把原来各自为政的服务器,变成一个全局调度的资源池。这不是“堆数量”,这是“改架构”。

03软件应对:记忆可回滚、沙箱秒拉起

计算系统硬件只是底座,真正让开发者觉得“好用”的,是上层能力的落地。这次创享月直播里,印象最深的是围绕AI Agent展开的记忆系统和沙箱系统。

先聊记忆系统。企业用AI,最大的问题不是模型不够强,而是“不敢用”。不敢用的原因有三个:数据散落各处,Agent获取信息效率极低;共享与隔离机制不健全;多Agent之间的记忆更新没有版本控制和事务保证。

鲲鹏专家在直播里,基于openGauss给出了一个叫“oG-Memory”的企业级Agent记忆系统。它不是简单把记忆存进数据库,而是把“无状态的上下文”升级为“可管理的企业资源”。openGauss原生支持关系型、向量、知识图谱、全文检索等多模态数据的存储与融合检索,权限、事务、版本控制这些能力都是数据库内核自带的,不是后来打补丁。上层再通过分层渐进检索、记忆按需加载等技术,让Agent的上下文窗口装进更精准的信息。

在直播里,专家说了句大实话,别人做的是记忆的应用,鲲鹏做的是记忆的基础设施。再加上安全层面的硬件级隔离和闪回技术,发现异常行为可以一键回滚——企业级Agent才敢真正上生产。

再说沙箱系统。Agent执行任务需要安全隔离的运行环境,沙箱拉起频率极高。传统方案有个笨办法:在每台服务器本地预留大量缓冲和预热镜像,用“资源换速度”——成本高,跨节点共享还慢。

专家在直播里,用openEuler+openFuyao给出了新解法:利用超节点的低时延、高带宽特性构建共享内存池。效果是镜像分发和沙箱启动速度获得数量级提升,上万并发的秒级拉起成为现实。再加上openEuler从硬件到应用层的纵深安全防护,让Agent从“黑箱失控”走向“可控、可知、可恢复”。

在笔者看来,面向Agent时代,鲲鹏生态围绕记忆系统和沙箱系统两大方向持续构筑能力,让各类Agent在鲲鹏上跑得更顺、更稳、更安心。鲲鹏生态想做的是让眼花缭乱的各类Agent跑好——给它们提供一个稳定、安全、可控、低成本的运行环境。

04 工具链应对:两大工具让你“零基础变专家”

计算硬实力有了,软实力也得跟上。很多开发者对鲲鹏感兴趣,但卡在迁移和调优的门槛上。这次直播里,鲲鹏生态拿出了两个实打实的“开发者友好”工具。

一是BoostKit(性能加速器)。面向AI时代,在AI数据工程、推理端KVCache缓存加速、搜推+AI编译器等场景持续发力,把CPU的性能榨到极致,开发者不用自己手调。

二是DevKit(AI智能化迁移开发调优)。这个要重点说。通过AI辅助系统自动迁移,单系统迁移仅需5人天就能搞定不兼容源码和SQL语句改造;AI辅助代码自动优化能识别计算热点并转换为向量化代码,效率提升30%以上;AI辅助系统性能分析,1天就能完成100轮自动迭代寻参。

也就是说,开发者不用翻几百页文档,不用一行行改代码到崩溃,工具替开发者干了。专家把这叫“零基础也能快速变身鲲鹏专家”。在我看来,这不是口号,是真能用的东西。

05 KADC 2026还有什么值得期待?

几场直播看下来,我对即将到来的KADC 2026更期待了。本届大会定于5月22日-23日在北京举办,包含两场开发者峰会、openEuler、BoostKit等10场细分领域的技术分论坛。

从前期预热内容来看,大会将聚焦算力基础设施、系统架构、操作系统、AI应用、开发工具、行业落地等核心方向,没有空泛造势,全是实打实的技术分享与生态进展,值得开发者与行业人士重点关注。我认为有三大方向值得关注。

第一,真实Demo现场跑。之前专家讲的亚秒级冷启动、向量检索提升20%,到现场可以亲眼看到跑出来的效果,甚至亲手操作。技术吹牛没意义,跑出来才算数。

第二,开源开放的生态协同。灵衢、openEuler、openGauss社区持续壮大。这次峰会会有真实的技术分享和社区动态,不是虚的。

第三,动手体验区。从公开信息可以看到, 2000多平方米沉浸式主题展区,鲲鹏昇腾创享月技术直播讲到的记忆系统、沙箱系统、BoostKit加速、DevKit智能迁移,都可以现场上手。“Agent Skill玩转体验营”和Codelabs实战区,能把直播里听到的干货变成真能用的技能。还有算子挑战赛总决赛,从3000多名选手中脱颖而出的高手队伍现场对决,喜欢看技术的别错过。

总结:

让开发者好用、易用,让鲲鹏开箱即用

回顾鲲鹏昇腾创享月的技术直播,我的整体感受是:鲲鹏不是在搞替代,而是在提供一套“架构更先进、软件更开放、开发者更省心”的全新计算基座。

超节点通过灵衢互联打破服务器边界,让资源全局调度;openGauss和openEuler从记忆管理到沙箱隔离,把Agent的“基础设施能力”补齐;BoostKit和DevKit用AI加持性能优化和开发体验,让开发者真正聚焦业务而不是底层适配。

总体看,鲲鹏生态的想法,是成为Agentic AI时代的“水电煤”——让开发者忘记算力,专注智能。你不需要关心电怎么发出来的,插上就能用。说了这么多,你对KADC 2026是否更期待了?咱们现场见。

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

黄海峰,科技媒体人,通信世界原副主编。北京邮电大学毕业,从事ICT领域研究和报道11年。关注5G、IoT、终端、AI、云等领域的融合发展。聚焦知名电信运营商、电信设备商、终端企业、IT企业等。运营“黄海峰的通信生活”(hhfine)微信公众帐号以及“海峰看科技”今日头条。