智能体爆发，芯片验证工程师的苦日子要来了？

吃瓜吃到自己头上了。

前几天我在现场听老黄激情演讲，一开始画风很正常，后来老黄突然亮出一张PPT，上面竟然都是我熟悉的波形图。然后老黄说，AI智能体这么火，怎么能不用在他的老本行——芯片开发呢？于是，英伟达和EDA巨头公司Cadence合作做了一个专门面向芯片设计验证的AI智能体：ChipStack AI Super Agent。

这个智能体运行在英伟达的OpenShell沙箱中，剩下的全是Cadence的各种验证工具，十八般武器都用上了：RTL分析、验证环境生成、单元级测试、形式化验证、覆盖率指标手机、漏洞报告等等等等……

用他们的话说，有了这个ChipStack AI Super Agent，可以把芯片验证的速度提升40倍，并大幅减少人类工程师对芯片设计验证的参与过程。

完蛋，把我取代了。

但接下来几天我又深入研究了一下这个AI超级智能体，发现这玩意确实是AI+EDA的“ChatGPT时刻”。今天这篇文章就仔细说一下：ChipStack到底强在哪、它到底会不会取代像我这样的芯片设计验证工程师，以及当AI大局进军芯片领域的时候，人类工程师的价值到底在哪。

全文由老石本人古法手搓而成，请放心服用。

ChipStack到底能做什么

在我眼中，芯片验证工程师做的是劳动密集型的脑力工作。

为什么这么说呢？因为在传统的芯片验证流程中，一个工程师的一天是极其枯燥且充满机械劳动的：阅读写的贼晦涩的芯片规格书（Spec）、搭建永远搭不完的UVM测试平台、编写无穷无尽的测试用例、运行速度慢到让你怀疑人生的软件仿真、在浩如烟海的波形文件和日志中寻找可能出错的地方、和设计团队撕b、再次运行回归测试……别问我是怎么知道的，好奇的话，看看我之前工作一天的vlog视频。

你说这是脑力劳动吧，但总是在重复做类似的事情；你说这是体力劳动吧，还得费各种脑细胞和bug捉迷藏。

所以，验证是个劳动密集型的脑力工作。

但大模型和智能体发展到今天，人们发现AI特别擅长做这种有一些技术含量、同时需要大量体力劳动的工作。比如写代码，再比如做芯片验证。

这就是ChipStack AI超级智能体在做的事情。你可以用自然语言或者结构化的需求文档告诉它：我需要对这个新加入的PCIe Gen6 控制器模块进行全面的验证环境搭建，重点覆盖缓存一致性和中断处理的边界情况。接下来，这个Agent就能够自动解析需求，生成底层的验证环境框架，自动编写相应的 SystemVerilog 测试代码，甚至能够在后台自动调用仿真工具，分析仿真生成的报错日志，定位到代码中的缺陷，并尝试自我修复和重新验证。

也就是说，它不只是能根据指令把验证和测试代码写出来，还具备了理解复杂上下文、进行多步逻辑推理，并自主执行验证任务的能力。

这种进步和Cadence密切相关。曾几何时，人们认为大模型不懂芯片设计和验证，因为相关的数据太少、模型从来没学过。但如果把不断提升的通用模型能力和Cadence的工具生态结合起来，AI就能调用高度优化的EDA工具、学习高度凝练的专家skill，变成一个有工具、有记忆、有执行环境、有反馈闭环的超级智能体。

EDA的三个阶段

如果我们把视角再拉高一点，这其实说明，现在EDA的发展进入了3.0阶段。

在EDA1.0阶段，人是主体，工具是被调用的客体。虽然随着EDA工具的进步，能自动化的步骤越来越多、效果越来越好，但所有的决策、架构搭建、代码编写、Bug排查，全部依赖于工程师的个人经验和肝脏健康程度。工具不会告诉你为什么时序没有收敛，它只会无情地抛出一个红色的违例报告；工具也不会告诉你怎么写测试激励能覆盖到那个隐蔽的死锁状态，这一切都需要人类的大脑去构思。在这个阶段，工程师是纯粹的劳动力输出者，这可能也是绝大部分芯片工程师的常态。

在EDA2.0阶段，人依然是主体，工具被赋予了一点智能，但不多。比如，它们可以根据你过去写的代码风格，自动补全接下来的一小段逻辑；或者在布局布线时，利用强化学习算法推荐一个更优的参数组合。但在这个阶段，AI依然是个助手，它仍然离不开人类的实时微操。就像开车的时候你的手仍然要放在方向盘上，AI只能做辅助驾驶，而不能完全接管整辆车的前进方向。

在EDA3.0阶段，也就是从现在开始，AI跃升为主体（Agent），人升维成为审查者（Reviewer）和需求定义者（Spec Provider），这也是ChipStack带来的最深远的改变。这是因为芯片设计和验证从来就不是单点问题，你也不可能只靠一个会写代码的模型，就解决真实的芯片项目。

Agent与Copilot的核心区别在于自主性。也就是说，Agent能够将一个宏大的目标拆解为多个子任务，自动调用各类工具链去逐一完成，并根据反馈不断调整策略。在这个新的范式下，传统的验证工程师将不再需要一行一行地手敲UVM代码，也不再需要彻夜死盯着终端屏幕上滚动的log。人类工程师从原本的古法编程者，升维成了工程监理和总设计师，你提供精确的设计规范，然后审查 Agent 提交的工作成果是否符合预期。

听起来很简单，但做起来还是必须要靠Cadence这样的EDA公司才能搞定，因为这些公司最懂问题可能会出在哪。做EDA的公司，最懂EDA工具链的缝隙，它知道工程师在哪些地方浪费时间，知道仿真数据在哪里，知道coverage数据在哪里，知道历史 bug都有哪些，知道哪些任务适合自动化，哪些任务必须让人类把关。

小公司费半天劲搞得奇技淫巧，对于EDA大厂可能就是请某个坐在屏幕后面的老法师看十分钟的事儿。下图就是原来我团队里的老法师，看身形就知道他有多强了。

Cadence的目标

但这还没完，Cadence的目标远不止于此，他们希望做的是一整套AI工程体系。

最上层，是代理和助理。ChipStack 面向数字前端设计和验证，把规格、RTL、testbench、仿真、调试这些动作串起来。除了它之外，还有：ViraStack智能体，用来做定制化设计和模拟设计自动化；InnoStack智能体，专注于数字芯片实现和签核；3DStack智能体，用来做现在大火的3D-IC设计；SystemStack智能体，用来做多物理场仿真……等等等等。这么多智能体，构成了Cadence的AgentStack家族。

中间层，是各种面向特定领域的优化AI。

比如Cerebrus主要面向数字实现和PPA探索，利用强化学习方法，帮助架构探索团队在功耗、性能、面积之间寻找更优解。Verisium面向验证，它利用机器学习分析海量的验证数据，找出测试覆盖率的盲区，并智能指导下一步的测试生成，帮助优化验证负载、提升覆盖、加速bug根因分析。Voltus InsightAI则更偏向电源完整性、功耗相关分析。

再往下，是统一数据平台。芯片设计过程中会产生海量的数据，比如波形、覆盖率报告、时序报告、功耗分析日志等等。在过去，这些数据分散在不同的工具和孤岛中，用完即弃。而JedAI Platform（Joint Enterprise Data and AI）则是Cadence打造的大数据基座。它打通了各个EDA工具之间的数据壁垒，将跨域的数据统一收集、清洗和结构化。这些高质量的工程数据，正是训练中层优化AI和顶层Agent的核心燃料。

除了AI，Cadence还有很多压箱底的宝贝和传统艺能，这些和前面说的AI军火库可以结合在一起，用他们CEO Anirudh Devgan的话说就是一个三层蛋糕，从下到上分别是加速计算（比如Palladium这样的仿真加速器和原型验证硬件）、仿真与优化（传统软件仿真器）、以及建立在物理真实性之上的智能代理。

也就是说，AI模型再牛，缺少中间层的物理真实性和底层的专用算力的话，也只是空中楼阁。芯片开发不是写小作文，写的不好还能重新来一遍；正相反，芯片开发不能容忍半点幻觉。只有将最前沿的Agent技术，深深扎根于经过几十年验证的物理引擎和海量专有数据之上，才能产生真正能在半导体工业中落地的生产力。

这才是Cadence的真正蓝图。

人类工程师的护城河在哪

首先记住一个原则，你永远不可能比AI还快。

不管是执行任务的速度，还是进化的速度，硅基的AI都遥遥领先碳基的人类。

事实上，这个道理在两次工业革命的过程中人们就知道、并且认命了。就像汽车发明之后，人类也不会感到悲哀，因为我们知道人类的两条腿没办法比内燃机驱动的四个轮子跑得快；挖掘机出现之后，也没有哪个建筑工人会试图用铁锹去和机械臂比拼挖土的效率。

如今，在信息和脑力劳动领域，这一幕正在重演。AI就是那辆汽车、那台挖掘机。它可以不知疲倦地在毫秒级时间内生成数千行的UVM测试序列，它可以同时开启成百上千个并发任务去覆盖广袤的状态空间，它可以瞬间扫视几百兆的报错日志并提取出异常波形。在这个维度的竞争上，人类工程师的败局已定。

但是，这绝不意味着人类工程师将离开舞台。因为汽车跑得再快，真正掌握方向盘的，依然必须是人类。

这在芯片行业尤为致命，因为芯片不能像软件可以后期打补丁。

软件世界可以敏捷开发、灰度发布。带着Bug上线，下周发个Patch就行。但芯片是一锤子买卖。先进制程流片动辄几千万美元、耗时一两年。一旦流片回来发现致命Bug，钱打水漂，产品推迟，公司甚至可能破产。

这种对绝对确定性的苛求，注定芯片必须100%正确。而现在的AI底层仍是概率模型，它会产生幻觉，会误判。在零容错的工业体系里，概率系统永远无法作为最终的责任人。

所以，验证工程师不是要被取代，而是换了一种方式继续存在，并且会加码下面的三种能力：

1、定义问题的能力，也就是要从会做题、变成会出题。经常做验证的人都知道spec写的有多烂，即使是前面说的那位老法师写的spec我也看不下去一点。如何将复杂的商业逻辑和系统应用场景，翻译成 AI 能理解的严谨约束条件，这需要极强的系统级抽象能力。你提出的问题维度有多高，AI 给出的验证环境就有多强。未来，能够精准“Prompt”复杂芯片系统的工程师，将成为稀缺的资源。

2、极限调试的能力。AI 能够快速排查95%的常规Bug，但剩下的5%，往往是跨模块、软硬协同、或数模混合边界的极端异常（Corner Case）。这些Bug 的表现通常违背常理，需要极其敏锐的技术直觉、深厚的踩坑经验，以及跳出代码、从底层物理或系统级思考的能力。AI 擅长在已知模式中找规律，而人类擅长在未知混沌中建立新逻辑。

3、根因定位与架构重塑的能力。AI 报错时能迅速指出是哪根信号线异常，这叫找到“症状”。人类的价值在于深挖“病根”：为什么会错？是总线带宽设计存在先天缺陷，还是特定拓扑下的协议死锁？人类不仅要指导 AI 修复代码，更要通过根因分析，反哺架构师修改底层系统设计。这种洞悉复杂工程本质、超越代码层面的架构思维，是统计模型很难具备的智慧。

好日子在后头

历史上，每一次颠覆性工具的出现都曾引发恐慌。当年逻辑综合工具取代手工绘制晶体管版图时，老一代工程师也曾哀叹。但事实证明，正是从画图的苦力中解放出来，才造就了今天百亿晶体管SoC的繁荣。

今天，ChipStack 扮演的角色如出一辙。它是工程师能力强悍的超级战友。因此，不必抱怨验证工程师的“苦日子”要来了。恰恰相反，这是一次史无前例的技术平权与生产力解放。当基础生产力被粗暴地提升了10倍，我们更应该思考：省下来的海量时间，该用来做什么？

想清楚这个问题，人类工程师的好日子就在后头。

（注：本文不代表老石任职单位的观点。）