• 正文
  • 相关推荐
申请入驻 产业图谱

智能体爆发,芯片验证工程师的苦日子要来了?

06/10 13:21
313
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

吃瓜吃到自己头上了。

前几天我在现场听老黄激情演讲,一开始画风很正常,后来老黄突然亮出一张PPT,上面竟然都是我熟悉的波形图。然后老黄说,AI智能体这么火,怎么能不用在他的老本行——芯片开发呢?于是,英伟达EDA巨头公司Cadence合作做了一个专门面向芯片设计验证的AI智能体:ChipStack AI Super Agent。

这个智能体运行在英伟达的OpenShell沙箱中,剩下的全是Cadence的各种验证工具,十八般武器都用上了:RTL分析、验证环境生成、单元级测试、形式化验证、覆盖率指标手机、漏洞报告等等等等……

用他们的话说,有了这个ChipStack AI Super Agent,可以把芯片验证的速度提升40倍,并大幅减少人类工程师对芯片设计验证的参与过程。

完蛋,把我取代了。

但接下来几天我又深入研究了一下这个AI超级智能体,发现这玩意确实是AI+EDA的“ChatGPT时刻”。今天这篇文章就仔细说一下:ChipStack到底强在哪、它到底会不会取代像我这样的芯片设计验证工程师,以及当AI大局进军芯片领域的时候,人类工程师的价值到底在哪。

全文由老石本人古法手搓而成,请放心服用。

ChipStack到底能做什么

在我眼中,芯片验证工程师做的是劳动密集型的脑力工作。

为什么这么说呢?因为在传统的芯片验证流程中,一个工程师的一天是极其枯燥且充满机械劳动的:阅读写的贼晦涩的芯片规格书(Spec)、搭建永远搭不完的UVM测试平台、编写无穷无尽的测试用例、运行速度慢到让你怀疑人生的软件仿真、在浩如烟海的波形文件和日志中寻找可能出错的地方、和设计团队撕b、再次运行回归测试……别问我是怎么知道的,好奇的话,看看我之前工作一天的vlog视频。

你说这是脑力劳动吧,但总是在重复做类似的事情;你说这是体力劳动吧,还得费各种脑细胞和bug捉迷藏。

所以,验证是个劳动密集型的脑力工作。

大模型和智能体发展到今天,人们发现AI特别擅长做这种有一些技术含量、同时需要大量体力劳动的工作。比如写代码,再比如做芯片验证。

这就是ChipStack AI超级智能体在做的事情。你可以用自然语言或者结构化的需求文档告诉它:我需要对这个新加入的PCIe Gen6 控制器模块进行全面的验证环境搭建,重点覆盖缓存一致性和中断处理的边界情况。接下来,这个Agent就能够自动解析需求,生成底层的验证环境框架,自动编写相应的 SystemVerilog 测试代码,甚至能够在后台自动调用仿真工具,分析仿真生成的报错日志,定位到代码中的缺陷,并尝试自我修复和重新验证。

也就是说,它不只是能根据指令把验证和测试代码写出来,还具备了理解复杂上下文、进行多步逻辑推理,并自主执行验证任务的能力。

这种进步和Cadence密切相关。曾几何时,人们认为大模型不懂芯片设计和验证,因为相关的数据太少、模型从来没学过。但如果把不断提升的通用模型能力和Cadence的工具生态结合起来,AI就能调用高度优化的EDA工具、学习高度凝练的专家skill,变成一个有工具、有记忆、有执行环境、有反馈闭环的超级智能体。

EDA的三个阶段

如果我们把视角再拉高一点,这其实说明,现在EDA的发展进入了3.0阶段。

在EDA1.0阶段,人是主体,工具是被调用的客体。虽然随着EDA工具的进步,能自动化的步骤越来越多、效果越来越好,但所有的决策、架构搭建、代码编写、Bug排查,全部依赖于工程师的个人经验和肝脏健康程度。工具不会告诉你为什么时序没有收敛,它只会无情地抛出一个红色的违例报告;工具也不会告诉你怎么写测试激励能覆盖到那个隐蔽的死锁状态,这一切都需要人类的大脑去构思。在这个阶段,工程师是纯粹的劳动力输出者,这可能也是绝大部分芯片工程师的常态。

在EDA2.0阶段,人依然是主体,工具被赋予了一点智能,但不多。比如,它们可以根据你过去写的代码风格,自动补全接下来的一小段逻辑;或者在布局布线时,利用强化学习算法推荐一个更优的参数组合。但在这个阶段,AI依然是个助手,它仍然离不开人类的实时微操。就像开车的时候你的手仍然要放在方向盘上,AI只能做辅助驾驶,而不能完全接管整辆车的前进方向。

在EDA3.0阶段,也就是从现在开始,AI跃升为主体(Agent),人升维成为审查者(Reviewer)和需求定义者(Spec Provider),这也是ChipStack带来的最深远的改变。这是因为芯片设计和验证从来就不是单点问题,你也不可能只靠一个会写代码的模型,就解决真实的芯片项目。

Agent与Copilot的核心区别在于自主性。也就是说,Agent能够将一个宏大的目标拆解为多个子任务,自动调用各类工具链去逐一完成,并根据反馈不断调整策略。在这个新的范式下,传统的验证工程师将不再需要一行一行地手敲UVM代码,也不再需要彻夜死盯着终端屏幕上滚动的log。人类工程师从原本的古法编程者,升维成了工程监理和总设计师,你提供精确的设计规范,然后审查 Agent 提交的工作成果是否符合预期。

听起来很简单,但做起来还是必须要靠Cadence这样的EDA公司才能搞定,因为这些公司最懂问题可能会出在哪。做EDA的公司,最懂EDA工具链的缝隙,它知道工程师在哪些地方浪费时间,知道仿真数据在哪里,知道coverage数据在哪里,知道历史 bug都有哪些,知道哪些任务适合自动化,哪些任务必须让人类把关。

小公司费半天劲搞得奇技淫巧,对于EDA大厂可能就是请某个坐在屏幕后面的老法师看十分钟的事儿。下图就是原来我团队里的老法师,看身形就知道他有多强了。

Cadence的目标

但这还没完,Cadence的目标远不止于此,他们希望做的是一整套AI工程体系。

最上层,是代理和助理。ChipStack 面向数字前端设计和验证,把规格、RTL、testbench、仿真、调试这些动作串起来。除了它之外,还有:ViraStack智能体,用来做定制化设计和模拟设计自动化;InnoStack智能体,专注于数字芯片实现和签核;3DStack智能体,用来做现在大火的3D-IC设计;SystemStack智能体,用来做多物理场仿真……等等等等。这么多智能体,构成了Cadence的AgentStack家族。

中间层,是各种面向特定领域的优化AI。

比如Cerebrus主要面向数字实现和PPA探索,利用强化学习方法,帮助架构探索团队在功耗、性能、面积之间寻找更优解。Verisium面向验证,它利用机器学习分析海量的验证数据,找出测试覆盖率的盲区,并智能指导下一步的测试生成,帮助优化验证负载、提升覆盖、加速bug根因分析。Voltus InsightAI则更偏向电源完整性、功耗相关分析。

再往下,是统一数据平台。芯片设计过程中会产生海量的数据,比如波形、覆盖率报告、时序报告、功耗分析日志等等。在过去,这些数据分散在不同的工具和孤岛中,用完即弃。而JedAI Platform(Joint Enterprise Data and AI)则是Cadence打造的大数据基座。它打通了各个EDA工具之间的数据壁垒,将跨域的数据统一收集、清洗和结构化。这些高质量的工程数据,正是训练中层优化AI和顶层Agent的核心燃料。

除了AI,Cadence还有很多压箱底的宝贝和传统艺能,这些和前面说的AI军火库可以结合在一起,用他们CEO Anirudh Devgan的话说就是一个三层蛋糕,从下到上分别是加速计算(比如Palladium这样的仿真加速器和原型验证硬件)、仿真与优化(传统软件仿真器)、以及建立在物理真实性之上的智能代理。

也就是说,AI模型再牛,缺少中间层的物理真实性和底层的专用算力的话,也只是空中楼阁。芯片开发不是写小作文,写的不好还能重新来一遍;正相反,芯片开发不能容忍半点幻觉。只有将最前沿的Agent技术,深深扎根于经过几十年验证的物理引擎和海量专有数据之上,才能产生真正能在半导体工业中落地的生产力。

这才是Cadence的真正蓝图。

人类工程师的护城河在哪

首先记住一个原则,你永远不可能比AI还快。

不管是执行任务的速度,还是进化的速度,硅基的AI都遥遥领先碳基的人类。

事实上,这个道理在两次工业革命的过程中人们就知道、并且认命了。就像汽车发明之后,人类也不会感到悲哀,因为我们知道人类的两条腿没办法比内燃机驱动的四个轮子跑得快;挖掘机出现之后,也没有哪个建筑工人会试图用铁锹去和机械臂比拼挖土的效率。

如今,在信息和脑力劳动领域,这一幕正在重演。AI就是那辆汽车、那台挖掘机。它可以不知疲倦地在毫秒级时间内生成数千行的UVM测试序列,它可以同时开启成百上千个并发任务去覆盖广袤的状态空间,它可以瞬间扫视几百兆的报错日志并提取出异常波形。在这个维度的竞争上,人类工程师的败局已定。

但是,这绝不意味着人类工程师将离开舞台。因为汽车跑得再快,真正掌握方向盘的,依然必须是人类。

这在芯片行业尤为致命,因为芯片不能像软件可以后期打补丁。

软件世界可以敏捷开发、灰度发布。带着Bug上线,下周发个Patch就行。但芯片是一锤子买卖。先进制程流片动辄几千万美元、耗时一两年。一旦流片回来发现致命Bug,钱打水漂,产品推迟,公司甚至可能破产。

这种对绝对确定性的苛求,注定芯片必须100%正确。而现在的AI底层仍是概率模型,它会产生幻觉,会误判。在零容错的工业体系里,概率系统永远无法作为最终的责任人。

所以,验证工程师不是要被取代,而是换了一种方式继续存在,并且会加码下面的三种能力:

1、定义问题的能力,也就是要从会做题、变成会出题。经常做验证的人都知道spec写的有多烂,即使是前面说的那位老法师写的spec我也看不下去一点。如何将复杂的商业逻辑和系统应用场景,翻译成 AI 能理解的严谨约束条件,这需要极强的系统级抽象能力。你提出的问题维度有多高,AI 给出的验证环境就有多强。未来,能够精准“Prompt”复杂芯片系统的工程师,将成为稀缺的资源。

2、极限调试的能力。AI 能够快速排查95%的常规Bug,但剩下的5%,往往是跨模块、软硬协同、或数模混合边界的极端异常(Corner Case)。这些Bug 的表现通常违背常理,需要极其敏锐的技术直觉、深厚的踩坑经验,以及跳出代码、从底层物理或系统级思考的能力。AI 擅长在已知模式中找规律,而人类擅长在未知混沌中建立新逻辑。

3、根因定位与架构重塑的能力。AI 报错时能迅速指出是哪根信号线异常,这叫找到“症状”。人类的价值在于深挖“病根”:为什么会错?是总线带宽设计存在先天缺陷,还是特定拓扑下的协议死锁?人类不仅要指导 AI 修复代码,更要通过根因分析,反哺架构师修改底层系统设计。这种洞悉复杂工程本质、超越代码层面的架构思维,是统计模型很难具备的智慧。

好日子在后头

历史上,每一次颠覆性工具的出现都曾引发恐慌。当年逻辑综合工具取代手工绘制晶体管版图时,老一代工程师也曾哀叹。但事实证明,正是从画图的苦力中解放出来,才造就了今天百亿晶体管SoC的繁荣。

今天,ChipStack 扮演的角色如出一辙。它是工程师能力强悍的超级战友。因此,不必抱怨验证工程师的“苦日子”要来了。恰恰相反,这是一次史无前例的技术平权与生产力解放。当基础生产力被粗暴地提升了10倍,我们更应该思考:省下来的海量时间,该用来做什么?

想清楚这个问题,人类工程师的好日子就在后头。

(注:本文不代表老石任职单位的观点。)

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

微信公众号“老石谈芯”主理人,博士毕业于伦敦帝国理工大学电子工程系,现任某知名半导体公司高级FPGA研发工程师,从事基于FPGA的数据中心网络加速、网络功能虚拟化、高速有线网络通信等领域的研发和创新工作。曾经针对FPGA、高性能与可重构计算等技术在学术界顶级会议和期刊上发表过多篇研究论文。