• 正文
  • 相关推荐
申请入驻 产业图谱

PE和EE为什么经常互相甩锅?

13小时前
208
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

芯片厂里,PE和EE互相甩锅,几乎是制造现场最有生命力的传统项目。

PE,也就是Process Engineer,工艺工程师。
EE,也就是Equipment Engineer,设备工程师。

一个管工艺结果,一个管机台状态;
一个盯参数、良率、recipe、工艺窗口;
一个盯报警、硬件、PM、UPTIME、部件寿命。

表面上看,两边都是为了产线稳定。
但一旦异常出现,双方就很容易站到“对面”。

不是因为他们关系不好,而是因为在晶圆厂里,很多问题本来就很难一眼分清楚:到底是工艺问题,还是设备问题?

一、PE看结果,EE看状态

PE和EE为什么容易互相甩锅?

最根本的原因是:两个人看的东西不一样。

PE看的是工艺结果。

比如刻蚀深度对不对,膜厚均匀性好不好,颗粒有没有上升,CD有没有漂,良率有没有掉,电性有没有异常。

只要结果不对,PE第一反应就是:设备状态是不是变了?

因为工艺结果必须依赖设备来实现。
recipe写得再好,设备状态不稳定,结果照样会漂。

所以PE会说:

“昨天还好好的,今天突然不对,肯定是机台状态变了。”

这句话听起来很合理。

但EE听了就很委屈。

因为EE看的是设备状态。

真空正常,温度正常,压力正常,流量正常,RF正常,机械手正常,报警记录正常,PM刚做完,所有参数都在spec里。

所以EE会说:

“机台没有问题,是不是你工艺窗口太窄?”

这句话听起来也很合理。

于是问题来了:

PE说结果异常,所以设备有问题;
EE说设备正常,所以工艺有问题。

两边都没错,但锅只有一个。

这就是晶圆厂里最经典的拉扯。

二、设备“在spec里”,不代表工艺一定没问题

EE最常说的一句话是:

“设备参数都在spec里。”

这句话对不对?

对。

但PE听了往往会更生气。

因为在晶圆厂里,有些设备问题不是简单看spec就能看出来。

设备参数在spec里,不代表它没有趋势漂移;
真空在spec里,不代表腔体状态没有变化;
温度在spec里,不代表实际晶圆表面温度完全一致;
流量在spec里,不代表气路响应没有微小波动;
RF在spec里,不代表等离子体状态完全没有变化;
颗粒没有报警,不代表产品表面没有新增缺陷。

半导体制造最麻烦的地方就在这里:

很多异常不是“坏了”,而是“变了”。

而“变了”这件事,比“坏了”难查得多。

设备坏了,大家反而轻松。
泵坏了就换泵,阀坏了就换阀,sensor坏了就换sensor。

最怕的是设备没坏,但工艺结果就是不对。

这种时候,PE会觉得EE只盯报警和硬件参数,忽略了设备状态对工艺结果的细微影响。

但EE也会觉得PE太依赖结果倒推设备,看到异常就先怀疑机台。

三、工艺“没改过”,也不代表工艺一定没问题

PE也有一句经典话:

“我的recipe没动过。”

这句话对不对?

也对。

但EE听了也会沉默。

因为recipe没动过,不代表工艺条件没有变化。

来料有没有变化?
前道膜质有没有变化?
产品结构有没有变化?
pattern density有没有变化?
膜厚有没有偏?
clean状态有没有差异?
量测方法有没有变化?
排产顺序有没有影响?
同一台机不同chamber之间有没有差别?

PE说recipe没改,EE就会想:那是不是工艺窗口本来就太窄?

同样的recipe,在A产品上稳定,不代表在B产品上稳定;
同样的参数,在新腔体上稳定,不代表老腔体上稳定;
同样的条件,在刚PM后稳定,不代表跑了几百片后还稳定;
同样的流程,在实验批上稳定,不代表量产批上还稳定。

工艺不是写在系统里的几个数字那么简单。

它是设备状态、材料状态、产品结构、前后段工艺、环境条件共同作用的结果。

所以EE会觉得,有些问题不是设备坏了,而是工艺窗口太紧,容错太低,稍微一点波动就出问题。

PE听到这话当然也不舒服。

因为这句话翻译过来就是:

“不是我机台不稳,是你工艺太娇气。”

这谁听了能不急?

四、PE怕良率掉,EE怕机台停

PE和EE互相甩锅的背后,其实是压力来源不同。

PE最怕的是工艺结果异常。

良率掉了,缺陷上来了,CD漂了,膜厚偏了,电性不对了,最后客户产品有风险,PE一定会被追着问。

PE关心的是:

这批货还能不能放?
异常有没有扩散?
后续工艺会不会受影响?
良率损失谁来解释?
客户审核时怎么说?

所以PE天然会对任何工艺结果变化非常敏感。

而EE最怕的是机台停机和责任不清。

设备一停,产能没了;
报警一多,UPTIME掉了;
PM没做好,设备部门背锅;
异常查不清,EE还要一直守着机台。

EE关心的是:

这台机到底能不能release?
有没有明确硬件故障?
要不要停机检查?
停机多久?
备件有没有?
是不是设备原因导致?

所以EE天然会对“设备问题”这四个字非常谨慎。

PE不敢放过异常,EE不敢轻易认锅。

这不是两边不专业,而是两边都知道,一旦判断错了,代价很高。

PE如果把设备问题当成工艺波动,可能放过风险;
EE如果把工艺问题当成设备问题,可能白停机、白换件、白损失产能。

所以晶圆厂里的争论,本质上不是谁想甩锅,而是谁都不敢轻易下结论。

五、最难查的,是“设备和工艺都有一点问题”

如果所有问题都能简单分成工艺问题和设备问题,那晶圆厂就没那么痛苦了。

现实里最难的是:很多问题不是单一原因,而是多因素叠加。

设备有一点老化;
工艺窗口有一点窄;
来料有一点波动;
前道有一点变化;
腔体有一点污染;
量测有一点偏差。

每一个因素单独看,都不一定超spec。

但几个因素叠在一起,工艺结果就出问题了。

这就是半导体制造最折磨人的地方。

不是一个人犯了大错,而是一堆小波动同时往坏方向走。

最后大家发现,锅不是一个锅,而是一锅粥。

这种时候,甩锅其实没有意义。

因为问题不是“谁错了”,而是系统进入了不稳定状态。

真正厉害的工程师,不是争赢了会议,而是能把问题拆开:哪些是设备贡献,哪些是工艺贡献,哪些是产品结构贡献,哪些是来料贡献。

但这个过程很难,也很慢。

所以大家一边分析,一边互相试探,一边保护自己。

这就是晶圆厂会议的真实生态。

六、为什么最后总要看数据?

PE和EE吵到最后,真正能说话的只有数据。

在晶圆厂里,情绪不能定责,经验不能定责,猜测不能定责。

数据才是最后的裁判。

PE说设备有问题,要拿出设备状态变化和工艺结果之间的关联。
EE说设备没问题,也要拿出硬件趋势、报警记录、维护记录和对比数据。

没有数据,谁说得都像甩锅。

有了数据,争论才有可能变成分析。

这也是为什么成熟的PE和EE,后来都会变得很谨慎。

不会轻易说“肯定是你们的问题”。

而是会说:

“从目前数据看,更倾向于某个方向。”
“需要补一组对照实验。”
“建议先hold住相关lot,再做趋势确认。”
“目前不能排除设备状态影响。”
“也不能排除工艺窗口偏窄。”

这些话听起来很官方,但背后都是被现场磨出来的生存智慧。

七、成熟的PE和EE,最后都会学会互相理解

年轻的PE和EE,最容易互相看不顺眼。

PE觉得EE只会说设备正常。
EE觉得PE只会说结果异常。

但干久了之后,大家会慢慢理解对方。

PE会知道,设备不是黑盒子,很多问题查起来确实很难。
EE会知道,工艺结果异常不是PE找事,而是良率风险真的不能赌。

PE会越来越懂设备状态。
EE也会越来越懂工艺影响。

真正成熟的PE,不会一有异常就直接说设备坏了。
真正成熟的EE,也不会只拿“没有报警”当挡箭牌。

当PE和EE开始用同一套数据语言讨论问题时,甩锅就会少很多。

因为大家不再是为了证明自己没错,而是为了尽快找到问题。

相关推荐