传统CMOS工艺逼近物理极限,摩尔定律放缓,算力需求却还在指数级增长。这个矛盾逼着产业界和学术界寻找新的计算架构——从存内计算、光计算到量子计算,从可重构架构到类脑芯片。下面梳理一下当前新型计算架构的前沿进展,分技术路线、最新突破、代表厂商几个维度。
1. 存内计算:算力墙的破解思路
存内计算的核心思想是把计算搬到存储器里面,减少数据搬运,解决“冯·诺依曼瓶颈”。这几年发展最快的是SRAM和Flash-based的存内计算。
| 技术路线 | 原理 | 优势 | 挑战 | 代表厂商/团队 |
|---|---|---|---|---|
| SRAM存内 | 利用SRAM单元做乘积累加 | 速度快,工艺兼容 | 面积大,成本高 | 知存科技、九天睿芯 |
| Flash存内 | 利用Flash单元存储+计算 | 密度高,适合边缘 | 写入次数有限 | 闪易半导体、旺宏 |
| ReRAM/PCM | 阻变/相变存储单元 | 密度极高,可微缩 | 工艺不成熟 | 英特尔、台积电 |
2025-2026年进展:
- 知存科技:WTM2100芯片出货量突破百万颗,主要用在TWS耳机、智能手表。2026年发布WTM-8系列,算力提升到50TOPS,瞄准端侧AI。
- 九天睿芯:ADA100/200系列在智能家居、可穿戴设备落地,2026年推出支持Transformer架构的存内计算芯片。
- 学术界:北大、清华在多值存内计算、模拟存内计算方向有突破,ISSCC 2026多篇论文。
适合场景:端侧AI、低功耗唤醒、语音识别、健康监测。
2. 光计算:光速计算的探索
光计算用光子代替电子做计算,理论上速度更快、功耗更低。目前主要分两个方向:光互联(用光传数据)和光计算(用光做运算)。
| 技术路线 | 原理 | 优势 | 挑战 | 代表厂商/团队 |
|---|---|---|---|---|
| 硅光计算 | 硅基光波导实现矩阵运算 | 与CMOS兼容 | 精度低,集成度有限 | Lightelligence、曦智科技 |
| 衍射神经网络 | 光通过衍射层实现计算 | 全光计算,无功耗 | 难以重构,功能固定 | 国外学术团队 |
| 光互联 | 光代替电传数据 | 带宽高,延迟低 | 封装成本高 | Ayar Labs、曦智科技 |
2025-2026年进展:
- 曦智科技:2025年发布算力2000TOPS的光计算原型芯片,与谷歌、Meta等合作测试。2026年推出PCIe卡形式的光计算加速卡。
- Lightelligence:聚焦光计算+光互联,2026年宣布与某云厂商联合验证光计算服务器。
- 学术界:MIT、斯坦福在光神经网络架构上有新突破,Nature Photonics多篇。
适合场景:数据中心AI加速、科学计算、信号处理。
3. 量子计算:从实验室走向工程化
量子计算这几年从纯粹学术走向工程化。超导、离子阱、光量子三条路线并行,容错量子计算还有距离,但含噪声中等规模量子(NISQ)已经在探索应用。
| 技术路线 | 原理 | 优势 | 挑战 | 代表厂商/团队 |
|---|---|---|---|---|
| 超导量子 | 超导约瑟夫森结做量子比特 | 门操作快,工艺相对成熟 | 需极低温 | 谷歌、IBM、本源量子 |
| 离子阱 | 离子能级做量子比特 | 相干时间长,精度高 | 规模扩展慢 | IonQ、Quantinuum |
| 光量子 | 光子做量子比特 | 室温工作 | 逻辑操作难 | 国盾量子、Xanadu |
| 硅量子点 | 半导体量子点 | 与CMOS工艺兼容 | 相干时间短 | 英特尔、CEA-Leti |
2025-2026年进展:
- IBM:2025年发布Condor芯片,1121个超导量子比特。2026年公布Flammingo架构,向模块化量子计算机迈进。
- 本源量子:2025年上线72比特超导量子计算机“悟源”,2026年发布“悟空”二代,比特数提升到144。
- 谷歌:2025年宣布实现量子纠错突破,逻辑比特错误率低于物理比特。
- IonQ:2026年发布离子阱量子计算机Forte,AQ(算法量子比特)达到64。
适合场景:密码破译、材料模拟、药物发现、组合优化。
4. 可重构计算:灵活性与效率的平衡
可重构计算介于ASIC和FPGA之间,既有硬件效率,又有软件灵活性。国内此方向积累较深。
| 技术路线 | 原理 | 优势 | 挑战 | 代表厂商/团队 |
|---|---|---|---|---|
| 粗粒度可重构 | 多个功能单元,可动态配置互联 | 能效比高,适合数据流 | 编程模型复杂 | 清微智能、清华大学 |
| CGRA | 阵列式处理单元 | 灵活,面积小 | 编译器难做 | 英特尔、瑞萨 |
| FPGA+eFPGA | 嵌入可编程逻辑 | 定制化 | 成本高 | 安路科技、QuickLogic |
2025-2026年进展:
- 清微智能:TX系列可重构芯片出货超千万颗,2026年发布TX8,算力提升到32TOPS,支持Transformer。
- 清华大学:可重构计算团队在ISSCC 2026发布多篇论文,包括低功耗可重构AI芯片。
- 英特尔:FPGA部门继续推进eFPGA IP授权模式。
5. 类脑计算:模仿大脑的脉冲神经网络
类脑计算用脉冲神经网络(SNN)模仿生物神经元工作机制,理论上比传统AI芯片功耗低几个数量级。
| 技术路线 | 原理 | 优势 | 挑战 | 代表厂商/团队 |
|---|---|---|---|---|
| 数字类脑 | 数字电路实现脉冲神经元 | 精度可控,可编程 | 功耗优势不明显 | 灵汐科技、IBM |
| 模拟类脑 | 模拟电路模拟神经元 | 功耗极低 | 精度差,难编程 | 时识科技、斯坦福 |
| 混合信号 | 模数混合 | 兼顾功耗和精度 | 设计复杂 | 国外学术团队 |
2025-2026年进展:
- 灵汐科技:类脑芯片“启明”系列在无人机、工业检测领域落地,2026年发布新一代芯片,能效比提升5倍。
- 时识科技:Speck系列动态视觉+类脑处理芯片,2026年推出多核版本,瞄准机器人感知。
- IBM:TrueNorth后继项目,2025年发布类脑研究芯片NorthPole,论文发表在Science。
适合场景:动态视觉、触觉感知、低功耗唤醒、实时信号处理。
6. 芯粒与异构集成:架构层面的变革
芯粒(Chiplet)不是新的计算原理,但它让异构集成成为可能——不同工艺、不同功能的芯粒可以拼在一起,形成新架构。
| 技术方向 | 原理 | 优势 | 挑战 | 代表厂商/团队 |
|---|---|---|---|---|
| UCIe标准 | 芯粒互联接口统一 | 生态开放 | 封装成本 | UCIe联盟成员 |
| 3D堆叠 | 芯片垂直堆叠 | 带宽高,面积小 | 散热困难 | 台积电、英特尔 |
| 封装内内存 | CPU+内存封装在一起 | 破解内存墙 | 良率问题 | AMD、英特尔 |
2025-2026年进展:
- UCIe 3.0:2025年发布,速率64GT/s,支持运行时可重校准。
- 国内标准:《芯粒互联接口规范》国标2026年3月实施。
- AMD:MI300系列继续演进,CPU+GPU+内存封装在一起。
- 特斯拉:Dojo芯片用台积电InFO_SoW封装,实现大规模集成。
7. 一张表:新型计算架构对比
| 架构类型 | 核心原理 | 能效比 | 成熟度 | 代表厂商 | 适合场景 |
|---|---|---|---|---|---|
| 存内计算 | 存储内做计算 | 中高 | 量产 | 知存、九天 | 端侧AI、语音 |
| 光计算 | 光子做计算 | 极高 | 早期 | 曦智、Lightelligence | 数据中心、科学计算 |
| 量子计算 | 量子比特叠加 | 理论极高 | 工程化 | IBM、本源 | 密码、材料模拟 |
| 可重构 | 动态配置硬件 | 中高 | 量产 | 清微、清华 | AI加速、SDR |
| 类脑计算 | 脉冲神经网络 | 高 | 小批量 | 灵汐、时识 | 动态视觉、机器人 |
| 芯粒集成 | 异构封装 | - | 规模应用 | AMD、台积电 | 高性能计算 |
8. 从哪儿获取最新前沿信息
行业媒体:与非网的文章栏目经常有新型计算架构的深度解读。比如存内计算进展、光计算公司调研、量子计算年度回顾,信息密度高。
学术会议:
厂商官网:
- 知存、九天、曦智、本源官网有技术白皮书和进展更新
- IBM、谷歌、Intel的研究博客
政府/智库报告:
- 美国DARPA、欧洲地平线计划
- 中国信通院白皮书
- 中科院计算所年度报告
新型计算架构的探索正在多点开花。存内计算已经落地,光计算和量子计算还在突破,可重构和类脑各有特色。对工程师来说,理解这些新架构,意味着未来做系统设计时多了几把尺子。
829