• 正文
  • 相关推荐
申请入驻 产业图谱

做GPU这件事,为什么天数智芯选了最难的那条路?

4小时前
171
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

一、先说清楚:天数智芯到底在做什么“级别”的事?

天数智芯做的是“通用GPU”,而且是要进数据中心、进生产环境的那种。

这句话对工程师意味着什么?

不是 AI加速小核

不是 特定算子ASIC

不是 边缘推理SoC

而是:
要接PCIe、跑Linux、挂框架、跑训练、能集群、要调优、要稳定

这决定了:技术复杂度是指数级的、失败概率也是指数级的


二、GPU为什么这么难?工程师都懂,但值得再说一遍

GPU难,不在“算力指标”,在系统工程

1、架构不是画出来的,是“踩坑踩出来的”

指令集设计

并行执行模型

存储层级(HBM/Cache/一致性)

多卡通信与同步

编译器能不能把算子“喂饱”

任何一层拉胯,算力就是纸面参数。


2、真正的地狱在软件栈

工程师都知道一句话:

GPU不是芯片,是“软件定义的硬件”。

天数智芯在招股书里反复强调一件事:

自研 编译器、驱动、函数库

深度适配 主流AI框架

目标是:
“少改代码,能迁移”

这不是营销,这是生存线


三、天数智芯的产品路线:说人话版

两条线,很清楚:

1、天垓系列(训练)

面向 FP32 / FP16 / FP8

强调 多卡互联、集群扩展

本质目标:

“让模型能训得动,而不是跑benchmark”

这是最难的GPU形态


2、智铠系列(推理)

强调 INT8 / 混合精度

更看重 吞吐、功耗、部署效率

面向真实上线业务

这一步非常关键:说明他们不是只活在实验室


四、一个工程师会真正关心的数据

1、出货,不是样片

截至 2025年6月:

累计交付 >52,000 颗 GPU

290+ 客户

900+ 实际部署项目

覆盖金融、医疗、交通、科研等场景

这在国产通用GPU里,不是PPT水平


2、软件迁移现实性

招股书的核心关键词反复出现:

“兼容主流GPU编程生态”

“少量代码修改即可部署”

“三代架构迭代 + 软件持续优化”

工程师都懂:

1)能不能跑起来,和能不能被长期用,是两回事
2) 天数智芯至少已经跨过“能跑”的阶段


五、研发方式:这一点很“工程师气质”

他们明确写了一句话:

“量产一代、设计一代、预研一代”

这在GPU行业里,意味着什么?

不是一次性All in

而是 持续现金流 + 技术滚动

接近国际大厂的节奏逻辑

同时:

研发人员 480+

多数来自全球一线半导体公司

核心负责人行业经验 20 年以上

这不是“创业团队”,
这是重工程组织


六、为什么一直亏?这不是坏问题

工程师不怕亏,怕的是钱烧错地方

天数智芯亏在哪?

研发费用长期 >100% 收入

编译器 / 驱动 / 框架 / 工具链

多代架构并行推进

这不是效率低,
这是GPU行业的入场费


但也有变化趋势:

毛利率 2025H1 回升到 ~50%

产品结构向 GPU本体倾斜

经营杠杆在改善

对工程师来说,这意味着:

技术路线不是走偏的


七、真正要说的风险(工程师版)

客观讲,风险非常清楚:

生态护城河极难突破

多代GPU一次失误,代价巨大

软件栈维护是“无底洞”

与国际巨头不是同一个起跑线

招股书没有回避这些 。


最后,说一句偏“煽情但真实”的话

如果你是做芯片的,你一定懂这句话:

GPU不是风口项目,是“十年工程”。

天数智芯不完美,
但它做的是最难、最慢、最系统、最吃耐力的那类事。

它不保证成功,
但至少:

路线是对的

事情是真干的

工程复杂度是实打实的

这在今天,已经值得被认真对待。


说明:本文仅为技术与行业研究解读,不构成任何投资建议。芯片很硬,市场更硬,盈亏自负。

欢迎加入行业交流群,备注岗位+公司,请联系老虎说芯(加V:tigerchip)

天数智芯

天数智芯

上海天数智芯半导体有限公司(简称“天数智芯”)于 2018 年正式启动通用并行 云端计算芯片设计,是中国通用GPU 云端芯片及超级算力系统提供商。

上海天数智芯半导体有限公司(简称“天数智芯”)于 2018 年正式启动通用并行 云端计算芯片设计,是中国通用GPU 云端芯片及超级算力系统提供商。收起

查看更多

相关推荐