一、先说清楚:天数智芯到底在做什么“级别”的事?
天数智芯做的是“通用GPU”,而且是要进数据中心、进生产环境的那种。
这句话对工程师意味着什么?
不是 AI加速小核
不是 特定算子ASIC
不是 边缘推理SoC
而是:
要接PCIe、跑Linux、挂框架、跑训练、能集群、要调优、要稳定
这决定了:技术复杂度是指数级的、失败概率也是指数级的
二、GPU为什么这么难?工程师都懂,但值得再说一遍
GPU难,不在“算力指标”,在系统工程:
1、架构不是画出来的,是“踩坑踩出来的”
指令集设计
并行执行模型
存储层级(HBM/Cache/一致性)
多卡通信与同步
编译器能不能把算子“喂饱”
任何一层拉胯,算力就是纸面参数。
2、真正的地狱在软件栈
工程师都知道一句话:
GPU不是芯片,是“软件定义的硬件”。
天数智芯在招股书里反复强调一件事:
自研 编译器、驱动、函数库
深度适配 主流AI框架
目标是:
“少改代码,能迁移”
这不是营销,这是生存线。
三、天数智芯的产品路线:说人话版
两条线,很清楚:
1、天垓系列(训练)
面向 FP32 / FP16 / FP8
强调 多卡互联、集群扩展
本质目标:
“让模型能训得动,而不是跑benchmark”
这是最难的GPU形态。
2、智铠系列(推理)
强调 INT8 / 混合精度
更看重 吞吐、功耗、部署效率
面向真实上线业务
这一步非常关键:说明他们不是只活在实验室
四、一个工程师会真正关心的数据
1、出货,不是样片
截至 2025年6月:
累计交付 >52,000 颗 GPU
290+ 客户
900+ 实际部署项目
覆盖金融、医疗、交通、科研等场景
这在国产通用GPU里,不是PPT水平。
2、软件迁移现实性
招股书的核心关键词反复出现:
“兼容主流GPU编程生态”
“少量代码修改即可部署”
“三代架构迭代 + 软件持续优化”
工程师都懂:
1)能不能跑起来,和能不能被长期用,是两回事
2) 天数智芯至少已经跨过“能跑”的阶段
五、研发方式:这一点很“工程师气质”
他们明确写了一句话:
“量产一代、设计一代、预研一代”
这在GPU行业里,意味着什么?
不是一次性All in
而是 持续现金流 + 技术滚动
接近国际大厂的节奏逻辑
同时:
研发人员 480+
多数来自全球一线半导体公司
核心负责人行业经验 20 年以上
这不是“创业团队”,
这是重工程组织。
六、为什么一直亏?这不是坏问题
工程师不怕亏,怕的是钱烧错地方。
天数智芯亏在哪?
研发费用长期 >100% 收入
编译器 / 驱动 / 框架 / 工具链
多代架构并行推进
这不是效率低,
这是GPU行业的入场费。
但也有变化趋势:
毛利率 2025H1 回升到 ~50%
产品结构向 GPU本体倾斜
经营杠杆在改善
对工程师来说,这意味着:
技术路线不是走偏的
七、真正要说的风险(工程师版)
客观讲,风险非常清楚:
生态护城河极难突破
多代GPU一次失误,代价巨大
软件栈维护是“无底洞”
与国际巨头不是同一个起跑线
招股书没有回避这些 。
最后,说一句偏“煽情但真实”的话
如果你是做芯片的,你一定懂这句话:
GPU不是风口项目,是“十年工程”。
天数智芯不完美,
但它做的是最难、最慢、最系统、最吃耐力的那类事。
它不保证成功,
但至少:
路线是对的
事情是真干的
工程复杂度是实打实的
这在今天,已经值得被认真对待。
说明:本文仅为技术与行业研究解读,不构成任何投资建议。芯片很硬,市场更硬,盈亏自负。
欢迎加入行业交流群,备注岗位+公司,请联系老虎说芯(加V:tigerchip)
171
