国产芯片迅速进化。仅GPU赛道,一周内接连传来重磅融资消息。

 

先有摩尔线程成立百天完成数十亿元融资,深创投、红杉资本中国基金、GGV联合领投,招商局创投、字节跳动、小马智行、融汇资本、海松资本、闻名投资、第一创业、五源资本、和而泰、明浩等联合参投,简直就是向豪华投资天团吹响了集结号。

 

四天后,天数智芯宣布完成12亿元人民币C轮融资,由沄柏资本和大钲资本联合领投,粤民投资管及联通资本跟投。天数智芯号称中国第一家GPGPU高端芯片及高性能算力系统提供商,7纳米旗舰级通用并行(GPGPU)云端计算芯片BI,于去年12月点亮。

 

回望2020年,半导体板块一路高歌,创下了不少记录,中芯国际融资532.3亿,刷新科创板记录,斯达半导体涨停34天,位列A股涨停板榜首,卓胜微以570.54元的收盘价,进入高价股Top 5……天眼查数据显示,截至12月,2020年全国新增超6万家芯片相关企业……

 

风口上的芯片股,今年开年被GPU拉开大幕。穿透红红火火的资本市场背后,是什么让国产GPU飞速进化?国产GPU究竟实力几何?

 

GPU因何坐上云霄飞车?

 

我国芯片企业近年来主要有两大驱动力:一是举国体制,包括国产替代、科创板与注册制等;二是产业升级和新兴产业应用的涌现,对芯片产生了巨大的需求。

 

那么为什么GPU屡屡受到重视?

 

GPU作为计算机显卡的核心,承担着图像处理和输出显示的任务。随着市场需求的发展,GPU不止用于处理图形图像,其技术原理决定了它适用于大批量处理特定类型信息,且并行计算能力和能效远远超过CPU,所以逐渐衍生出了通用计算GPU(GPGPU),即利用图形处理器进行非图形渲染的高性能计算。超算、大数据处理、人工智能等对算力要求非常高的应用场景中,算力大都采用CPU+GPGPU或搭配专用加速芯片的构建方式。

 

目前在集成GPU市场,英特尔、英伟达、AMD三分天下;独立GPU领域,几乎是英伟达和AMD的天下,前者市场份额甚至超出2/3。

 

去年,英伟达市值首次超过英特尔,成为半导体业界的标志性事件,虽然不论营收还是利润,英特尔依然是英伟达的好几倍,但也足以说明,英伟达凭借多年来围绕GPU软硬件生态的耕耘、核心定位于数据中心+AI的方向得到了资本界的认可,也进一步论证了GPU平台的潜力。

 

作为横跨视觉计算和人工智能计算的通用平台,GPU拥有巨大的市场空间。特别是因人工智能技术的发展,GPU作为核心算力基础,在科学计算、自动驾驶、智能分析、密码破解、图像识别、大数据、金融交易等云端计算及边缘计算领域有着海量的应用空间。也正是如此,GPU发展驶入快车道。

 

据东吴证券测算,GPU领域国产替代的市场空间超过50亿美元。除了既有的游戏市场,在工业、医疗、军事航天等方向都有进一步的发挥空间。偌大的蛋糕,究竟谁能切下一角?


国产GPU最新进展如何?

 

我国GPU技术领域起步较晚,厂商数量并不多,既有面向云端市场、人工智能的厂商,也有在图形GPU领域寻求突破的创业者。第一类厂商目前走在最前沿,也获得了资本市场更多的关注。粗略梳理,以下厂商发展值得关注:

 

天数智芯旗舰7nm GPGPU云端芯片点亮


 
天数智芯1月15日宣布,旗舰7nm GPGPU云端计算芯片BI成功“点亮”,该公司表示这是国内第一款全自研、真正基于GPU架构的7纳米制程GPGPU训练芯片,量产后将广泛应用于AI训练、高性能计算(HPC)等场景。

 

BI芯片使用7nm制程及2.5DCoWoS封装技术,容纳240亿晶体管,支持 FP32, FP/BF16, INT32/16/8 等多精度数据混合训练,支持高速片间互联,单芯每秒可进行 147 万亿次 FP16 计算(147TFLOPS@FP16),每秒可完成上百路摄像头视频通道的AI处理,性能达市场主流产品的两倍。


 
据其官方介绍,BI 云端训练芯片具备高性能、通用性、灵活性,将通过标准化的软硬件生态接口为应用行业解决产品使用难、开发平台迁移成本大等操作层面的实际痛点。

 

登临科技首款GPU+产品送样, 并完成A+轮融资


 
登临科技产品路线主打GPU+,即软件定义的片内异构通用人工智能处理器,目前首款产品已回片通过测试,开始客户送样。前不久刚完成了由元禾璞华、元生资本联合领投的A+ 轮融资,这是继光远资本、张江浩珩、张江高科领投的A轮后的又一轮融资,包括北极光在内的老股东持续在本轮加码跟进。

 

登临选择是云端推理及端侧高性能计算方向,产品化方向(Goldwasser) 基于Minsky异构架构。根据登临官方发布,Goldwasser GPU+ 产品在现有市场主流的 GPU 架构上,采用软硬件协同的异构设计。经过超半年的帕拉丁仿真,市场需要的主流框架、模型、算子及兼容性和性能均得到了充分的验证。 

 

景嘉微下一代GPU后端设计中
 

号称是A股唯一GPU芯片设计公司景嘉微,目前其第三代JM9系列GPU 研发已处于后端设计阶段,官方发布预计性能将大幅提升,目标进入国内信创以及人工智能、云计算等中高端应用领域。
 

景嘉微GPU目前有JM5、JM7两个系列,其中JM5400系列已经在国产军用飞机上应用,替代了AMD/ATI的产品;JM7200系列采用了28nm工艺,据称性能跟英伟达GT640(这是英伟达2012年的主流显卡)相近,不过整体功耗不足10W,低于后者的50W TDP,目前该系列已获得部分订单。
 

根据官方所列规格,第三代产品JM9231 的性能可达到2016年中低端产品水平;JM9271 核心频率不低于1.8GHz,支持PCIe 4.0 x16,搭配16GB HBM显存,带宽512GB/s,浮点性能可达8TFLOPS,性能不低于GTX 1080的水平,可达到2017年底的高端显卡的水平。

 

芯动科技布局移动、桌面、云端市场
 

芯动科技针对国内信创市场推出了风华系列芯片,内置国产物理不可克隆iUnique Security PUF信息安全加密技术,提升数据安全和算力抗攻击性,支持新基建桌面电脑和数据中心GPU计算自主可控生态。此外,16Gbps GDDR6高速显存技术、HDMI2.1 8K显示技术和Cache一致性Innolink Chiplet技术等,都将应用于风华GPU中。


 
去年10月,芯动科技与Imagination达成授权合作,采用多晶粒芯片(chiplet)和GDDR6高速显存等SoC创新,芯动科技将全球首发全新顶配BXT多核架构, 推出桌面和数据中心的高性能图形处理器GPU独立显卡芯片。

 

壁仞、沐曦正在高速融资


 
壁仞、沐曦都是当前被业界和资本关注的重点。
 

成立不到一年,壁仞科技已经累计融资近20亿元人民币。A轮由启明创投、IDG资本及华登国际中国基金领投11亿元人民币;Pre-B轮由高瓴创投领投,云九资本、高榕资本、金浦科技基金、基石资本、海创母基金等投资机构跟投,现有投资方松禾资本、IDG资本、云晖资本、珠海大横琴集团继续追加投资。

 

壁仞致力于开发通用计算体系,在智能计算领域提供一体化解决方案。首先聚焦于云端通用智能计算,逐步在人工智能训练和推理、图形渲染、高性能通用计算等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片的突破。


 
沐曦集成电路同样走在高速融资的快车道上,成立不足半年,此前已获得和利资本领投的亿元级别天使轮融资;今年1月又完成了数亿元Pre A轮融资,由红杉资本领投,真格基金跟投,老股东和利资本及天津泰达等继续加码。其研发方向拟采用业界最先进的5nm工艺技术,研发全兼容CUDA及ROCm生态的国产高性能GPU芯片。
 

国产GPU热赛道下的冷思考

 

我国发展高端GPU有一定的紧迫性和必要性:

 

其一,在GPU当前应用最为突出的人工智能领域,已经进入大规模落地阶段,我国大部分AI芯片创业公司都在推理市场进行布局。一个重要拐点可能在2022年出现,届时云端推理市场规模将超过云端训练。

 

在国内企业喜迎推理市场大爆发之时,有一个基本点值得重视:进行推理应用的AI模型首先是在算力更强劲的云端被训练出来的。如果训练端被英伟达这样的巨头所垄断,那么下游推理的落地、创新,是否会受到限制?

 

其二,英伟达收购Arm的消息从去年开始一直受到全球范围内的关注,如果这桩交易成功,意味着一家几乎“全能型”的算力企业的诞生:无论是高端通用算力,还是移动计算、物联网,都将处于一家全面占据市场垄断地位的美国企业掌握中,对全球乃至中国市场的影响是什么?

 

在种种技术趋势和大国竞争的背景下,国产GPU不论是产品规划还是资本介入,都已进入白热化阶段。但越是花团锦簇,越要警惕乱花迷眼,适当的“冷”思考有益身心:

 

第一,没有实际产品却被资本高度重视,“高配”创业团队是当前的核心优势,摩尔线程、壁仞、沐曦……都在演绎着创始成员名字撑起高估值的创富故事。

 

但是长远来看,芯片技术最终还是需要经年累月的迭代和优化。巨大的研发费用和资本开支是必需,但是下游产业链长期、持续的利润支撑才是芯片跨代发展的强力驱动。也就是说,芯片的成功和成熟需要大量的验证和出货,而找到可持续的落地场景才是长期发展的关键驱动力。

 

我国在高端GPU领域缺席多年,目前如景嘉微等,正处于从军用向信创、民用市场的拓展阶段,高端GPU业务从战略布局成长为核心支柱还有漫长的征途。

 

第二,天数智芯、登临等宣布产品“点亮”,固然是国产GPU的一大喜事,但也需要保持清醒,“点亮”只是研发成功,最重要的还要批量生产、落地,离最终的成功还有十万八千里路。

 

一位业内人士表示,国产GPU要在云端训练这个英伟达处于绝对垄断的主战场进行对抗,面临的挑战非常艰巨,几大公有云厂商包括浪潮等基本都是采用英伟达的产品,服务器需要系统级的稳定性,不是光搞个加速卡就可以大规模上量的,服务器厂商不会轻易切换新硬件,因为风险太大了。

 

第三,在GPU领域,英伟达耕耘多年的CUDA开发者生态,也是英伟达生态的核心,很多深度学习的加速库都是基于CUDA,并且是和英伟达的硬件深度绑定的,这是创业公司难以撼动的壁垒。

 

国产GPU如天数智芯、登临等,在产品路线上选择兼容CUDA。在与一位GPU方向的从业者交流时,他认为:“短期来看,国产GPU兼容CUDA更容易发展,毕竟写算子是人力密集型行业,用户迁移的话是需要100%迁移、整套代码都要在你的片上跑,如果代码量很小,需要的算子不那么多,难度就比较低。但是长期来看,还是要摆脱兼容思路,发展自有的核心技术。”不过他随后打趣,“短期和长期的界定不是很好区分,有可能像凯恩斯说的‘长远来看,我们都死了’,先活下来是硬道理。”

 

GPU只是半导体产业高歌猛进的一个缩影。在与一位投资人谈起芯片领域的融资进度和规模时,他不无感慨地说道,“芯片投融资今年可能会更多,以往融资还有个PPT,接下来可能有些连PPT都没有。”

 

先不说有没有实际产品,最重要的是未来的软件和开发者生态,这才是大规模商用的前提。国产GPU何时能够真正突围成功?值得关注和期待。