01 国产高端 CPU 的 “破局者”,生于时代刚需
海光信息成立于 2014 年 10 月,脱胎于天津海泰科技投资,背靠中科院计算所与中科曙光,诞生于国产高端处理器 “卡脖子” 最严峻的时期。彼时国内服务器 CPU 市场被 Intel、AMD 垄断,自主架构(如龙芯、飞腾)在生态兼容性上难以快速突破,而金融、电信等关键行业对 x86 兼容性有刚性需求。
2016 年,海光以2.93 亿美元代价,通过合资公司成都海光微电子有限公司(HMC)(AMD持股51%,海光持股49%)获得 AMD 初代 Zen 架构x86 指令集永久授权,成为国内唯一拥有 x86 永久授权的企业。这一步让海光跳过了指令集生态构建的数十年积累,直接站在成熟生态的肩膀上,实现了国产高端 CPU 的 “弯道超车”。
2018 年,海光推出首款 CPU “海光一号” 并量产;2022 年登陆科创板,成为 “国产 CPU 第一股”。被列入实体清单后,海光彻底切断外部技术依赖,全面转向自主迭代,完成了从 “授权引进” 到 “自主可控” 的关键蜕变。
02 创始人是中科院科学家和行业老兵的 “黄金组合”
海光的团队是典型的 “科学家 + 行业老兵” 配置,既懂技术底层,又懂产业落地:
核心创始人:唐志敏(中科院计算所研究员、龙芯 CPU 创始人),2014-2020 年任总裁 / 首席科学家,是海光 CPU 从零到一的技术灵魂。
现任核心管理层:
董事长孟宪棠:中科院资本背景,擅长资本运作与资源整合。
总经理沙超群:中科曙光技术副总裁出身,教授级高工,深耕服务器与算力系统 20 余年,是产业落地的操盘手。
研发团队,千人规模,硕博占比超 80%,核心成员多来自 AMD、Intel、中科院,覆盖 CPU/DCU 全链路技术,是国内最顶尖的 x86 与 GPGPU 研发团队之一。
03 产品“CPU+DCU” 双芯战略,覆盖通用计算 + AI 全场景
海光的产品矩阵清晰,形成 通用计算(CPU)+AI 加速(DCU) 的双轮驱动,是国内唯一同时实现高端 x86 CPU 与 AI 加速 DCU 双量产、双认证的企业。
1. 海光 CPU(C86 系列):国产 x86 的 “压舱石”
基于自主迭代的 C86 架构,兼容 x86 指令集,无缝适配主流 OS 与应用软件,是信创市场的首选通用算力底座。
7000 系列(高端):16-32 核,支持 2TB 内存、PCIe 5.0,面向云计算、大数据、AI 智算中心,性能接近国际主流水平。
5000 系列(中端):8-16 核,政务、金融、电信主力机型,市占率超 50%。
3000 系列(入门):4-8 核,面向中小企业、工业控制与边缘计算。
核心亮点:内置国密协处理器,原生支持商密算法,通过等保 / 密评最高等级;对 StackWarp 等漏洞原生免疫,硬件级安全能力领先。
2. 深算 DCU 系列:AI 算力的 “增长引擎”
海光DCU(Deep-learning Computing Unit)是海光信息推出的国产GPGPU(通用图形处理器)架构的深度计算处理器,专为AI训练、高性能计算等计算密集型任务设计。
2018 年开始海光切入 DCU 市场,并于 2021 年实现量产,目前主力芯片包括深算一号和深算二号,主要面向超算领域,同时,公司开始切入 AI 场景,新一代产品深算三号有望实现AI 性能的跃升。2018 年公司启动深算一号的研发,在 2021 实现量产并产生收入。深算一号采用 GPGPU 架构,具备全精度浮点数据和各种常见整型数据计算能力,可提供FP64算力,并且主要应用于超算中心等高性能计算领域,在 AI 领域尤其是大模型训练场景应用较少。
基于 GPGPU 架构,打造类 CUDA 生态,是国产 AI 加速芯片中兼容性最强、迁移成本最低的方案。
深算一号(2021):首款商用 DCU,适配主流 AI 框架,开启国产 GPGPU 商业化。
深算二号(2023):FP32 算力 256 TFLOPS,性能达英伟达 A100 的80%-90%,功耗仅 350W(A100 为 400W),能效比更优。
深算三号(2025):7nm 工艺、Chiplet 封装,HBM 带宽 1.8TB/s,算子覆盖率 >99%,性能对标 A100,支持万亿参数大模型训练。
深算四号(SG2040,2026):第三代 DCU,性能较上一代提升40%,支持 FP8 精度,进一步降低大模型训练成本。
04 海光信息的价值不仅仅是卖芯片 更是AI 基础设施时代的生态掌舵人
海光的核心竞争力,早已超越芯片性能,而是构建了 “芯片 — 整机 — 软件 — 应用 — 安全” 的全栈生态闭环,这是国产算力中最成熟、最具壁垒的生态体系。
1. 光合组织:6000 + 伙伴的 “算力共同体”
海光发起光合组织,聚合 6000 余家合作伙伴,完成 15000 + 软硬件适配,覆盖芯片设计、整机制造、操作系统、数据库、中间件、行业应用全链条。
整机层:深度绑定中科曙光、浪潮、新华三、联想等头部服务器厂商,形成 “海光芯 + 国产整机” 的主流方案。
软件层:与统信、麒麟 OS 深度适配;联合索辰科技等 CAE 厂商,优化工业仿真软件,部分场景性能超越国际方案。
应用层:政务、金融、能源、电信等领域联合解决方案超 15000 个,形成 “即插即用” 的行业落地能力。
2. AI 生态:兼容全球 99% 非闭源大模型,迁移成本降 95%
海光 DCU 基于类 CUDA的 DTK 软件栈,通过 HIP 接口实现 CUDA 代码95%+ 兼容性,用户几乎无需修改代码即可迁移,这是其最大的生态杀手锏。
已与DeepSeek、Qwen3、混元、智谱等365 款主流大模型完成全面适配 + 联合精调,覆盖全球 99% 非闭源大模型,支持从十亿级端侧推理到千亿级模型训练全场景。
推出 HSL(Hygon System Link) 总线协议,打通 CPU、DCU、IO、OS 的高速互联,实现异构计算的 “紧耦合”,算力利用率显著提升。
3. 安全生态:内生安全,构筑 AI 可信底座
海光将安全能力从 “附加模块” 升级为芯片内生能力,CPU/DCU 原生支持国密、机密计算、可信计算,为 AI 基础设施提供硬件级安全保障。
联合安恒信息、上海 CA 等,推出 “芯密全栈密码服务平台”“智能可信数据空间”,打通 “算力 — 安全 — 数据” 链路,完美适配金融、政务等高安全场景。
05 与友商的差异化异化壁垒无人能复制
在国产算力赛道,海光的优势是结构性、生态级的,与华为昇腾、寒武纪、壁仞等形成鲜明差异化:
1. 对比华为昇腾
海光优势:x86 永久授权 + 类 CUDA 生态,迁移成本 <5%,金融、电信等存量 x86 场景无缝替代 ;商业化更成熟,信创市占率领先。
昇腾优势:全栈自主(CANN+MindSpore),集群能力强,智算中心份额高。
2. 对比寒武纪 / 壁仞
海光优势:CPU+DCU 双芯协同,通用 + AI 全覆盖;x86 生态打底,客户基础更广泛;DCU 算子覆盖率 >99%,大模型适配更全面。
寒武纪 / 壁仞优势:纯 AI 芯片路线,在特定推理 / 训练场景性能更极致。
3. 核心壁垒总结
唯一 x86 永久授权:国内独一份,构建了无法逾越的生态兼容性壁垒。
CPU+DCU 异构协同:通用计算与 AI 加速深度融合,满足数据中心 “一芯多场景” 需求。
类 CUDA 生态:最低迁移成本,最快落地速度,是 AI 算力国产化的 “最优解”。
06 未来发展高成长性:三重周期叠加,确定性再增加
海光正处于信创深化 + AI 算力爆发 + 国产替代加速的三重黄金周期,未来 3-5 年将保持高速增长:
1. 业绩高增确定性强
2025 年营收143.77 亿元(+56.92%),净利润25.45 亿元(+31.79%);2026Q1 营收40.34 亿元(+68.06%),DCU 收入14.14 亿元(+120%),占比升至 35%,成为核心增长引擎。
订单饱满,合同负债同比 + 123%,产能与台积电、中芯国际深度绑定,保障 2026-2027 年交付。
2. 产品迭代加速,技术自主化深化
CPU:海光五号(14nm 优化)2026Q3 量产,性能 + 30%;自研微架构持续迭代,彻底摆脱外部依赖。
DCU:深算四号(SG2040)已发布,FP8 支持进一步降低大模型训练成本;下一代 DCU 对标 AMD MI300,性能再上台阶。
3. 生态扩张与产业链整合
光合组织伙伴持续扩容,从国内走向全球,覆盖更多行业与场景。
拟换股吸收合并中科曙光,打造 “芯片设计 — 服务器制造 — 算力服务” 的垂直整合生态,强化产业链话语权。
4. 市场空间:国产替代 + AI 算力双轮驱动
通用 CPU:国内服务器 CPU 市场规模超千亿,海光作为国产 x86 龙头,份额有望从当前 30%+ 提升至 50%+。
AI 算力:大模型训练 / 推理需求爆发,DCU 市场规模将达千亿级,海光凭借生态优势,有望成为国产 GPGPU 市场份额第一。
07 海光信息与中科曙光以及中科可控的关系
海光信息(688041):无实控人;中科曙光为第一大股东,持股 27.96%;成都国资(17%)、海富天鼎(10.81%)等为主要股东。
中科曙光(603019):实控人为中科院计算所;通过中科算源(16.36%) 控股,是海光的 “母公司级” 股东。
中科可控:曙光系核心制造平台,由中科曙光与昆山国资等合资设立,曙光为控股股东,定位“海光芯片 + 曙光方案” 的制造与交付主体。
1. 海光信息:芯片设计与算力内核
核心:CPU(C86)+ DCU(深算) 双产品线,国产 x86 与 AI 加速芯片龙头。
定位:提供算力底层芯片,是三者合作的技术基石。
2. 中科曙光:系统集成与算力服务
核心:服务器、超算、智算中心、云计算、大数据解决方案。
定位:海光芯片最大应用与落地平台,负责“芯片 + 整机 + 集群 + 软件 + 服务” 的系统整合与市场推广。
3. 中科可控:智能制造与整机交付
核心:服务器 / 工作站研发、生产、制造,昆山基地年产能百万台级。
定位:海光 + 曙光方案的制造与交付主体,承接海光芯片的规模化量产与整机交付。
介绍下海光DCU 计算
DCU(深度计算单元)是海光对标英伟达 A100/H100 的 GPGPU,以类 CUDA 软件栈 + 全精度算力 + 高兼容性构建核心壁垒,是国产 AI 加速芯片中商业化最成熟、迁移成本最低的方案。
产品迭代与核心参数
全精度覆盖:支持 FP64/FP32/FP16/FP8/INT8/INT4,兼顾 AI 训练 / 推理与 HPC 科学计算
类 CUDA 生态:DTK 软件栈 + HIP 接口,CUDA 代码 95%+ 兼容,迁移成本 < 5%
多卡互联:xGMI+PCIe 5.0,多卡带宽 184GB/s,支持 8 卡 / 16 卡集群
能效优势:同算力下功耗比 A100 低 12.5%,数据中心 TCO 降低 20%+
225