当下这个阶段,如果你的芯片没有一个某某性能最强的标志,那么奉劝你不要来国产芯片发布的圈子凑热闹。现在,这里是“地表最强”芯片的舞台。

 

 

8 月 23 日,华为在深圳总部推出 AI 处理器 Ascend 910(昇腾 910)。华为轮值董事长徐直军表示,昇腾 910 总体技术表现超出预期,作为算力最强 AI 处理器,当之无愧。

 

图片来源于华为官网

 

无独有偶。9 月 25 日,杭州云栖大会上,达摩院院长张建锋现场展示了最强的 AI 推理芯片含光 800。张建锋表示,在业界标准的 ResNet-50 测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。

 

看到这里,大家发现阿里、华为对于“最”字的应用是不是过于随意了?这看起来更像是文字游戏,之后所有在某一领域拔尖的芯片都可以用这样的方式冠以“地表最强”的称号。

 

但我们无力反驳。昇腾 910 确实是目前算力最强的 AI 芯片,而含光 800 也确实是目前 AI 推理能够力最强的芯片。

 

无论如何,昇腾 910 和含光 800 在中国芯片历程上都有着自己突出的贡献,在我们的芯片发展史也都会写下浓墨重彩的一笔。

 

昇腾 910- 最快的训练芯片


昇腾 910 搭载的是华为自研的达芬奇架构,达芬奇从 IP 到指令集都是华为自己的专家创造的,并且支持全场景人工智能应用。昇腾 910 的算力是国际顶尖 AI 芯片的 2 倍,相当 50 个当前最新最强的 CPU。因此,昇腾 910 的训练速度比当前最新最强的芯片提升了 50%-100%。

 

昇腾 910 AI 处理器内置 32 个达芬奇 AI Core,基于台积电 7nm 增强版 EUV 工艺。除了基于达芬奇架构的 AI 核外,昇腾 910 还集成了多个 CPU、DVPP 和任务调度器(Task Scheduler),因而具有自我管理能力,可以充分发挥其高算力的优势。在算力方面,昇腾 910 芯片达到了设计规格(半精度(FP16)256Tera-FLOPS;整数精度(INT8)512Tera-OPS)。此外,昇腾 910 芯片达到规格算力所需功耗(310W)低于设计值(350W)。

 

在华为全联接 2019 大会上,华为发布了全球最快 AI 训练集群华为 Atlas 900。其就是基于数千颗昇腾 910 AI 处理器互联构成,总算力达到 256P~1024P FLOPS @FP16,相当于 50 万台 PC 的计算能力。

 

图片来源于华为官网

 

含光 800- 最强的推理芯片


含光 800 是一款云端 AI 推理芯片,峰值性能为 7.8 万 IPS(每秒能处理 7.8 万张照片),峰值能效达到 500IPS/W。据介绍,1 颗含光 800 的算力相当于 10 颗 GPU,目前基于含光 800 的 AI 云服务已在阿里云上线。

 

图片来源于平头哥官方宣传图

 

含光 800 不同于基于冯·诺依曼架构的传统通用处理器,而是根据神经网络推理运算特征,设计特定的硬件神经元、高速连接的存储结构以及专用指令集,对内存和计算单元实现高效组织管理,实现单条指令完成多个操作,提高计算效率和内存访问效率。

 

含光 800 在算法方面也得到了加强。阿里巴巴达摩院机器智能实验室过去两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并且取得多个世界领先水平的成果。

 

不管是训练还是推理都需要强大的算力支撑,而两块芯片都表现了优异的性能。

 

经实测,昇腾 910 打造的 Atlas 900 可以在 60 秒完成基于 Resnet-50 模型训练,比第 2 名快 15%。这可以让研究人员更快的进行图像、语音的 AI 模型训练,让人类更高效的探索宇宙奥秘、预测天气、勘探石油,加速自动驾驶的商用进程。在一张汇聚有 20 万颗星星的南半球星空图上,天文学家想找出某种特征的星体,需要 169 天的工作量,Atlas 900 只需要 10 秒。

 

在城市大脑中实时处理杭州主城区交通视频,需要 40 颗传统 GPU,延时为 300ms,使用含光 800 仅需 4 颗,延时降至 150ms。

 

昇腾 910 和含光 800 有一个共同点,都不单独对外销售。昇腾 910 通过 AI 加速模块、AI 加速卡、AI 服务器等形式对第三方销售;含光 800 将通过阿里云对外输出 AI 算力。

 

昇腾 910 和含光 800 可谓是术业有专攻,各自有各自的特点。不管是训练还是推理,在 AI 应用落地中都至关重要,两款芯片能够在各自的领域做到世界第一,足见各自背后团队的真功夫。同时,这些有着中文古典名字的芯片不断涌现也代表着国产芯的欣欣向荣。如果有其他的企业能够做到这一点,相信大家也愿意继续被这样的“文字游戏”所套路。

 

参考文章:
《解密华为 Atlas 900:数千颗昇腾 910 构成全球最快 AI 训练集群》
《阿里第一颗芯片问世 平头哥发布 AI 芯片含光 800》
《华为推出昇腾 910 芯片 但不以独立芯片形式面向市场》
《阿里发布 AI 推理芯片“含光 800”,历时一年半完成设计与验证》

 

与非网原创内容,未经允许,不得转载!