2019 年,AI 市场风起云涌,一方面不少独角兽公司融资不断扩大,比如 2 月 27 日地平线 (Horizon Robotics) 宣布完成由 SK 中国、SKHynix 以及数家中国一线汽车集团 (与旗下基金) 联合领投的 B 轮融资,获得 6 亿美金左右的投资,又比如 5 月 8 日,旷视科技完成 D 轮融资,融资额达到 7.5 亿美元,在热门的边缘计算、视觉领域的前沿研究获得充足的资金支持。

 

另外一方面,市场对人工智能的期望恢复理性,国内厂商开始进入落地应用阶段。核心 AI 能力不断扩展,寒武纪在苏州举办的全球智博会上,展示了 14 个应用案例,寒武纪 AI 芯片,比如 MLU100 芯片已经在阿里云城市大脑提供算力支持,寒武纪的 AI 芯片在智能手机领域的应用呈现扩大之势,此外,在教育行业、智能制造和工业、服务器领域,这家公司都带来了实质性的落地项目。

 

IDC 高级新兴技术研究部高级研究经理卢言霞向记者表示,近五年来,中国 AI 市场成就斐然,2018 年中国软件市场占据全球软件市场规模的 3.1%,中国人工智能软件市场占据全球的 15.4%,未来还有更大的增长空间。终端 AI 俨然是落地应用中的重要支持点。

 

终端 AI 应用量最大,算力和功耗是两大难题

 

图:清华大学微纳电子学系主任魏少军

 

4 月 9 日,清华大学微纳电子学系主任魏少军在人工智能创新峰会上表示,从应用需求端来看,我们发现应用量最大的并不在云端,而是在终端,ARm 公司的专家把人工智能分成“大机器学习”、“中机器学习”和“小机器学习”,三者之间在数量上依次有二次方的增加,从 108、1010 再到 1012。但当 AI 服务从云端走向终端时,要克服的困难远远比在云端大得多。

 

在边缘上,资源和功耗都是受限的,而要解决 AI 问题,算力仍然需要那么大。换句话说,算力需求没变,但资源不足,难度自然变大。这里面涉及两个关键问题,一个是算力本身,一个是功耗。

 

在智能系统中,最重要的功能是实现智能化,软件承载了智能化的理念和方法,而硬件只是承载智能化所需要的计算。如果能把两者有机融合在一起,让硬件在任何时候都能提供软件运行所需的最佳计算效率,就能够得到我们所需的理想计算模式。

 

持续创新!推出性能功耗比好的终端 AI 产品,抢占市场先机

 

图:寒武纪创始人陈天石

 

寒武纪是国际上最早从事 AI 芯片研发的团队之一,研发的终端智能处理器已经运行在数千万的终端设备中,研发的云端智能芯片为云端大规模智能处理提供了高性能和高性价比的芯片方案,推动人工智能计算力突破和提升。

 

陈天石描述寒武纪公司的战略目标:“3 年内占领 10 亿智能 AI 终端,占领中国云端高性能芯片 1/3 市场份额”。在市场策略层面,如何与英伟达竞争,陈天石告诉媒体:“提供性能功耗比更好的芯片。这个市场很大,其实未见得是零和博弈。”

 

早在 2016 年,寒武纪就研发了全球第一款商用终端 AI 处理器,早于国外同行两年,寒武纪的 1A 处理器是世界上首款智能终端处理器 IP 产品。第一代 1A 已经在四款华为手机中使用。

 

第二款寒武纪的 IP 1H 是第二代高性能、低功耗的智能终端 IP 产品,在 2017 年 11 月公开发布,这款处理器带来了深度学习处理速度的提升和功耗的降低,在寒武纪 1H 带来了 AI 算力的大幅提升,使能和增强人脸识别、物体识别、物体检测、图像分割、智能翻译等 AI 场景,实现了从图像识别到物体检测的跨越。在苏黎世联邦理工学院的 AI Benchmark 测试中,搭载麒麟 980(集成寒武纪 1H)的华为 Mate20 Pro、Mate 20 X 和 Mate 20,超过了搭载麒麟 970 的华为 P20 Pro,排在了榜首。

 

2018 年 5 月,寒武纪正式发布了多个最新一代终端 IP 产品——采用 7nm 工艺的终端芯片 Cambricon 1M、首款云端智能芯片 MLU100 及搭载了 MLU100 的云端智能处理计算卡。

 

寒武纪创始人陈天石博士对公司的定位是,独立芯片公司,服务广大云计算、大数据、服务器厂商、互联网公司和行业巨头,为下游厂商提供不同尺寸、面向不同应用场景的终端 AI 处理器 Ip 以及覆盖 interference 和 training 的不同处理能力的云端智能芯片。随着华为智能手机在全球市场份额的不断提升,寒武纪在终端 AI 芯片市场的认可度也不断提升。

 

在物联网应用中,如何实现无处不在的 AI 应用?

 

图:清华大学微纳电子系副主任尹首一教授

 

智能终端的 AI 计算成为趋势。考虑通讯延时、基于硬件设备、个人隐私考虑,我们需要在终端设备、传感器,各种设备端上实现 AI 计算。这已经成为电子行业的巨头共识,百分之九十以上的物联网设备上使用 cpu 是 arm 公司提供的内核,Google 首席科学家在全球半导体大会上报告上说,Google 认为,IoT 景下,未来 AI 计算一定是分布式、分层次、分等级的综合系统。

 

要满足各种场景下 AI 计算的需求,需要考虑算力和功耗问题的平衡。例如智能手机对语音技术的应用,智能家电中有严苛的功耗约束,因而要在功耗受限场景下实现 AI 算法和运算就成为关键。

 

算力与场景结合,联发科在终端 AI 运用领域不断突破

联发科技副总经理暨家庭娱乐事业群总经理游人杰表示,人工智能的崛起与以往不同,人工智能进入第三次革命,需要三种关键因素的配合:第一、物联网产生的大数据,第二、各种应用层应用多元化,尤其在 2012 年,Deep Learning 新的演算法开发出来后,运算能力、精确率和收敛速度有了很大突破。不仅在云端,或者在终端,能力够强。第三、算力(computation)的不断提升。

 

图:联发科技副总经理暨家庭娱乐事业群总经理游人杰

 

目前,联发科的芯片方案已经占据了智能音箱垂直市场份额的 60%-70%,大幅度领先竞争对手。联发科的优势是将智能音箱方案拥有更高的硬件整合度。把第一代 IC 周边电子元器件、电路等全部集成在第二代 IC 中,同时在软件层面开发更智能的工具 Power AQ,可通过 Power AQ 有效调整智能音箱的音质,加速硬件厂商把产品推向市场。

 

2019 年 4 月 18 日,联发科技发布 AIoT 平台, 包含拥有高集成度和高端 APU 性能的 i300 和 i500 系列处理器芯片,为业界提供面向智能家居、智慧城市和智能工厂三大领域的解决方案,助力人工智能技术和物联网技术的落地融合。

 

最早,联发科看到了人工智能在移动手机的应用商机,自 2018 年初起,就推出了 NeuroPIlot 的技术,并将之首次运用在其手机处理平台曦力 P60 上。NeuroPilot 是基于他们的核心监控与调节技术 CorePilot 的进阶版。CorePilot 在 2014 年就已经被开发出来,其主要作用就是动态监控手机多核处理器的每个核心的工作负载量,并加调节和分配,以提高手机运行的性能并降低电耗。

 

i500 高性能解决方案则是基于强大的计算能力, 结合联发科技的人工智能平台 NeuroPilot,搭配低时延的边缘 AI 处理技术,提供精准的人脸、行为和环境识别分析,大幅度提升准确度、生产效率和智能化水平。

 

游人杰指出,对于不同的芯片公司,最大的区别就是运算能力的差别。运算的处理能力在晶片里面是三个单元结合起来,我们称之为联合运算能力。

 

CPU+gpu+Deep Learning 加速器 ,联发科内部做到 CPU 八核,CPU 的运算好处是可以透过软件的规划,让演算方法在开发的过程中拥有最大的弹性。第二、GPU 的运算能力,在人工智能的开发过程中,同时具备高的处理速度,还能提供中等的弹性度。第三、当你的演算方法做到比较成熟后,晶片运算功率做到更低,还需要做 AI 的 Processing,做 Deep Learning 加速器或者是做视觉影像的处理器,能够让演算法找到最低的功耗处理。

 

小结

终端 AI 的进程在不断加速,随着寒武纪、MTK、耐能等国内国际厂商不断推出新品,未来在未联网应用的细分市场,会逐步诞生应用的前三甲企业,在无人机、智能家居、智能硬件、智能手机都是 AI 未来应用增长点。

 

企业必须研究好消费者需求的转变,在技术能力和市场需求结合的契合度上下大功夫,在算力提升、功耗降低和运算架构支持多元应用不断拓展,才能领先海外厂商,抢占市场的先机。