作为数字经济转型升级的重要推动力和从新一轮科技竞赛中脱颖而出的关键加持,AI在过去5-10年,展现出了非常迅猛的发展势头。中国AI领域的投资次数和总量已经达到世界第一;知识产权方面的创新数量,达到全球数一数二的水平。从整个市场来看,2019年AI体量达到了100亿美金,预计2022年会翻番,达到270亿美金。

 

AI行业应用和企业自身,也在过去几年实现了很大的转变。早期的AI更多应用于消费者行业类别,比如语音识别、网络搜索。过去几年,AI逐渐走入垂直行业,比如安防、金融等。企业也纷纷进行转型,从早期以技术驱动为动力,走向了技术驱动和商业驱动结合的方向。

 

下一步,随着5G使数据高速迁移,加上AI以及边缘计算的爆发,更多跨行业的创新将成为可能,跨界多领域的合作将成为AI未来的新常态。

 

随之而来,一个巨大的行业痛点也浮出水面:在跨领域AI应用的过程中,既对场景和业务有深入了解,又精通AI技术的交叉复合型人才少之又少,成为AI落地的一个主要障碍。

 

Intel、百度、微软如何看待AI人才现状?

 

对于AI专业人才的培养,实践与理论的结合必不可少,产、学、研的通力合作,是未来对AI人才培养的关键。那么,处于AI前沿阵地的企业,如何看待当前AI的人才需求与培养情况?又将如何支持并发挥协同作用赋能AI人才发展呢?

 

Intel物联网事业部副总裁、中国区总经理陈伟博士认为,AI的跨界合作产生了一些新领域,包括研发、学术、工程、落地实践等,造成了传统教育、培训机制和需求现状的不对等。要使AI继续向前、取得更好的发展,要从整体上来看待现在的问题。他认为,人才瓶颈主要体现在以下三方面:

 

第一,人才结构并不均匀。即便在算法中,包括算法本身的研究和算法的应用,而这需要了解场景,这个现象在过去10年中是指数级爆发的;第二,AI模型不管是后端训练,还是前端的业务模型推理,甚至未来训练可能在边缘区域中也同时发生,这些方面相关的知识培训不够均衡;第三,业界普遍会追求爆发点比较高的学科,比如机器学习、深度学习,而忽略了传统的比如计算机视觉这种普遍运用的学科。

 

百度作为中国本土成长起来的企业,在AI领域的探索和创新已经走在前列,业务包括搜索、信息流、小度音箱、无人驾驶等,本质上都是依赖于AI技术,包括深度学习技术在内的理论和技术突破。

 

百度AI技术生态部总经理刘倩表示,AI应用比传统软件多了一个维度——就是算法。以前可能是工程加上业务,现在则是工程、算法加业务的三维组成,多了一个维度后,复合型人才的培养挑战和应用挑战会更大。

 

她认为,高校有体系化的人才培养机制,企业对于产业应用中的任务和挑战有深刻体会,因此,产教融合、产学研合作的加强很有必要。百度秉持开源开放的理念,一方面,高校的老师、学生可以针对基础理论进行前沿研究探索,另一方面,这些技术研究可以更加快速地转化为产业应用进行落地,因此,整个过程能够更好地促进产业应用进程。她强调,AI最终是一个底层的技术,相应的人才培养应该向更早期布局,大学、中学甚至是往小学阶段就应该开始对技术或业务应用的理解。

 

微软(中国)首席技术官韦青认为,三类人才极度缺乏,而这也是未来的发展机会。首先,懂业务的人不懂IT或AI的边界,而懂AI、机器学习算法的人又不懂业务的机理。能够把AI算法和业务机理结合在一起为行业所用的人才,可以说是微乎其微的。第二,不论是AI还是机器学习,从行业内涵来看才刚刚起步。到底应该怎么去算、去部署、去迭代,有一整套方法论,而这些远不成熟,在运营方面也是一个很大的缺口。第三,AI和机器学习最终还是以算为主,数据的形式和计算的效率需要持续提高,暴力算法并不可行,因为能源有很大缺口,国家的目标是要碳达峰、碳中和。基于这些,韦青表示,在工程落地实现中,做到更便宜、更快或更方便还不够,接下来的竞争中,很大的挑战是优化细节,这需要行业认知的积累、计算能力和算法的综合性突破。


AI人才缺口呈倒金字塔,解决瓶颈需从理论研究突破

 

Intel物联网事业部中国区首席技术官及高级首席工程师张宇博士谈到,目前的人才断层和人才需求的现状呈倒金字塔结构,越往上越需要的是复合型人才,而缺口相对来说较大。目前在金字塔底层,懂AI技术的人才规模增长得已经比较快了。因为近年来学校培养了大量具有基础知识的AI开发人员,人才规模比较庞大。下一步,如何让这些人才,在今后的实践过程中更好地与行业需求结合起来,是全行业需要共同推进的方向,也是Intel的社区、合作伙伴今后的工作重点。

 

回顾AI在整个科技史上的发展,经历了高高低低、起伏前进的曲折过程。这一轮AI发展大约始于2012年,当时AlexNex在ImageNet竞赛中被使用并取得了亮眼成绩,正式开启了以卷积神经网络为基础的深度学习热潮。张宇认为,当前这轮人工智能的发展热潮和上世纪90年代时相比,的确有提升很大的一面,但是也有裹足不前的一面。

 

首先,算力得到了极大的提升,以最能体现人类计算能力的超算为例,以每秒浮点运算的次数作为衡量标准,当下超算的水平比上世纪90年代约提升了150万倍。这样大的算力提升带来了什么结果?可以帮助在AI训练和推理过程中,对一个很复杂的模型,在相对更短的时间内得出结果。这样就便于不断迭代、试错,直到最后得到满足实际场景需求的、能够真正落地的模型。而在过去,AI只能作为学术研究应用。正是由于算力的不断提升,使得AI在行业的可用性极大提升了。

 

数据也在这一轮AI高潮中发挥了非常大的作用。张宇指出,这一轮AI的发展,编程方式和以往有所区别,以前的编程是把整个算法按照一个逻辑思维写出来,按照程序语言编写出来。而现在的AI是数据驱动的,通过数据驱动的方式自动生成训练好的模型,再对这个模型进行推理。

 

那么,什么又是裹足不前、需要大力提升的呢?张宇认为是人工智能的理论方面。他解释,当前的AI可以看作是一个“黑盒子”,有了AI模型之后,通过在某些特定场景所收集到的数据来进行训练,然后投入使用。至于模型为什么是有效的?背后的理论基础是什么?其实目前并没有真正弄清楚,这也就是说,现在没有一个完备的模型支撑AI现在的发展。

 

这就带来一个直接问题:AI算法只能留有大量的算力冗余,这也是为什么现在学术界、企业界在致力于AI的进一步优化,或者通过网络压缩去做减枝、量化、压缩。目的就是希望把可以节省的计算量或计算负荷,从网络中剔除,而又不影响最终的处理结果。

 

AI在基础理论上的瓶颈,也造成了AI在落地场景中的落差,即在某些场景可能有效,但换一个场景就不见得有效,对适用场景有较大的限制。

 

未来如何解决当前的瓶颈和应用落差?张宇表示,理论上的不断完善,需要产业界共同努力。但是,AI不是放之四海而皆准的方法,有各自的使用场景。Intel正在和行业合作伙伴一起努力,希望找到某些特定AI算法和应用最适合的场景,在这些场景中进行推广。同时,考虑到不同场景会有一些共通之处,需要尽可能将AI的方法普适性、泛化能力进一步增强。

 

解决AI黑盒问题:开源开放

 

上海交通大学人工智能研究院总工程师金耀辉教授谈到了开源、开放对AI发展的重要意义。他表示,AI是一个集算力、算法、数据、场景、合规的完整体系,它不只是某一个软件代码的开源,或是某一个数据的开放,而是要形成一个体系,因此需要一个一体化的社区来共同推动,这样才能做好大规模协作,才能避免AI应用成为黑盒。他强调,早期的AI项目中可能是一个黑盒,但是随着AI应用继续深入,越是和行业、场景结合,可解释性越会成为一个非常重要的问题。

 

此外,还有一个很重要的问题是“可复现”。比如现在在学术领域发表研究论文可能已经达到了很好的水平,那么能不能应用在实际的业务系统中?或是在不同的应用场景中,换一个场景是否还有效?这些都是“可复现”的范畴。这其中包含了很多工程问题,需要用开源的方法去解决,只有秉持开源开放的心态,才能形成大规模协作。

 

Intel近年在着力推进开源社区的建设,三年前推出的OpenVINO软件工具,为边缘计算推理提供了硬件基础之上的优化解决方式,使得生态链中的开发者可以通过OpenVINO搭建行业解决方案。基于这一基础,2020年5月,OpenVINO开发者中文社区正式成立,希望用开源、开放、共创精神,为开发者提供互相交流的平台,为AI的下沉和普及提供渠道。


写在最后

 

本文访谈内容来自于Intel日前举办的“为企业寻良将,为人才筑舞台”的研讨会上。同期,Intel联合微软宣布“AI for Earth英梦集结,微AI来战”黑客松大赛,以助力更多开发者实现自我成长。

 

活跃在OpenVINO中文社区的两位代表也出席了本次活动,一位是来自集美大学计算机科学与技术专业的学生陈显森,另一位是计算机视觉工程师兼AI产品经理刘金龙。这些不断壮大的开发者,通过持续不断的内容贡献,与英特尔共建开源开放的技术交流生态,并从中实现了自我提升。

 

AI产业的快速发展加速了市场对AI专业人才的需求,面对正在成长为经济增长新引擎的智能产业,加快相关专业人才培养的步伐迫在眉睫。下一步,Intel希望通过开源社区共建,做好底层技术支持,让开发者、合作伙伴根据特定行业、需求进行下一步优化,帮助他们减少碎片化的工作,尽可能降低AI的落地门槛。

 

从地域分布来看,北、上、深三大区域(包括周边城市)占据AI人才的绝大部分比例。但是,AI在实际应用中是覆盖全国范围的,因此,如何在更广的地域范围推动更加全面的人才培养,也是需要推动的重点。企业的大学合作、行业活动、开发者活动,也需要分散到更多的区域,起到更广泛的覆盖。