2020 年已经过去,无论我们过得顺遂平安,还是过得无比艰难,我们应该都会记住这一年。

 

回顾 2020 年,在这个不同寻常的疫情之年,科技成为人类抗击疫情的关键,而人工智能技术投入抗疫战争之中,可以说是人类有史以来的第一次。而与此同时,AI 技术已经在我们的生产生活、公共管理等方方面面得到深入应用。

 

人工智能应用场景的爆发,其背后是全球 AI 科技企业从后端走向前台,从实验室走向产业纵深的努力和实践。

 

最近,百度和谷歌不约而同都发发布了长文,来总结 2020 的 AI 发展。

 

谷歌首席 AI 科学家 Jeff Dean 在谷歌博客上刊出了Google Research: Looking Back at 2020, and Forward to 2021的万字长文,详细介绍了谷歌在 2020 年 AI 技术在多个领域取得的应用进展。

 

 

而更早一点时间,百度先后发布了长达万字的《百度 AI 的 2020》和《百度研究院 2021 年十大科技趋势预测》,同样细数了百度过去一年里在 AI 技术业务体系和产业赋能体系中的各项成果,同时也对 2021 年的 AI 技术和应用领域做出清晰判断。

 

 

如果仔细对比谷歌和百度在 AI 技术和产业应用的实践,我们就会惊讶地发现,两家几乎同时以搜索引擎业务起家的公司已经将 AI 技术应用到自身产品体系的方方面面。

 

我们同时也看到,谷歌和百度正在构建一幅千行百业智能化的全球 AI 图景,不过两家巨头的不同之处在于,相较于谷歌更多进行多领域、多尝试性的产业 AI 合作,百度则是更系统地推动产业智能化的应用落地。

 

站在 2020 和 2021 的时间交汇处,我们想要了解全球 AI 技术的整体样貌和发展进程,深入谷歌和百度的 AI 体系之中,无疑是一次非常好的契机。

 

技术基石:谷歌和百度的 AI 基础研究

AI 技术之所以能够持续推动产业的智能升级,为企业、行业和社会带来价值,其核心就在于 AI 基础技术的持续进化。

 

我们看到,在 2020 年谷歌和百度的 AI 基础研究中,都在关注无监督学习、AutoML(自动机器学习)、机器感知这三大领域,其中谷歌在这些领域都提出了一些基础性算法的创新。

 

比如在机器学习(ML)算法领域,谷歌的无监督学习领域取得了一定的发展。去年,谷歌开发了名为 SimCLR 的自监督和半监督学习技术,可以实现同时最大化同一图像的不同变换视图之间的一致性和最小化不同图像的变换视图之间的一致性。

 

 

在 AutoML 上,谷歌正在尝试从 AutoML-Zero 的学习代码运算中采取一种由原始运算(加减法、变量赋值和矩阵乘法)组成的搜索空间,以期用来从头开始演绎现代的机器学习算法。而在机器感知领域,也就是机器如何感知、理解我们周围世界的多模态信息上,谷歌也取得众多成果,包括 CvxNet、3D 形状的深层隐式函数、神经体素渲染和 CoReNet 等算法模型的推出,在户外场景分割、三维人体形状建模、图像视频压缩等场景的实际应用。

 

 

而百度的 AI 技术的底层创新则是通过百度大脑 6.0 的大幅进化所推动。2020 年,百度大脑 6.0 核心技术突破了“知识增强的跨模态深度语义理解”能力,结合知识图谱与深度学习技术,使得人工智能不仅能具备知识,还能持续学习,像人一样“活到老学到老”。

 

目前在 AI 技术周期中非常重要的多模态语义理解领域,百度大脑推出了多模态预训练模型 ERNIE-ViL,显著增强了跨模态的语义理解能力,刷新了 5 项多模态经典任务的世界最好效果,并登顶视觉常识推理任务(VCR)榜首。在对话智能领域,百度大脑发布超大规模开放域对话生成网络 PLATO-2,该模型参数规模上升到 16 亿,在内容丰富性和连贯性上达到新高度,能够就开放域话题进行流畅深入的聊天。在端到端问答方面,百度大脑提出 RocketQA 训练方法,大幅提升了对偶式检索模型效果,为实现端到端问答迈出了重要一步。

 

而在前沿技术上,谷歌和百度都在积极布局量子计算技术,量子计算被视为面向未来的计算范式与生产力。

 

在 2020 年,谷歌对新的量子算法进行了验证,在 Sycamore 处理器上执行了精准校准,显示量子机器学习的优势或测试量子增强优化;通过 QSIM 模拟工具,在 Google Cloud 上开发和测试了多达 40 个量子比特的量子算法。接下来谷歌将按照技术路线图,建立通用的纠错量子计算机,证明量子纠错可以在实践中发挥实际作用。

 

同样在去年,百度发布了国内首个云原生量子计算平台量易伏 Quantum Leaf,提供 QCompute 等量子开发套件,缩短量子编程全生命周期,实现量子工具链闭环;此外,量子脉冲计算服务量脉 Quanlse、量子机器学习工具集量桨 Paddle Quantum 全面升级,构建起百度量子平台为核心的量子生态,开启属于中国的量子时代。

 

 

在 AI 技术开源和开发,推动 AI 生态发展上面,谷歌和百度同样在持续行动。谷歌通过 TensorFlow 社区推动了一系列特殊兴趣组、TensorFlow 用户组、TensorFlow 证书、AI 服务合作伙伴的出现和成长;谷歌还投资了一个开源的、专注于研究的 ML 系统 JAX,可以广泛应用于差异隐私、神经渲染、物理信息网络、快速注意、分子动力学、张量网络、神经切线核和神经 ODEs 等技术领域。此外,谷歌通过 TFRC 项目向世界各地的研究人员免费提供了超过 500petaflops 的云 TPU 计算能力,以帮助拓宽对机器学习研究前沿的访问。今年,TFRC 项目除了支持 TensorFlow 之外,还将支持 JAX 和 PyTorch。

 

而在去年,百度飞桨推进了“AI 开发基线”,提升了软硬件体系的适配能力。目前,飞桨已经凝聚了 265 万开发者,服务了 10 万家企业,创造了 34 万个模型,在城市、工业、电力、通信等很多关乎国计民生的领域都有飞桨在发挥作用。

 

根据权威数据调研机构 IDC 公布的 2020 年下半年深度学习框架平台市场份额报告中,百度与 Google、Facebook 居于中国深度学习平台市场综合份额前三,其中,百度综合市场份额位列第二,与位列第一的 Google 几乎持平。

 

业务生长:谷歌和百度的 AI 应用图景

我们看到,在 AI 的基础技术研发上,谷歌和百度在整体的技术路线和技术生态上有许多重合之处,不过两家各有侧重的 AI 技术则构成了谷歌和百度在其各自庞大的产品体系上的差异化应用。

 

过去的一年中,谷歌正在将一系列 AI 的技术创新应用在其产品系统的方方面面。

 

通过机器学习算法的改进,谷歌在移动设备上的体验得到大幅改善。在设备上运行复杂的 NLP 技术,实现更加自然的对话功能,比如,基于 transformer 这一神经网络模型,去年谷歌正创建了一个对话机器人 Meena,几乎可以实现任何挑战的自然对话。此外,还有像利用双工技术给企业打电话,确认疫情下是否临时关闭之类的事情,实现在全球范围内对商业信息进行 300 万次更新,在地图和搜索上信息显示次数超过 200 亿次。

 

 

通过机器翻译和语音识别技术的升级,谷歌还使用了文本到语音技术,通过支持 42 种语言的 Google Assistant 可以大声朗读网页,从而更方便地访问网页。借助多语言传输、多任务学习等多种技术,谷歌在 100 多种语言的翻译质量上评价提高 5 个 BLEU 点,能够更好地利用单语数据来改进低资源语言,为那些少数族裔的人们提供翻译。

 

从 Jeff Dean 的介绍中,我们还看到谷歌的 AI 技术正在无数的谷歌产品的细节中得到应用。

 

比如,结合跨模态推理以及有效感知方法的开发,谷歌在 MediaPipe 中开发了多种新的感知推理功能和解决方案,如设备上的人脸、手和姿势预测、实时身体姿势跟踪、实时虹膜跟踪和深度估计以及实时 3D 目标检测。在 YouTube 上,识别潜在的有害内容,提高人工审查效率;通过自动增强声音和减少背景噪音,帮助 YouTube 创作者制作更好的视频。在 Google Meet 中,通过模糊背景来改进线上虚拟会议。

 

AI 技术赋能业务,业务又反向推动 AI 技术升级,同样是百度 AI 带给百度产品业务体系的发展路线。

 

在移动生态中,百度展示了 AI 技术与移动服务的高度结合。在 AI 技术的加持下,百家号、智能小程序和托管页,三大支柱产品迅速发展成为国内领先的内容和服务接入平台。

 

基于自然语言处理、知识图谱、语音、视觉、深度学习等 AI 技术能力,百度搜索也在持续智能化。今年 9 月,百度推出虚拟助手“度晓晓”App,拥有二次元虚拟人物形象和独特的情感交互系统,可以像真人一样跟用户沟通,提供更好的个性化服务。

 

在地图领域,百度地图坚守“新一代人工智能地图”的 AI 优势和创新能力。目前百度地图 90%以上的数据生产环节实现 AI 化,输出九大行业解决方案,全景地图覆盖全国 95%以上的城市,覆盖里程超过 300 万公里。与此同时,语音交互场景实现迅速增长,百度地图智能语音助手用户量已破 4 亿。

 

(百度地图 AI 室内通)

 

在输入法领域,在 AI 技术的赋能下,百度输入法实现了市场份额与活跃用户量跃居行业第一。百度输入法的语音输入能力持续突破,成为业内首个日均语音请求量破 10 亿次大关的输入法产品,实现了 98.6%的语音识别准确率、离线中英自由说新功能、方言自由说升级等功能或技术突破,目前已成为语音输入渗透率最高的第三方手机输入法;语音输入与手写输入等 AI 功能取得重大行业突破,用户认可程度高,手写识别准确率提升至 96%居行业首位、AI 滑行输入精准率超越行业最高水平 15%。

 

 

对于小度来说,2020 年则是依靠领先智能化技术持续“破圈的一年。目前,小度第一方设备语音交互次数达到 33 亿次;截至 9 月,小度助手技能商店提供 4300 个技能,开发者数量也已达到 45000 人,使用场景也从家庭、酒店、汽车拓展到移动场景。硬件方面,国际权威调研机构 Canalys 数据显示,2020 年上半年小度智能音箱全品类出货量位居国内第一;前三季度,小度智能屏出货量稳居全球第一。618 和双十一期间,小度均斩获全平台智能音箱品类销售额冠军,全平台智能屏品类销量&销售额双冠王。

 

 

而在自动驾驶与智能交通领域,百度 Apollo 也迎来了持续爆发。2020 年,百度先后在长沙、沧州、北京开放 Apollo Go 自动驾驶出行服务。10 月 12 日当天北京地区呼单量突破 2600 单,百度也成为中国唯一一家在多城开启 Robotaxi 试运营的公司。5 月 26 日,百度位于北京亦庄经济开发区的全球最大的自动驾驶和车路协同应用测试基地 Apollo Park 建造完成,这将加速推进 Apollo 自动驾驶、车路协同技术产品的成熟和应用。

 

 

2020 年,百度的 AI 技术不仅有效支撑了百度业务体系的全线向好,同时也开始广泛赋能各产业,在 B 端市场掀起智能化升级的浪潮。

 

产业赋能:谷歌和百度 AI 产业化的不同路向

在 AI 产业化和产业智能化上面,我们也可以看到,谷歌同样在展开一些跨行业、跨地区的 AI 技术应用落地,特别是在新冠疫情之下对社区大数据管理、流行病防控以及医学研究等领域提供了一系列解决方案,但并未形成体系化的产业级应用实践。

 

比如,去年疫情之下,谷歌破天荒的和苹果合作,联合推出了支持蓝牙隐私保护技术的暴露通知系统(ENS),以及时通知用户避免接触检测呈现阳性的感染者人群中。同时,谷歌也在利用用户的匿名搜索数据来预测新冠病毒传播和症状搜索相关的数据。

 

在生物医学领域,谷歌去年实现了对果蝇的半脑连接体大型突触分辨率图的大规模机器学习模型重建,从而帮助神经科学家更好地了解大脑的功能;与制药公司合作,通过 ML 对有前景的分子化合物进行“虚拟筛选”。

 

同样,谷歌的深度学习模型已经应用在医学领域,去识别疾病的发生率;在城市治理中,去预测一个具体地区的降水量,也能帮助一些洪水频发的国家来进行更准确的水位预测和洪水预报。

 

 

与谷歌不同的是,百度不仅在疫情防治中贡献了众多的 AI 方案,也正在通过体系化产业战略,全方面与不同领域的实体产业结合,形成联接更为广泛的 AI 产业方案。

 

在疫情之下,百度的 AI 测温、AI 问诊、智能外呼、服务机器人等创新应用开始大规模普及,体现着 AI 技术在服务社会、科技向善上的技术温度和企业的社会责任。

 

而在疫情之后,AI 将进一步与城市、交通、工业等基础产业融合,推动复工复产,促进社会经济发展。

 

基于这一业务战略,百度在去年 5 月,明确提出了 “以云计算为基础,以 AI 为抓手,聚焦重要赛道”的“云智一体”的百度智能云的全新发展战略。

 

为了更好地执行新战略,百度智能云对业务架构进行了调整。新架构分为三层,底层是百度核心技术引擎百度大脑。中间是平台,包括通用的基础云平台、AI 中台、知识中台,以及针对场景的平台和其他关键组件。在基础层和平台的支持下,上层的智能应用和解决方案将为各行各业赋能。

 

为了满足产业应用的规模化生产,百度智能云提出了 AI-Native 的云计算架构。在基础设施的 AI 计算集群、AI 芯片到工程平台的飞桨、云原生以及到应用平台的视频云、区块链等,通过云智一体,端到端的方式,便捷高效的支持产业的智能应用。基于“壮智凌云”加速产业智能化,将 AI 技术无缝接入千行百业,成为了众多产业这一年发展的全新契机。

 

基于此,我们可以看到百度 AI 技术创新实现了与社会经济、产业智能化升级之间的外循环建设,打造了不同行业的智能化样板与融合基础。

 

在智慧城市领域,百度智慧城市解决方案以自主创新的基础设施为底座,包括城市的感知中台、AI 中台、数据中台、知识中台以及城市智能交互中台,帮助城市提升智能化的水平,赋能公共安全、应急管理、智能交通、城市管理、智慧教育等场景。目前这一解决方案在北京海淀、重庆、成都、苏州、宁波、丽江等 10+省市落地应用。

 

在数字金融领域,百度智能云已经服务了近 200 家金融客户,其中包括国有 6 大银行、9 大股份制银行、21 家保险机构,涉及营销、风控等十几个金融场景。并且构建了超过 30 家的合作伙伴生态,跻身中国金融云解决方案领域第一阵营。

 

 

在智慧医疗领域,百度智慧医疗“灵医智惠”已经服务 300+家医院和 1500+家基层医疗机构,辅助数万名医生,惠及超过千万患者。

 

在工业互联网领域,百度工业互联网助力企业及上下游产业实现数字化、网络化、智能化。百度智能云提供的智能制造解决方案,覆盖 14 大行业,100 多家企业,30 多个合作伙伴,触达 50 多类垂直场景,在 3C、汽车、钢铁、能源等行业已规模落地。

 

在智能办公领域,2020 年 5 月百度宣布依托“AI 中台”和“知识中台”,发布“智能办公”的企业智能应用“如流”,构建 AI 时代办公流水线,打造新一代人工智能办公平台。百度如流已经全面升级为新一代智能工作平台,用 AI 赋能企业实现智能化转型,实现对企业工作模式的全方位、智能化的支撑,从个人到组织,从业务到运营的全场景服务。

 

 

AI 技术的赋能,不仅体现在对实体产业的智能化升级上,同样也体现在服务社会的共同责任上面。

 

正如谷歌在对视听障碍人士所设计的物品包装识别应用、视频会议的自动手语检测系统已于,AI 技术也正在显示其造福社会、服务大众的“科技向善”的伦理精神。

 

 

同样,百度也秉承“科技为更好”的理念,践行企业公民的社会责任。比如,百度早已将 AI 技术用于寻人的公益事业中,截止到 2020 年 12 月,百度 AI 寻人已经累计帮助了近 12000 个家庭团聚。再比如,百度 AI 持续支持文化保护、动物保护,例如百度和国际爱护动物基金会 IFAW 合作,推出全球首个利用人工智能技术打击野生动物制品非法贸易的平台。与国家地理达成合作,通过百度 AI 图像识别能力提高蝴蝶物种识别效率,为蝴蝶物种的保护和研究提供技术支持。百度和清华大学、中国古迹遗址保护协会等机构合作,利用人工智能技术识别国宝级古建筑内外的微小变化,保证及时修缮;乐山大佛、广元千佛崖等重要文物管理和保护已经开始应用百度的 AI 技术。

 

我们发现,随着 AI 技术在全社会生产、生活中的普及应用,人工智能作为推动经济发展、社会进步的正向力量,其价值正在越发凸显。

 

结语:同向前行,各美其美

2020 年,对于世界来说是深刻影响政治经济格局的一个年份,同时也是新技术浪潮引领下的全球科技产业发生巨变的一年,通信、出行、互联网以及诸如能源、工业等传统产业等领域都面临新旧技术范式和势力范围的对决和权力争夺。

 

AI 技术,尽管在这一年并没有在基础算法领域出现多少显著突破,但是 AI 技术正在从少数科技公司的研究成果全面向各行各业的产业纵深渗透。AI 技术在 2020 年,成为各行业、产业进行数字化、智能化升级的关键要素。

 

从对谷歌和百度的 2020 年 AI 技术的演进和产业化成果的梳理,我们可以得出以下结论:

 

第一,AI 的基础技术仍然在稳步推进,算法、算力和开发工具的成熟演进仍然是 AI 平台效率提升的有效手段。在这一层面,谷歌和百度保持了大方向上的同频,只是根据两家在产品体系和研发侧重点的不同,呈现出具体的技术路线的差异。

 

 

第二,随着 AI 技术和开发平台的愈加成熟,AI 进入正在渗透到云、边、端等数字化场景的方方面面,谷歌如此,百度更是如此。

 

第三,在 AI 产业化方面,谷歌尚未进行更为体系性地战略制定和推广,而是与不同领域的公司、结构保持零星、松散的合作,而在中国,由于面临着更为紧迫的产业升级的竞赛和 AI 企业之间的激烈竞争,AI 产业化的推进速度和强度都可能远超国外市场。率先在 AI 技术领域发力的百度成为这场产业数字智能化变革的中坚推动力量。而构建“云智一体”这样的系统性 AI 产业战略方案,成为百度在这场新技术产业变革下的核心机遇所在。

 

告别 2020 年,原来有如此多的 AI 景象值得我们盘点,而面向 2021,AI 技术在更多业务和产业场景的爆发,相信一定也不会让我们失望。