AI大模型的突破,进一步增强了人工智能的通用性,也让广大开发者可以更低成本、更低门槛地开发AI模型,促进人工智能的广泛应用。5月20日举行的WAVE SUMMIT 2022深度学习开发者峰会上,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,今年是大模型产业落地的关键年,大模型与真实场景需求的有效匹配是落地要解决的关键问题。她给出了支撑大模型产业落地的三个关键路径:建设更适配场景需求的大模型体系,提供全流程支持应用落地的工具和方法,营造激发创新的开放生态。

 

沿着这样的思路,飞桨文心大模型全景图全面升级,发布10个大模型,形成了涵盖基础大模型、任务大模型、行业大模型的三级体系,全面满足产业应用需求;发布大模型开发套件、API和内置了文心大模型能力的EasyDL和BML开发平台,全方位降低应用门槛;共创共享飞桨生态,同时建设大模型创意和探索社区旸谷,让更多人零距离体验最先进的AI大模型技术,激发创新与创意。

 


值得关注的是业界首发的文心·行业大模型。文心·行业大模型基于通用数据训练的文心大模型,加上行业应用场景中大量存在着行业特有的大数据和知识,结合行业相关的创新算法设计,将进一步提升大模型对行业应用的适配性。吴甜介绍,在能源电力和金融领域,文心联合国家电网研发了知识增强的电力行业NLP大模型国网-百度·文心,联合浦发银行研发了知识增强的金融行业NLP大模型浦发-百度·文心,目前已在电力、金融相关任务上取得显著的效果提升。

 


 
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜

 

除行业大模型外,此次还发布文心基础大模型和任务大模型共八个,包括:融合任务相关知识的千亿大模型ERNIE 3.0 Zeus,多任务视觉表征学习VIMER-UFO 2.0、商品图文搜索表征学习VIMER-UMS、文档图像表征学习VIMER-StrucTexT 2.0,语音-语言跨模态大模型ERNIE-SAT、地理-语言跨模态大模型ERNIE-GeoL,以及面向生物计算领域的化合物表征学习HELIX-GEM和蛋白质结构分析HELIX-Fold。


飞桨继续夯实AI技术底座

 

除了文心大模型的重要升级,峰会上还发布了飞桨平台的最新成果。数据显示,截至2022年5月,飞桨凝聚477万开发者,创造56万个模型,服务18万企事业单位,产学研用紧密协同培养超过200万AI人才,推动了人工智能技术、产业和生态的蓬勃发展。

 

飞桨作为可与国际主流深度学习框架TensorFlow、PyTorch三强鼎立的深度学习框架,对我国AI产业的发展具有重要意义。深度学习框架在AI产业链的位置,可以类比PC时代的操作系统Windows、移动时代的操作系统iOS和安卓。不论从技术的位置还是从生态的特点来说,深度学习框架,都处于非常核心的位置,深度学习框架的自立自强至关重要。

 

IDC报告显示,2021年飞桨位居中国深度学习平台市场综合份额第一。此次峰会上,飞桨在技术、场景、生态三大领域持续深入,带来六大全新发布,夯实AI工业大生产的技术底座,加速AI规模化落地。

 

作为业内最早提出并实现动静统一开发模式的深度学习框架,飞桨发布开源框架v2.3版;深入结合场景需要,发布训推一体导航图、产业模型选型工具、飞桨移动工作站,为AI应用落地提供“快速直达目的地的智能导航”和一站式便携方案;发布PaddleScience赛桨,促进数据驱动和理论推演两大科研范式的深度融合,加速前沿技术创新和应用落地;发布深度学习实践教辅书,助力AI人才培养。

 

此外,飞桨大航海2.0新增面向三个领域的共创计划,包括飞桨产业实践范例库、飞桨AI for Science,以及飞桨硬件生态共创计划。

 

国产AI生态圈“软硬一体”、“框架+芯片”加速适配

 

深度学习框架和AI芯片一起共同构成了人工智能的基础设施。一直以来,飞桨注重与芯片厂商深度适配并融合创新,形成软硬协同优势。

 

飞桨与硬件伙伴的合作在逐年深入。2020年“共聚”,飞桨与13家硬件伙伴联合发起了飞桨硬件生态圈,促进AI产业链的适配升级;2021年“共研”,飞桨与硬件伙伴软硬一体联合优化,适配飞桨的芯片/IP超过30种;今年合作进一步深化,全面共创,协同推出厂商版飞桨框架、建设模型库、开发课程,以更好地服务开发者。


写在最后

 

目前,飞桨已构建了布局较全、适宜产业应用的模型库体系;大模型作为AI基础设施的一部分,进一步拓宽了AI技术落地的场景覆盖广度,更加深了产业应用的深度。

 

依托飞桨平台,大模型等技术已经在制造、城市、能源、金融、媒体等各行各业广泛应用,并催生了AI训练师、5G云代驾、智能办公等新业态、新模式。通过飞桨平台与大模型的共同创新,将助力AI越来越普惠,赋能千行百业,惠及千家万户。