腾讯云CEO汤道生详解“模型即服务”

6月19日，腾讯云行业大模型及智能应用技术峰会在京召开，腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生在会上发布了腾讯云MaaS（Model as a Service，模型即服务）服务解决方案，并诠释了腾讯对于MaaS的理解。

记者在峰会现场了解到，腾讯云将基于腾讯TI平台打造行业精选模型商店，覆盖金融文旅、政务、传媒教育等十大行业，提供超过50个解决方案。在这些能力模型的基础上，企业用户只需要加入自己独有的场景数据，就可以快速生成专属模型。

行业大模型仍需针对性“锤炼”

过去半年，整个产业界都在为大语言模型的发展感到兴奋。基于大量的知识与公开信息的训练，大模型已经能够对不同领域的提问生成人性化的回复，能够更连贯的与用户进行交互式对话。越来越多的企业管理者正在思考如何把大模型技术应用到自己的业务场景中，更好地为企业经营管理带来降本增效。

然而，“在具体的企业场景中，通用大模型可能还不能满足很多企业需求，比如它不一定懂行业的专业术语，也不了解企业内部独特的情况，回答会比较虚或者比较笼统，信息也不够及时。”汤道生指出，“大家既期待能力越来越强大的通用大模型，同时也在思考如何在使用大模型的同时保护企业数据产权与隐私，如何降低大模型的使用成本，这些都是企业要考虑的现实问题。”

以基于通用大语言模型的聊天机器人为例，它不一定是大模型唯一的服务方式，也不一定是满足行业场景需求的最优解。基于广泛的公开文献、网络信息去训练大模型存在一定风险。网络信息可能会有错误、有谣言，甚至有偏见，许多专业的知识与行业数据的积累不足，会导致模型的行业针对性与精准度不够，数据噪音过大。然而，在很多的产业场景中，用户对于企业所提供的专业服务要求高，容错性低，一旦企业提供了错误信息，可能会引起不可避免的法律责任与公关危机。

“企业使用的大模型必须可控、可追溯、可修正，而且必须要反复与充分测试，才能上线。我们认为客户需要在具备行业针对性的行业大模型上，加上企业自身的数据去做训练和精调，才能够打造出实用性更高的智能服务大模型。”汤道生表示。他认为，企业所需要的是在实际的场景中真正解决某个问题，而不是在一百个场景中解决百分之七十到八十的问题。

以文旅大模型为例，基于文旅大模型打造的机器人客服，可自动判断用户的意图，并自主调用相应的 API高质量地完成用户咨询服务。如用户提问“节假日有哪些比较经济的旅游景点可以推荐”，基于通用大模型的客服机器人只能给出一些简单的景点介绍与路线规划。而通过大量有针对性的行业数据所训练出来的行业大模型，则可以通过模型精调，让客服机器人的回答更为细致，可规划出每天的交通景点安排，给出经济实惠的定制化推荐方案。

在数据与成本之间需要寻找平衡点

众所周知，模型的训练数据越多，模型越大，训练和推理的成本也越高。实际上，大部分企业场景需求可能并不需要通用人工智能来满足。因此，如何在合理的成本下选择合适的模型是企业用户真正需要去思考与决策的地方。

“数据是大模型的原材料，针对具体场景，相关数据的覆盖与质量都是至关重要。标注数据的管理也是模型迭代中非常重要的工作。模型最终要在真实的场景落地，要达到理想的服务效果，往往需要把企业自身的数据也用起来。在模型研发的过程中，既要关注敏感数据的保护，也要关注安全合规，还要管理好大量的数据与标签，不断测试与迭代模型。”汤道生表示。

据介绍，基于腾讯云IT平台行业大模型精调解决方案，将帮助模型开发者与算法工程师一站式解决数据处理问题，高效率、高品质、低成本地创建与使用大模型。“我们可以通过TI平台以及模型私有化部署、全栈式管控、数据加密等方式，让企业用户在打造大模型、使用大模型的时候更放心。”汤道生谈道。

据悉，腾讯云携手中央电视台打造了央视人工智能开放平台，重新构建了一套传媒专属的数据标签体系，同时也研发了创新的标签权重引擎，让数据标签颗粒度更细。在数据标签体系的支撑下，视频编辑用自然语言就能实现跨模态检索，比如输入“居民消费力”，系统就可提供商场超市相关素材，再搭配智能剪辑就能快速生成视频。

算力是模型持续运转的基础

“大模型的持续云转，需要高性能、高弹性与高稳定的算力支撑，需要借助专业的云服务。在大模型的训练与使用过程中，需要大量的异构算力来支持，同时对于网络速度与稳定性要求也非常高。”汤道生表示。

GPU服务器比一般的服务器稳定性更低一些，服务器运维问题的排查也会更频繁，整体运维的难度与工作量会高很多。例如在训练集群中，一旦网络有波动，训练的速度就会大受影响。只要一台服务器过热宕机，整个集群都可能要停下来，大模型的训练任务就需要重启。这些事件会使得训练的时间大大增加，所以投入在大模型的成本也会变。

汤道生介绍称，腾讯云所提供的稳定计算高速网络与专业的运维，可以为算法工程师大大减轻设备运维的压力，让他们把精力放在模型的构建与算法的优化上。同时，腾讯云打造的面向模型训练的新一代HCC(High-Performance Computing Cluster)高性能计算集群，整体性能比过去提升了三倍。在计算集群的硬实力以外，腾讯云还推出了更适合AI运算的软能力——向量数据库，能够更高效的处理图像，处理向量音频、文本等非结构化的数据。

“人工智能的发展是数据积累、算法创新与算力突破共同推动的，也是全球科技企业、高校、研究机构开放共建的结果。今天我们再一次站在数字科技革命的起点上，大模型只是一个开端， AI与产业的融合将绽放出更有创造力的未来。”汤道生表示。

据了解，截至目前，腾讯自身的企业级应用已率先应用了行业大模型。例如腾讯会议即将推出的覆盖会议全流程场景的智能小助手，只需简单的会议指令，便可协助用户执行会议安排、会议管控、智能总结、智能录制等操作，提升用户开会与信息流转的效率。新一代腾讯企点智能客服也将基于行业模型，结合客户业务需求进行训练与精调，提供更精准、更详细的回答，甚至可以调用业务系统数据提供实时分析。

作者丨宋婧编辑丨刘晶

美编丨马利亚监制丨连晓东

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
MCF52258CAG66	1	Rochester Electronics LLC	32-BIT, FLASH, 66MHz, RISC MICROCONTROLLER, PQFP144, 20 X 20 MM, ROHS COMPLIANT, LQFP-144		$12.68	查看
ATXMEGA128A3U-AUR	1	Microchip Technology Inc	IC MCU 8BIT 128KB FLASH 64TQFP		$5.3	查看
ATMEGA88PA-AUR	1	Microchip Technology Inc	IC MCU 8BIT 8KB FLASH 32TQFP	ECAD模型下载ECAD模型	$1.5	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

MCF52258CAG66

Rochester Electronics LLC

32-BIT, FLASH, 66MHz, RISC MICROCONTROLLER, PQFP144, 20 X 20 MM, ROHS COMPLIANT, LQFP-144

$12.68

查看

ATXMEGA128A3U-AUR

Microchip Technology Inc

IC MCU 8BIT 128KB FLASH 64TQFP

$5.3

查看

ATMEGA88PA-AUR

Microchip Technology Inc

IC MCU 8BIT 8KB FLASH 32TQFP

$1.5

查看

腾讯云CEO汤道生详解“模型即服务”

行业大模型仍需针对性“锤炼”

在数据与成本之间需要寻找平衡点

算力是模型持续运转的基础

推荐器件

相关推荐