译者案:IEEE通信学会(ComSoc)发布的《电信领域大规模AI应用——创新、规模化落地与数字体验升级路线图》(LARGE-SCALE AI IN TELECOM——Charting the Roadmap for Innovation, Scalability, and Enhanced Digital Experiences)白皮书,为行业指明了一条融合生成式AI与电信大模型(LTMs)的革命性路径。
本文摘选翻译白皮书第8.6、8.7、8.8章内容
翻译不准确之处,敬请谅解,关注公众号【5G行业应用】,回复“260415”可下载白皮书原文
8.6 基于电信大模型的网络自动化与基于意图的管理
近期,移动网络运营商(MNOs)正计划实现网络的全自动化,以降低管理成本,缩短部署与维护时长。图45展示了电信管理论坛(TMForum)定义的网络自动化等级,移动网络运营商的目标是达到第5级全自治网络。为实现这一自治目标,标准化组织引入了 “意图” 这一核心概念。
图45 电信管理论坛(TMForum)定义的自动化等级
在3GPP、全球移动通信系统协会(GSMA)、电信管理论坛(TMForum)、欧洲电信标准化协会(ETSI)等电信技术标准化组织的语境中,“意图” 与 “基于意图” 相关概念,通常指一种基于预期目标或结果,定义并配置通信系统的方法。意图与基于意图系统的相关概念,是这些标准化组织工作的核心组成部分,其目标是构建更高效、更灵活、响应更迅速的电信系统与服务,满足用户与企业的需求。
例如,电信管理论坛将意图定义为:向技术系统提出的、包含需求、目标与约束在内的所有预期的正式规范。因此,意图纯粹是对“需要实现的目标” 的表达,而非指明实现目标的方式。
基于意图的网络(IBN)最早应用于软件定义网络(SDN)。软件定义网络的核心理念,是将网络的控制平面与数据平面分离,实现网络的快速自动化重编程。5G 技术催生了各类全新服务,让不同行业能够通过网络切片,部署专属的定制化网络。基于此,全球移动通信系统协会提出了基于模板的方案。在该方案中,基于意图的网络用户,可通过通用网络切片模板(GST)指定一系列属性,个性化定义创建网络切片的意图。
在基于意图的概念被引入软件定义网络控制器后,标准化组织对“意图” 给出了多个定义。例如,互联网工程任务组(IETF)最新的意图定义为:“…… 网络应当满足的一组运营目标,以及网络应当交付的结果,以声明式的方式定义,不指明实现或执行的具体方式”。
意图的核心目标,是向系统定义并传递关于预期的相关知识,让自动化流程能够对其进行推理,并推导出合适的决策与动作。网络自动化中的意图,由意图管理功能进行管控。
图46 自治网络中的意图解析
如图46所示,为实现图45中定义的自动化等级,大语言模型成为实现自治网络的核心组件。大语言模型负责从数据中学习、制定决策、以自治方式执行动作,在增强自治网络能力、支撑网络基于动态变化的环境适配与演进方面,发挥着关键作用。
意图解析,是实现全自治网络的核心。意图可通过多个渠道输入,包括客户门户、业务门户、订单管理系统与运维门户。例如,聊天机器人等客户门户,可让客户订购满足自身特定需求的专用5G切片(例如为体育场赛事提供5G连接服务)。客户的意图通过简单的自然语言表达,需要被转化为能够满足客户需求的5G服务描述。
ChatGPT等大语言模型,在文本分析、摘要生成、问题回答、解释说明、交互式对话方面,具备极强的能力。因此,大语言模型已开始被应用于网络中的意图解析与管理。以下列举了大语言模型在意图管理中可应用的多项任务:
业务与服务意图解析:业务意图解析器,将来自简单服务咨询的业务请求,转化为对应产品(或产品组合)。服务解析器,承担 3GPP 定义的切片管理实体中的通信服务管理功能(CSMF)。
意图冲突管理:意图管理的第一步,是从各个来源(各类门户)收集意图,下一步是对相似意图进行聚合,简化管理流程。但在执行环节前,需要采用相关方案,检测意图之间的潜在冲突。例如,最大化带宽的意图,可能与最小化成本的意图产生冲突。
意图保障:指一系列保障系统按照指定意图(即服务等级协议SLA 或客户需求)运行的流程。为实现意图保障,需要检测违规的根因,并提出重配置方案,让系统恢复到符合客户意图的理想状态。
相关研究的作者,开发了聊天机器人、网页界面等用户友好的渠道,让客户能够利用大语言模型,实现5G服务订购的自动化。研究人员采用了谷歌开发的小型掩码语言模型BERT,基于命名实体识别自然语言处理任务与产品目录数据,对模型进行微调,从而将客户用自然语言描述的意图,与目录中的产品进行匹配。
图47 滑板车租赁公司的示例
图47展示了一个示例:一家公司需要5G连接服务,追踪其运营的滑板车。公司用简单的自然语言描述需求:“我经营一家滑板车租赁服务,需要追踪滑板车的位置”,大语言模型API在后台将该描述,与产品目录中最匹配的产品进行对应。客户还可输入其他意图,例如支持的时延、终端的最大数量。
8.7 利用大语言模型为5G网络部署中的配置文件生成提交信息
网络自动化,是提升网络性能的核心环节。提交信息,详细记录了网络配置文件与部署修改涉及的各类操作。本研究,针对5G网络部署场景中提交信息的自动化生成,开展了相关实验与研究。
在现代网络管理中,“网络即代码(NAC)” 的理念正快速普及。网络即代码,本质上是将软件开发方法论,应用于网络设备与服务的管理和配置。它通过版本控制系统管理网络配置,落地自动化工具与流程,与软件开发的运维模式类似。该方法论不仅提升了运营效率,最大限度降低了人为错误,还加快了网络配置的部署速度。
网络即代码的应用,大幅提升了网络配置的一致性、可追溯性与可复制性,为网络运营提供了极高的灵活性与管控能力。我们针对网络即代码的研究,聚焦于图48 的最左侧部分,该部分将厂商意图与运维操作,融入了集成开放容器倡议(OCI)镜像仓库与Git源码控制的网络配置系统中。
图48 网络即代码
该部分管理两类核心意图:“厂商意图”,即外部供应商提出的特定配置需求;“运营商意图”,即网络管理团队制定的内部配置规则。我们通过代码的方式,对这些意图进行开发与管理,目标是实现网络配置的系统化、可追溯、高效的部署与修改,从而提升网络运营的效率、一致性与灵活性。
大语言模型利用深度学习技术,实现包括网络管理在内的各类计算流程的自动化与优化。这类模型基于Transformer架构构建,通过注意力机制理解文本中的上下文关联,这对于解读复杂的网络配置、辅助网络即代码实践中的编码任务至关重要。
在网络配置管理中,精准的提交信息,是版本控制与审计追踪的核心。但人工编写提交信息,不仅耗时耗力,还容易出现错误。大语言模型可基于配置文件的变更内容,自动生成描述清晰、准确的提交信息,从而提升文档质量与运营透明度。
在我们的研究中,探索了通过提示词工程,实现代码提交信息的自动化生成,设计并实现了 5 种不同的提示词。每个提示词都包含独特的元素与指令,用于评估其对生成结果质量的影响。在我们的用例中,设计的提示词如下:
提示词 1:背景 + 指令 + 输入数据 + 输出要求
提示词2:提示词 1 + 负面提示
提示词3:提示词 2 - 仓库目录树
提示词4:提示词 2 + 单样本示例
提示词5:提示词 2 + 检索增强生成(RAG)
图49 提示词 1 的结构
下文将对每个提示词进行详细说明:
提示词 1:基础提示词。包含背景字段,用于定义模型在回答时需要扮演的角色;任务说明、输入内容、以及包含提交信息期望输出格式的输出要求,结构如图 49 所示。
提示词2:带负面指令的提示词。在提示词1的基础上,添加了负面指令:“你的输出必须严格为单行,格式为 '< 类型>[可选 作用域]: < 描述 >',不得包含任何额外文本,例如 ' 这是提交信息:' 等,前后均不得添加额外内容。” 负面指令的目的,是引导模型避免生成不符合任务要求的提交信息,例如避免模糊不清、过于简单的表述。
提示词3:不含仓库目录树的提示词。在提示词2的基础上,移除了代码仓库目录树的相关信息。该修改的目的,是测试模型在缺少特定代码组织结构信息时的性能,从而评估模型对环境依赖的敏感度。
提示词4:带单样本示例的提示词。在提示词2的基础上,添加了一个具体的提交信息示例(单样本)。该方法通过具体示例,帮助模型学习提交信息的构建方式,有望提升生成内容的准确性与相关性。
提示词5:融合检索增强生成的提示词。在提示词2的基础上,融合了检索增强生成(RAG)技术。通过检索增强生成技术,模型在生成提交信息前,会查询相关文档或现有数据,提升生成内容的准确性与丰富度。
为测试 GPT-4、Llama3、Mistral 等不同人工智能模型的性能,我们从总计581 条提交记录中,精心提取了相关数据。其中168条由开发人员人工编写,413条由自动化系统(机器人)生成。该数据集包含了丰富的信息,包括提交的差异内容、提交信息、作者信息、每个提交唯一的SHA标识符。全面的数据采集,为深入分析项目的演进过程与增量修改提供了支撑。
为评估不同模型、不同提示词方法的性能,我们同时采用了自动化评估与人工评估方法,选取 BLEU、ROUGE、METEOR 作为自动化评估指标。
我们在相关研究中,给出了多项评估结果。结果显示,总体而言,大语言模型在提交信息自动化生成任务中普遍表现优异,尤其是应用检索增强生成技术后的 Llama 3模型。经检索增强生成优化的Llama 3模型生成的机器人提交内容,在自动化评估与人工评估中,均展现出了强劲的性能。这一成果,很可能得益于Llama 3在生成结构规范、格式标准的内容方面,能力得到了提升。与之相对,人工编写的提交信息,在不同模型与提示词方法下的评估分数,表现得更为均衡、一致。
8.8 光网络中的应用场景
2023年以来,生成式人工智能,尤其是大语言模型,在光网络领域受到了极高的关注。例如,2024年3月举办的光纤通信大会(OFC,该领域的顶级学术会议),就专门组织了一场完整的研讨会,主题为 “生成式人工智能如何应用于网络运营?”。
当前光网络的运营仍高度依赖人工操作,因此大语言模型被视为简化网络运营的重要机遇—— 它可作为操作人员与网络管理系统(NMS)之间的人机交互接口,对复杂的概念与任务进行抽象,让专业能力较弱的人员也能完成网络运营工作,或缩短、自动化运营流程。
当与数字孪生技术结合时,基于大语言模型的人工智能代理的输出(即建议执行的动作),可先在数字孪生沙箱中完成测试,再推送至现网中。人工智能代理(基于大语言模型)与数字孪生的组合,已成为研究领域的热门方向,完成了多项实验室实验验证,甚至现网试点。
因此,大模型可作为光网络管理的副驾驶工具。通用大语言模型几乎不具备光通信 / 光网络的背景知识,因此需要为其提供一个或多个维度的补充信息,包括:光网络的物理原理、光网络管理规则、产品信息。可通过提供上下文 / 提示词工程、检索增强生成、和 / 或模型微调的方式实现,相关研究已验证了该方案的可行性。
通过上述技术,基于大语言模型的管理系统,能够针对运营过程中遇到的特定问题提供建议,在特定场景中,当通过上述技术提供网络状态与产品信息时,还可直接与设备进行交互。
大语言模型可承担的典型任务,主要集中在网络管理领域,包括但不限于:网络设计(选择符合运营商与物理约束的设备)、资源分配(例如路由与频谱分配)、物理层优化(例如信道功率均衡、光放大器等各类设备的参数配置)、故障管理(根因分析、修复方案建议)。
在绝大多数场景中,大语言模型仅作为人工操作人员与网络管理系统之间的中间层,其核心作用是解读人工请求,调用正确的网络功能(该功能中已实现了对应的优化算法)。对人工请求的正确解读(语言相关能力)与正确的函数调用,可通过 API 调用准确率进行量化评估,相关研究已开展了相关验证。
在部分场景中,大语言模型的认知能力也被用于执行更高级的任务。例如,相关研究中,大语言模型针对资源分配问题(路由与频谱分配),输出了对应的算法与相关代码。相关研究中,利用大语言模型的推理能力,分析网络日志,识别故障的根因,并提出解决方案。
展望未来,大模型的潜在与预期应用场景包括:
主动式网络运营:大模型可预测网络中的潜在问题(通常是板卡老化等相对缓慢的性能劣化;而光纤中断这类最常见的故障,在发生前几秒内才有可能预测),可通过遥测或日志分析实现。主动式维护包括:关闭并更换即将发生故障的板卡、在故障发生前对流量进行重路由等。
安全增强:通过文献与代码分析,检测网络漏洞。
各类运营优化:例如根据当前或预期的业务需求,调整设备的运行模式,优化能耗。
最终,随着大模型技术的持续发展,它有望补充、甚至替代部分驱动光物理层设备的物理模型。绝大多数设备的行为,都可以通过物理模型进行精准建模,但部分模型受限于底层基础假设,仍有优化空间,还有部分模型需要求解非线性微分方程等复杂计算。大模型最终有可能找到更优的近似方法,甚至全新的、更精准或更快速的模型。
▎好书推荐
本书由吴冬升、李大成担任主编,机械工业出版社出版。书中在分析智慧城市重点建设内容和智能网联汽车重点发展内容基础上,进一步探讨智慧城市与智能网联汽车融合发展带来的车联网智能道路基础设施、新型能源基础设施、地理位置网、现代信息通信网、车城网平台建设和发展情况。并且介绍智慧城市与智能网联汽车融合创新发展的相关案例。
吴冬升 博士
225