• 正文
  • 相关推荐
申请入驻 产业图谱

电信大模型实际挑战、机遇与未来发展路线图

05/08 13:25
533
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

译者案:IEEE通信学会(ComSoc)发布的《电信领域大规模AI应用——创新、规模化落地与数字体验升级路线图》(LARGE-SCALE AI IN TELECOM——Charting the Roadmap for Innovation, Scalability, and Enhanced Digital Experiences)白皮书,为行业指明了一条融合生成式AI与电信大模型(LTMs)的革命性路径。

本文摘选翻译白皮书第十三章内容,翻译不准确之处,敬请谅解。关注公众号【5G行业应用】,回复“260415”可下载白皮书原文

13 实际挑战、机遇与未来发展路线图

13.1 实际落地挑战

13.1.1 电信大模型推理速度

缩短电信大模型(LTMs)的推理耗时,是实现实时性能的核心关键,尤其在电信网络中,动态频谱管理、流量路由、服务质量保障等场景,对低时延有着严苛要求。

推理速度的优化策略包括:利用硬件加速器(例如现场可编程门阵列 FPGA、电信专用专用集成电路 ASIC)、分布式计算框架,或针对电信大模型部署优化的网络功能虚拟化(NFV)技术。模型剪枝与量化技术,也可帮助削减不必要的计算量,但在现网环境中,如何平衡精度与速度,仍是一大挑战。

模型推理时延的容忍阈值,在网络技术栈的不同层级存在显著差异。例如,在 AI 原生无线接入网架构中,运行在物理层(L1)的电信大模型,其推理时延要求,远比对服务管理与编排(SMO)中用于编排管理的电信大模型严苛得多。

13.1.2 电信大模型体量

在保持足够精度的前提下,缩小电信大模型的体量,是其实际落地的核心要求,尤其是在资源受限的边缘或网络核心环境中。模型蒸馏、权重共享、稀疏感知优化等技术,可在不削弱模型处理流量预测、故障检测等大规模电信任务能力的前提下,最大限度缩小模型体量。

此外,行业正涌现出针对电信场景适配的电信大模型,通过轻量化架构设计,适配网络中的特定功能,降低模型的整体占用空间。

13.1.3 电信大模型互操作性

在广泛应用大语言模型等 AI 模型的电信行业格局中,保障不同主体之间的无缝通信与交互至关重要 [494, 495, 496]。这些 AI 模型的配置与互操作性,必须建立统一、协同的框架,使模型能够形成同步运行的网络体系,在 6G 等先进网络环境中尤为重要。

这需要采用标准化的模型配置方法,涵盖从版本管理到架构细节的全量必要属性,保障模型在各类系统中的适配能力 [497]。例如,数据序列化是在异构网络组件与 AI 模型之间维持统一配置的基础 [498]。序列化方法可保障模型参数、配置等数据结构,能够便捷地完成转换、传输与一致性重构,这对于软硬件生态异构的网络而言至关重要。

JSON、YAML 等通用序列化格式,在其中发挥着核心作用,每种格式在可读性、复杂度、容错性方面,均具备独特的优势与取舍 [499]。此外,元数据与训练上下文信息同样重要,可支撑模型在同类场景中的落地,以及语义相似任务的迁移学习(TL)。模型细节与训练上下文的对齐,不仅保障了一致性,还提升了 AI 模型在复杂网络场景中的自适应能力。

为实现互操作性,必须对大规模 AI 模型的配置细节进行标准化,包括定义模型架构、训练细节与系统要求 [90]。例如,必须明确标注模型类型、版本、架构(例如 Transformer 细节)、训练数据摘要、超参数(学习率、批量大小)等核心信息。此外,安全协议、加密标准、隐私策略等合规措施,也需要形成文档并标准化,保障网络组件之间的安全交互。

在实际落地中,例如为网络数据分析功能(NWDAF)等电信专用场景配置 AI 模型时,尤其是当功能由不同大语言模型支撑时,保障无缝互操作性成为核心需求。由于每个大语言模型的架构、能力、配置要求可能存在差异,必须采用统一的方法,使其能够高效协同。这需要标准化数据格式、对齐模型参数、同步大语言模型之间的运行协议。通过这些措施,可保障网络数据分析功能能够无冲突、无中断地完成网络分析、流量预测、异常检测等任务。

AI 互联(Interconnect)等先进的 AI 原生框架,可提供结构化的体系,管理跨节点 AI 模型之间的数据流与流量控制。该组件可实现节点之间的无缝协同,在资源分配、流量预测等场景中,支撑统一的决策制定。通过共享的格式、协议与应用程序接口(API),AI 互联实现了一致的交互流程,这对于节点需要实时适配与重新协商的动态网络环境而言,至关重要 [500]。

13.1.4 作为优化方法的电信大模型

电信大模型在电信领域具备作为优化工具的应用潜力。电信大模型可用于优化网络参数,例如资源分配、负载均衡、频谱效率等;还可与强化学习模型结合,实时微调网络配置,推动吞吐量、时延、网络效率的优化升级。目前,行业正在开展相关研究,探索电信大模型如何助力蜂窝网络物联网的流量管理与能耗优化。

13.1.5 可信 AI 与电信大模型

尽管大型 AI 模型的能力持续提升,尤其在多模态与上下文数据处理方面取得了重大突破,但将其适配到电信领域,仍面临着独特的挑战。通信网络具备动态性、异构性特征,数据在各类节点中分布式生成,且越来越依赖边缘架构,这要求模型必须支持部分分布式训练。

此外,电信行业拥有海量的应用与服务,是超互联数字社会的基础设施,这使得电信大模型的可信性成为重中之重。可信性是一个多维度概念,涵盖鲁棒性、透明度、可控性、可解释性、可问责性、公平性、隐私保护等多个核心维度。

可信 AI,是指在设计、开发、部署全流程中,始终以伦理、安全、透明为核心原则的 AI 系统。这类系统必须具备:可靠性,保障性能的一致性;公平性,规避对特定个体或群体的歧视性偏见;可问责性,决策具备可解释性与合理性;透明度,让利益相关方能够理解系统的运行流程与决策逻辑。

根据可信 AI 评估清单(ALTAI),可信 AI 的三大核心支柱,需在系统全生命周期中始终贯彻:(1)合法性:严格遵守所有相关法律法规;(2)伦理标准:践行伦理原则、人权准则、公平性要求,保障社会福祉;(3)鲁棒性:具备技术与社会层面的韧性与可靠性,最大限度降低非预期伤害。

电信大模型规模化运行,处理敏感数据、全球通信、高互联节点间的网络优化,因此可信性至关重要。保障隐私、安全,以及符合《通用数据保护条例》(GDPR)等法规要求,是其中的核心要务。除了高效运行之外,电信大模型还必须具备透明度与可审计性,才能建立用户、企业、监管机构的信任。

核心挑战包括:缓解模型幻觉(虚假输出)、降低有害输出、提升可解释性,让模型决策可被理解。而鲁棒的训练数据集与符合伦理的微调,是提升公平性、缓解偏见的核心基础。

然而,在动态、资源受限的电信环境中,保障电信大模型的可信性,仍面临着偏见检测、对抗攻击防御、隐私保护、运营透明度等多重挑战。电信大模型深度融入流量管理、故障预测、敏感通信路由等核心任务,电信网络的独特需求,进一步放大了这些挑战。

保障 AI 可信性的核心挑战包括:

偏见与公平性:未经管控的数据集可能强化偏见,导致资源分配失衡等不公平结果;

模型幻觉:电信大模型可能生成看似合理但虚假的输出,削弱系统可靠性;

透明度不足:模型决策的可解释性有限,降低了信任度与可问责性;

对抗攻击风险:电信大模型易受对抗攻击,恶意输入可利用网络或数据的漏洞,挑战其在动态环境中的鲁棒性;

隐私与安全平衡:处理敏感用户数据时,需要在数据隐私安全与运营透明度之间实现平衡;

伦理内容生成:需要持续建立防护机制,防范有害、不安全的输出内容;

可持续性:模型训练与部署的高能耗,带来了可持续性相关问题;

人类意图对齐:需要保障模型输出符合人类伦理预期,避免出现技术正确但伦理不当的结果;

监管合规:需要持续符合 GDPR、欧盟 AI 法案等不断演进的监管框架,保障合法合规运营。

应对这些挑战,需要跨学科协作,融合 AI 研究、伦理框架、监管策略,打造功能强大且可信的 AI 系统。可信 AI 是一项协同工作,需要开发者、用户、政策制定者、全社会的协同一致,确保 AI 能够高效、公平地服务于人类,并与人类需求协同演进。

电信环境的动态特性—— 流量波动、新兴威胁、用户需求的持续变化,进一步增加了这项工作的复杂度,要求电信大模型在无缝适配环境变化的同时,始终保持可信性与可靠性。

13.1.6 电信大模型设计演进

电信大模型的设计正持续演进,以适配现代电信网络不断变化的需求。早期的电信大模型,主要聚焦于故障检测等静态任务,而新一代模型的自适应能力持续增强,可支撑网络的动态重配置与实时决策。随着电信网络复杂度的不断提升,电信大模型的设计必须持续演进,以应对混合云 - 边缘部署、异构硬件生态、流量需求波动等多层级挑战。

13.1.7 能效

电信大模型的运行,尤其是在大规模分布式电信网络中,需要消耗大量的能源资源。随着电信基础设施的规模化扩张,能耗已成为行业核心关注问题。高效的能源利用至关重要,尤其是在能源资源受限的边缘部署场景中。要实现 7×24 小时运营环境的可持续发展,需要低功耗模型、优化的硬件、智能化的能源管理策略作为支撑。

13.1.8 分布式网络中的时延

在分布式电信网络中部署的电信大模型,尤其是跨大地理区域部署的场景,面临着时延挑战。即使具备本地边缘处理能力,边缘节点与中心数据中心之间的通信,仍可能引入传输延迟,影响决策流程的实时性。

在这类复杂的多层级环境中,针对低时延运行优化电信大模型,是网络优化、流量管理等需要实时响应的应用场景的核心要求。

13.1.9 安全与隐私

电信大模型在电信基础设施中运行,会处理通话记录、消息收发模式、用户行为等敏感数据,使其成为潜在的安全攻击目标。必须为电信大模型配备高强度加密、数据保护、身份认证机制,防范未授权访问,保护用户数据隐私。

13.1.10 异构网络中的可扩展性

电信网络具备高度异构性,融合了 5G、LTE光纤通信,部分区域还存在 3G 等传统系统。在这类多样化的基础设施中部署电信大模型,面临着重大挑战。电信大模型必须具备强自适应能力与可扩展性,能够在不同网络类型与架构中高效运行。当网络需要扩容以支撑数百万台设备时,这一挑战将进一步加剧。

13.1.11 动态网络环境

电信网络的流量模式、用户移动性、服务需求始终处于波动状态。电信大模型必须具备动态特性,能够实时适配这些环境变化。模型需要具备足够的灵活性,基于实时分析与场景演进调整网络配置,这为其设计与部署增加了复杂度。

为应对这些挑战,行业已开发出多种先进方法,解决电信环境中的可变性与不确定性问题,包括迁移学习、元学习与强化学习。下文将简要介绍这些技术,并重点说明其如何用于应对电信网络的动态特性。

迁移学习

迁移学习,是指先在大规模数据集(源任务)上训练模型,再将其适配到数据量更小的不同但相关的任务(目标任务)中。通过这种方式,模型可利用从源任务中习得的知识,在目标任务中实现更优的性能。

由于电信环境的动态特性,目标域会随时间不断演进,给迁移学习的落地带来了挑战。而持续迁移学习,可在初始训练阶段让模型接触更广泛的数据,使其对全新的、未见过的数据模式具备更强的自适应能力。

通常情况下,将预训练大语言模型适配到特定领域,比基于领域专属数据从零开始训练大语言模型,效果更优。经过训练的大语言模型,具备更强的鲁棒性与泛化能力,可应对不同的电信场景。

总体而言,迁移学习可在多个实际场景中,为电信大模型带来显著价值:一方面,基于电信网络采集的网络性能、客户行为、设备使用等海量数据训练电信大模型,计算成本高、耗时长;另一方面,电信数据往往具备敏感性,难以大规模获取。迁移学习可通过迁移已习得的知识(例如网络拥塞、用户行为相关的通用特征与模式),加速模型开发,降低训练成本,同时解决数据不足的问题 [154]。

大语言模型可应用迁移学习的场景包括:

网络管理与监控:大语言模型可处理并解读网络日志、错误信息、性能指标,生成对应的解决方案建议 [333]。文献 [319] 的研究中,融入了迁移学习与非任务专属的电信数据,提升了模型处理未见过的故障报告时的泛化能力。通过将预训练模型(在通用技术文本、IT 相关文档上训练)的知识迁移到电信专属问题中,电信大模型可实现网络故障预测、配置优化、实时建议生成等功能 [501]。通过网络专属数据(故障日志、简单网络管理协议 SNMP 数据)对模型进行微调,可使其理解细分场景的问题,基于历史模式做出预测。

欺诈检测与安全:通过迁移学习,电信大模型的异常检测能力可升级大规模欺诈检测效果 [501]。例如,预训练模型可能已习得通用交易数据中的异常模式识别能力,这一能力可迁移到电信领域。通过电信专属数据集(异常通话模式、订阅欺诈等)微调,电信大模型可更快识别可疑行为。

监管相关文本挖掘:电信运营商需要遵守行业监管要求,这一过程通常需要扫描与分析海量文档。预训练的电信大模型可经过微调,从合同、政策、法律文档中识别并提取相关信息 [502]。相比从零开始训练,这种迁移学习的方式,可让模型更高效地理解监管相关的专业语言。

客户支持:电信大模型具备强大的客户评论分类与有效反馈提取能力,结合迁移学习,可加速基于客户反馈的情感分析流程 [503]。

元学习

元学习,通常被称为“学会学习”,是机器学习领域的新兴范式。其设计目标,是让模型能够快速适配全新的、未见过的任务,且仅需极少的额外训练,而非仅在单一特定任务中实现优异性能。

与传统机器学习方法不同,元学习可利用过往的学习经验,适配全新但相关的任务,且仅需少量训练。其通过挖掘通用模式与先验知识,实现跨任务泛化,从而减少模型适配所需的时间与计算资源。

无线网络运行在复杂、动态的环境中,网络拓扑、用户移动性、流量模式、干扰情况,可能在短时间、小范围内发生剧烈变化,因此元学习的这一特性,对于电信大模型的落地至关重要。

元学习通常分为两个阶段:元训练与元适配。元训练阶段可被定义为一个双层优化问题,两个优化任务分别对应“学会学习” 的两个 “学习” 过程:内层优化聚焦基础学习,通过指定的超参数,生成特定任务的策略;外层优化则基于相关任务的采样数据,学习最优超参数。

元适配阶段,是让模型在元训练完成后,能够高效适配新任务。借助元训练阶段习得的超参数,模型仅需通过与测试数据同分布的少量样本,即可快速完成调整,在新任务适配中具备极高的效率。遵循这一两阶段框架的经典算法,是模型无关元学习(MAML)[504]。MAML 可优化模型的初始参数集,仅需少量梯度更新、有限的任务专属数据,即可为新任务完成快速微调。在元训练阶段,MAML 学习生成具备高自适应能力的参数;在元适配阶段,模型利用这些习得的参数,高效完成微调,在新任务中实现优异性能。

从实际应用角度,元学习电信大模型的应用场景包括但不限于:

自适应流量管理:在体育赛事、演唱会等场景中,场馆周边的用户密度会在短时间内急剧上升,元学习可让电信大模型快速适配流量激增场景。电信大模型已在多样化的流量模式上完成元训练,仅需极少甚至无需额外数据,即可优化网络性能,降低时延,防范服务质量中断。

高铁通信连接保障:高铁系统中的无线网络,面临着为时速超 300 公里的乘客维持稳定连接的挑战。基于多样化移动模式完成元训练的元学习电信大模型,可高效适配场景,优化切换流程,为视频会议等应用保障无缝连接。

智慧城市物联网设备管理:在智慧城市等动态环境中,管理数千台物联网设备,需要高效的任务调度与资源分配。基于多样化环境的物联网使用模式完成元训练的元学习电信大模型,可适配新设备与新任务,仅需极少的重新配置,即可保障高效、可靠的运行。

通过元学习,电信大模型可变得更智能、更高效,大幅减少人工干预需求,对网络环境的动态变化实现更快的自动化响应。随着电信模型需要支撑的网络复杂度持续提升、联网设备密度不断增加、应用需求日益严苛,元学习将成为核心使能技术,推动大规模系统的高效管理与优化。其自适应能力,可让电信运营商满足持续演进的需求,维持网络稳定,在高动态、高资源消耗的环境中,保障一致的服务质量。

强化学习(RL)

强化学习,是一种专为智能体设计的机器学习范式,通过与环境交互、从反馈中学习,实现序列决策。在电信领域,强化学习已在电信大模型中得到广泛应用,用于管理动态、多变网络的复杂特性。

电信系统的运行环境,具备流量负载波动、干扰、用户移动性、资源受限等特征,需要自适应、高鲁棒性的解决方案。强化学习通过学习最大化累积奖励的最优策略(例如服务质量提升、资源利用效率优化、能耗降低),让电信大模型能够应对这些挑战。

强化学习在电信领域的应用价值,核心在于其能够实时适配不断变化的网络环境。强化学习可让电信大模型动态分配带宽、频谱等资源,平衡网络负载,管理能耗。通过持续从反馈中学习,基于强化学习的电信大模型可调整策略,有效满足网络需求。

例如,强化学习模型可优化基站间的流量分布,降低网络拥塞,提升吞吐量。又如,在高能耗的电信基础设施中,强化学习智能体可在保障服务质量的前提下,学习节能策略,助力网络的可持续运营。

强化学习的核心机制,依赖三大关键组件:智能体、环境与奖励体系。在电信应用场景中,电信大模型作为智能体,基于网络状态(环境)制定决策,奖励体系则对决策的有效性提供反馈(例如时延降低、网络可靠性提升)。

强化学习平衡探索与利用的能力,在电信网络中尤为关键。探索,是指强化学习智能体尝试新的动作,发掘潜在的更优策略;利用,是指应用已习得的策略,最大化即时奖励。在动态、资源受限的环境中,这种平衡对于处理固有权衡问题至关重要。

深度强化学习(DRL)[505]、多智能体强化学习(MARL)[506] 等先进强化学习技术,尤其适用于电信应用场景。深度强化学习将强化学习与深度神经网络融合,让电信大模型能够处理电信网络典型的高维状态 - 动作空间。例如,深度强化学习可通过高效的资源分配,优化 5G 网络切片,满足增强型移动宽带(eMBB)、超可靠低时延通信(URLLC)的多样化需求。

而多智能体强化学习,涉及在共享环境中运行的多个强化学习智能体,非常适用于动态频谱共享、多接入边缘计算分布式系统

尽管具备诸多优势,在电信大模型中落地强化学习,仍面临着可扩展性、算力需求、时延敏感性等挑战。电信网络涉及数十亿台设备与互联系统,要求强化学习模型必须具备规模化高效运行的能力。实时决策同样至关重要,时延可能会损害服务质量。此外,强化学习模型的训练需要大量数据与算力资源,可通过联邦学习、边缘计算等分布式方案解决。在任务关键型应用中,强化学习决策的可解释性,仍是一大待解决的难题,这类场景对透明度与合规性有着严苛要求。

展望未来,强化学习将在电信网络的演进中发挥核心作用。将强化学习与迁移学习、元学习等技术融合的混合方案,有望带来更强的自适应能力与运行效率。分布式强化学习、能效感知算法,将进一步解决可扩展性与可持续性挑战。随着电信网络向自主化、AI 驱动的系统转型,强化学习将成为智能自动化的核心基石,支撑网络的自优化、自愈、自配置能力。通过强化学习技术,电信大模型可保障电信网络的高效、韧性与面向未来的能力,满足互联世界持续增长的需求。

总体而言,未来的电信大模型,必须在设计中兼顾敏捷性与灵活性,以适配多变的网络环境与多样化的应用场景,这一设计原则是保障网络高效运行的核心。为实现这一目标,需做到:

传统机器学习 / AI 方法的融合:电信大模型应融合监督学习与无监督学习方法,适配广泛的动态场景 [507, 508]。这类方法在动态流量调度 [509]、服务感知资源分配 [510, 511] 等场景中,可实现优异效果。

强化学习的核心价值:如前文所述,基于强化学习的技术,将成为拓展电信大模型能力的核心支撑。通过与环境的持续交互学习,强化学习可实现更精细化的决策,有效适配实时环境变化。

数据与测试床方案的重要性:在这类动态环境中,用于训练电信大模型的数据,价值将持续提升。测试床部署 [512],被视为生成多样化、代表性数据集的核心使能工具 [513, 514],可在真实网络环境中,优化电信大模型的训练与验证效果。

通过融入这些考量因素,电信大模型将能够更好地应对未来网络的复杂度,实现高鲁棒性、智能化的网络运营。

13.1.12 数据治理与合规

鉴于电信运营商的全球业务覆盖,电信大模型必须遵守各地区的数据保护与使用相关法规,例如欧盟的 GDPR、美国医疗健康数据的 HIPAA 法案。如何在保障运营效率的同时,让模型符合各地区的合规要求,为其部署与设计增加了另一层复杂度。

13.1.13 物理层基础模型的电信大模型预训练

与任务导向的 AI 解决方案不同,基础模型可帮助电信运营商轻松适配新场景与新应用。要通过电信大模型,实现对物理层的通用化理解,必须选择高效的分词与预训练策略,例如下一样本预测、掩码与去噪等。

但在无线网络中,这一目标面临着挑战:不同应用场景下,数据的表征形式会发生剧烈变化(例如采样率、采样长度,会根据频谱管理配置与所用技术发生变化)。此外,LTE、5G-NR、Wi-Fi 等不同无线技术的信息熵,由于调制方案、信道带宽使用、流量模式、负载、信号处理技术的差异,通常存在显著区别。

基础模型通常基于 Transformer 架构构建,需要采用分块、分词等技术,保障输入格式的一致性。而在电信场景的动态条件下,由于信息熵与数据表征的差异,如何有效适配这些技术,仍是行业亟待解决的开放问题。

目前,已有针对时间序列数据的分词策略研究 [515, 516],但尚未针对无线时间序列数据开展相关研究。此外,为新任务、新场景采集大规模数据集,通常难度极高,需要投入大量资源。自监督方式的基础模型预训练,旨在缓解这一问题 —— 仅需在微调阶段对模型进行少量更新,即可适配高多样性的新场景。尽管如此,如何为数据表征不同的多个无线下游任务,设计高效的预训练策略,仍是一个开放的研究问题。

13.1.14 电信大模型硬件需求与演进

随着网络基础设施的升级,尤其是向 5G 及演进型网络的转型,电信大模型的硬件需求也在持续演进。电信大模型通常需要高算力、高带宽、低时延的硬件支撑,包括电信专用处理器与加速器。

随着电信硬件的持续升级,模型需要针对边缘计算节点、网络功能虚拟化基础设施、云原生网络等新型架构进行优化。尤其是在网络连接与硬件能力参差不齐的环境中部署电信大模型时,平衡资源占用与性能,成为核心关键。

电信大模型的硬件需求,包括处理单元、内存与存储、网络与连接、能效四大维度。下文将深入分析 CPU、GPU、TPU、NPU 的架构,这些硬件是支撑电信大模型与其他 AI 模型运行的核心基础。

中央处理器(CPU)

中央处理器(CPU)是几乎所有计算系统中都配备的通用处理器,在 AI 系统中,主要负责数据预处理、系统协调、控制流管理等任务。CPU 通常包含多个核心(高端服务器型号的核心数从 4 核到 96 核及以上不等),采用 x86(英特尔AMD 产品使用)或 ARM(苹果 M 系列芯片、移动处理器使用)等复杂指令集

这些指令集使 CPU 能够高效执行各类任务,但并非针对大规模并行处理优化,而并行处理是深度学习模型的核心需求。CPU 可支持单指令多数据(SIMD)操作 [517],即单条指令可同时应用于多个数据点。例如,英特尔的 AVX-512 指令集,可加速多数据点的浮点与整数运算,提升数据预处理、特征提取等 AI 任务的处理速度。

尽管有这些性能增强,CPU 仍缺乏 GPU 与 TPU 的并行处理能力,这限制了其在大型 AI 模型训练中的性能表现。

AI 工作负载的主流 CPU 产品包括:

英特尔至强可扩展处理器(Ice Lake、Sapphire Rapids):核心数最高可达 60 核,支持 AVX-512 指令集;

AMD EPYC 处理器(Milan、Genoa):最高配备 96 核,适用于高性能多线程任务;

这类处理器通常用于服务器环境,承担数据预处理、模型编排、轻量级推理任务。在边缘 AI 应用场景中,苹果 M1、M2 系列等基于 ARM 架构的处理器,集成了 CPU、GPU、NPU 组件,依托 ARM 架构,可高效处理机器学习任务。而 ARM Cortex 处理器,通常作为片上系统(SoC)的 CPU 核心,搭配独立的 GPU 与 NPU,用于移动设备、边缘计算场景的 AI 任务。

图形处理器(GPU)

图形处理器(GPU)是专为并行计算优化的专用处理器,是加速深度学习任务的核心硬件。与核心数量有限的 CPU 不同,GPU 可包含数千个小型核心,专为处理大规模矩阵乘法与张量运算设计,而这类运算是 AI 模型训练与推理的核心基础。

GPU 的架构基于单指令多线程(SIMT)模式,可让多条线程并行执行同一条指令。这种架构非常适用于矩阵乘法、神经网络卷积运算、大规模数据处理等 AI 任务。

现代 GPU 均配备了显存(VRAM),这是一种高速内存池,可实现对大规模数据集与模型权重的快速访问,缓解内存访问速度慢带来的性能瓶颈。针对深度学习场景,GPU 通常配备了专用硬件单元,例如英伟达 GPU 的张量核心,可通过低精度计算(例如 FP16、BF16),加速深度学习运算,尤其是矩阵操作。

GPU 可用于大语言模型的训练,以及图像分类、自然语言处理、强化学习等复杂任务的推理。主流产品包括:

英伟达 A100 张量核心 GPU:基于 Ampere 架构,FP16 性能最高可达 624 TFLOPS,配备 80GB HBM2e 显存,广泛应用于数据中心的大规模训练与推理场景;

英伟达 H100 张量核心 GPU:基于 Hopper 架构,在 AI 专属任务中实现了进一步的性能提升;

AMD Instinct MI200:基于 CDNA2 架构,配备 128GB HBM2e 显存,FP16 性能超 200 TFLOPS,适用于 AI 与高性能计算(HPC)工作负载;

英伟达 RTX 3090:消费级 GPU,基于 Ampere 架构,配备 24GB GDDR6X 显存,适用于小型研究项目、个人研究者,可支撑数百亿参数量模型的训练;

ARM Mali GPU:广泛应用于移动与嵌入式系统,例如 Mali-G78、Mali-G710,针对资源受限设备的 AI 推理优化,支持 OpenCL 与 Vulkan,具备高能效特性,可完成目标检测、语音识别等 AI 任务。

张量处理器(TPU)

张量处理器(TPU)由谷歌开发,是专为加速 AI 工作负载核心的张量运算设计的高度专用处理器。与作为通用并行处理器的 GPU 不同,TPU 专为深度学习模型中的矩阵乘法与张量运算设计,尤其适配谷歌 TensorFlow 框架。

TPU 采用脉动阵列架构,这是一种专用硬件单元,可通过最大限度减少处理单元之间的数据移动,高效完成矩阵乘法运算。这种架构让 TPU 在大规模 AI 训练中具备极高的效率,在重度依赖矩阵计算的深度学习工作负载中,性能超越 GPU。

TPU 还配备了高带宽内存(HBM),这对于处理大规模数据集、加速超大规模神经网络的训练至关重要。TPU 可通过 TPU Pod 实现规模化扩展,将多个 TPU 芯片组合,支持数百甚至数千个 TPU 核心的分布式训练,非常适用于需要海量算力的大语言模型、多模态系统训练。

主流 TPU 产品包括:

谷歌 TPU v4:单芯片性能最高可达 275 TFLOPS,专为 AI 训练任务的极致能效与能效比设计;

谷歌 TPU v3:前代产品,AI 性能可达 123 TFLOPS;

两代 TPU 产品均通过谷歌云对外提供服务,用户可租赁 TPU 资源运行 AI 工作负载,无需投入物理硬件,即可实现算力扩展。

神经网络处理器(NPU)

神经网络处理器(NPU)是专为神经网络推理加速设计的处理器,尤其适用于对功耗与效率有严苛要求的边缘与移动设备。与同时支持训练与推理的 GPU、TPU 不同,NPU 聚焦于预训练模型的推理运行,重点强调低时延、高能效计算。

NPU 通常与 CPU、GPU 一同集成在片上系统(SoC)中,让移动与嵌入式设备能够在本地处理 AI 工作负载,无需将计算任务卸载至云端。这类处理器针对卷积神经网络(CNN)、循环神经网络(RNN)等神经网络架构优化,适用于目标检测、语音识别、语言翻译等实时应用场景。

NPU 的核心特性包括:支持量化模型,将神经网络权重的精度降低至低位宽(例如 INT8),同时不显著影响精度,这让 NPU 相比 GPU、CPU,能够实现更快的推理速度与更低的功耗;配备片上 SRAM(部分型号最高可达 64MB),最大限度降低推理过程中的数据访问时延。

主流 NPU 产品包括:

ARM Ethos 系列:为边缘设备提供可扩展的 AI 性能。其中 Ethos-U55 专为微控制器与低功耗应用设计,适用于物联网传感器、可穿戴设备;Ethos-N78 面向高端智能手机等设备,算力最高可达 2 TOPS,为图像识别、语音处理等 AI 任务提供高效解决方案,具备高能效特性,针对 INT8、INT16 运算优化;

苹果神经引擎(ANE):集成在苹果 M1、M2 系列片上系统中,运算能力最高可达 11 TOPS,非常适用于人脸识别、自然语言处理等端侧 AI 应用;

谷歌 Edge TPU:专为 TensorFlow Lite 模型设计,面向边缘与物联网应用,AI 性能可达 4 TOPS;

华为昇腾 910:高性能 NPU,FP16 性能最高可达 256 TFLOPS,适用于更高要求的 AI 应用场景。

CPU、GPU、TPU、NPU 之间的架构差异,直接决定了其在 AI 应用中的效果。CPU 具备高灵活性,是管理多样化计算任务的核心;而 GPU、TPU、NPU,为 AI 模型训练与推理的高效运行,提供了所需的并行处理能力与专用算力。这些硬件组件的协同,是电信大模型系统可扩展性与性能升级的核心基础。

内存与存储基础设施,是管理电信大模型所用的海量数据集与复杂模型的核心关键。高带宽内存(HBM)保障了高速的数据访问与处理速度,例如英伟达 H100 GPU 集成了 HBM2e 显存,大幅提升了内存带宽,这对于大规模模型的训练至关重要。

存储解决方案需要在容量、速度、可靠性之间实现平衡。固态硬盘(SSD)相比传统机械硬盘(HDD),具备更快的数据读取速度,可缓解数据密集型 AI 工作流的性能瓶颈。三星 PM1733 NVMe SSD 等产品,可提供高吞吐量与低时延,支撑 AI 应用的高效数据处理。

此外,英特尔傲腾 DC 持久化内存等非易失性内存技术的突破,提供了融合 DRAM 速度与传统存储持久性的混合方案,全面提升了 AI 系统的整体性能。

网络与连接能力,是分布式 AI 系统的核心基础,可实现计算节点之间高效的数据传输与通信。英伟达 NVLink、迈络思 InfiniBand 等高速互联技术,为大规模 AI 训练与推理任务,提供了所需的带宽与低时延保障。

支撑电信大模型等技术的数据中心,通常采用先进的网络解决方案,实现多 GPU/TPU 之间的并行处理与分布式训练。例如,谷歌 TensorFlow 研究云,通过高速网络互联数千个 TPU 核心,以极高的效率完成超大规模 AI 模型的训练。

此外,5G 与未来无线技术的发展,将进一步增强边缘 AI 应用的连接能力,支撑分布式环境中的实时数据处理与推理,拓展 AI 驱动解决方案的能力边界与应用范围。

能效,是 AI 硬件设计与部署的核心考量因素,因为大模型的训练与运行,会带来大量的功耗。英伟达 Ampere 架构 GPU 等高能效处理单元,集成了动态电压与频率调节(DVFS)等特性,可在不牺牲性能的前提下,优化功耗。

数据中心正越来越多地采用高能效冷却方案与可再生能源,以缓解 AI 工作负载的环境影响。例如,谷歌数据中心利用机器学习算法,动态管理冷却系统,在保障最佳运行条件的同时,降低了能耗。

硬件需求的演进:随着 AI 模型的复杂度与规模持续提升,硬件需求也实现了显著的升级。最初,AI 系统主要依赖 CPU,而深度学习的兴起,催生了专为并行计算优化的专用处理单元。这一演进过程,先后催生了 GPU、TPU 与 NPU,每一代产品都针对特定 AI 工作负载,实现了性能的持续升级。

以 OpenAI GPT 系列、Meta LLaMA 系列为代表的大规模模型,让内存与存储需求急剧攀升。这类模型的训练与部署,需要海量的高带宽内存与先进存储技术,以管理与处理海量数据集。例如,GPT-4 的复杂架构,需要大量的算力资源支撑,推动了 GPU 与 TPU 技术的创新,以实现高效的训练流程。

与此同时,现代 AI 训练流程的分布式特性,对高性能网络解决方案的需求持续提升。GPT-4、LLaMA 等模型的训练,需要在多 GPU/TPU 之间进行并行处理,依赖英伟达 NVLink、迈络思 InfiniBand 等高速互联技术,保障计算节点之间高效的数据传输与同步。这种分布式方案,不仅缩短了训练时间,还增强了 AI 系统的可扩展性。

能效也已成为行业核心关注问题,推动了硬件架构与数据中心设计的创新,在维持高计算吞吐量的同时,最大限度降低功耗。高能效 GPU、优化的冷却方案等创新,是支撑 GPT、LLaMA 等大型 AI 模型训练的密集算力需求的核心基础。这些硬件组件的持续演进,体现了 AI 技术进步,与支撑其发展的底层技术创新之间的动态联动关系。

13.2 创新机遇

13.2.1 可信 AI 与电信大模型

在电信场景中部署电信大模型,实时推理能力与小模型体量是核心要求,但这些约束,往往会限制鲁棒差错控制、置信度指标等可信性增强功能的落地。尽管面临这些挑战,预测置信度指标,通过量化电信大模型输出结果的可靠性,带来了宝贵的创新机遇。

高置信度的预测结果,可触发故障恢复、流量重路由等自动化动作,实现更快、更高效的响应;反之,低置信度的预测结果,可触发进一步分析或人工干预,减少错误,通过适配不同程度的不确定性,提升系统透明度。这种能力的融合,可实现动态、智能化的决策制定,增强行业对电信大模型的信任。

置信度指标,是动态环境中异常检测、系统韧性保障的核心工具 [518]。输出结果的置信度突然下降,可能预示着数据漂移、模型性能退化、对抗攻击,从而触发模型重训练、阈值重新校准等早期纠正动作,保障电信运营的稳定运行。

此外,置信度指标可实现隐私与透明度的平衡:对于敏感用户数据,高置信度预测可提供详细的解释,低置信度预测则仅输出抽象摘要,最大限度降低敏感信息泄露风险,同时保障模型的可解释性与运营可靠性。

在通感一体化(ISAC)等新兴电信技术中,置信度指标同样至关重要。这类场景中,通信与感知任务需要在有限数据、高不确定性的条件下实现精准协同,置信度指标可作为安全保障,确保电信大模型的决策,在复杂、多任务重叠的场景中,始终保持可靠性与可解释性。

在频谱分配、干扰管理等任务中,置信度评分可增强行业对系统建议的信任度,让运营商能够高效响应快速变化的环境条件。

要提升电信大模型的可信性,必须将置信度指标作为核心架构组件嵌入模型设计中。这需要在推理速度、模型体量、互操作性,与电信行业的可信性需求之间实现平衡。轻量化置信度估计方法,是满足时延要求的核心;差分隐私等隐私保护技术,可保障模型解释不会泄露敏感数据。此外,置信度指标可优化级联场景中的跨网络同步,实现对威胁或异常的无缝、协同响应 [519]。

将置信度驱动的策略融入电信大模型的设计与部署,可让电信网络有效应对实际落地挑战,增强系统韧性、安全性与透明度,让电信大模型能够满足下一代电信环境的严苛要求,同时建立利益相关方的信任。

保形预测,是大型生成式模型可信 AI 增强的另一项潜在创新技术。通过提供数学上严格的不确定性量化与校准置信区间,保形预测可保障模型在文本、图像等高维复杂模态中,输出结果的可靠性、透明度与鲁棒性。

这一技术可让生成式模型的输出,具备统计学上的有效保障(例如文本连贯性、图像保真度的置信度评分),解决模型过度自信、偏见、幻觉等问题,同时增强用户信任与可问责性。保形方法的融入,还可实现实时监控与自适应反馈,保障模型在复杂度与数据规模提升的过程中,始终保持系统可靠性。

13.2.2 开放无线接入网(O-RAN)架构中的电信大模型

行业希望将开放化、虚拟化、互操作性、模块化、AI 原生运行等当前行业前沿理念,融入无线网络,这推动了 O-RAN 联盟的成立。开放无线接入网(Open RAN)的核心,是对现代无线架构与功能的全面变革,在融入上述特性的同时,最大化商用现货(COTS)硬件的使用,最大限度减少专有硬件的应用。

O-RAN 架构 [520],以及配套设计的接口与协议,总体上支撑三大控制闭环,分别聚焦不同功能,对应三个不同的时间尺度:非实时(Non-RT)控制闭环,聚焦 1 秒及更长的时间周期;近实时(Near-RT)控制闭环,运行周期为 10 毫秒至 1 秒;实时(RT)控制闭环,响应 10 毫秒以内的环境变化。

根据定义,控制闭环需要配备对应的控制与管理单元(功能、实体),负责对网络中的动态变化做出智能化响应。这一职责由无线接入网智能控制器(RIC)承担,分别对应长周期(1 秒以上)与短周期(10 毫秒至 1 秒)运行,即非实时无线接入网智能控制器(Non-RT RIC)与近实时无线接入网智能控制器(Near-RT RIC)。

其中,非实时无线接入网智能控制器,被设计为服务管理与编排(SMO)的一部分,通过 A1 接口与近实时无线接入网智能控制器连接。根据 O-RAN 规范 [520],非实时无线接入网智能控制器的核心职责之一,是支撑底层网络的智能优化。为实现这一目标,可利用各类现有的机器学习与人工智能工具。

无线接入网智能控制器可访问丰富的数据分析能力,应用 AI/ML 推理能力;同时,还负责管理服务管理与编排体系内的机器学习模型,通过 A1 接口的机器学习模型管理服务,向近实时无线接入网智能控制器下发模型变更指令。

如前文所述,AI/ML 通过将人工智能原生融入无线网络,成为 O-RAN 的核心支柱之一。其规划的 AI/ML 应用场景极为广泛,涵盖流量管理、安全应用、能效优化、冲突管理与检测等多个领域。关于 O-RAN 中机器学习框架的更多信息,可参考文献 [521] 与 [204]。

模块化应用,即与非实时无线接入网智能控制器配套的 rApps,以及与近实时无线接入网智能控制器配套的 xApps,是整个 O-RAN 生态体系的核心组成部分。遵循微服务理念,xApps/rApps 为移动网络运营商提供了完整且模块化的功能,负责在无线网络中执行特定任务。

这类应用的典型场景包括:非实时闭环运行的覆盖与容量优化、节能管理、流量管理;近实时无线接入网智能控制器中短周期运行的流量调度与优化。按照设计,这类应用可通过专用 AI/ML 方案实现能力增强。AI/ML 功能可作为应用本身的内置特性,同时,应用也可向对应的无线接入网智能控制器,请求访问现有的机器学习模型或工具。

这是因为,应用本身并不适合进行长期的模型训练与修改,其应依托移动网络运营商预训练、并在服务管理与编排体系中管理的模型运行。

目前可以明确的是,O-RAN 从设计之初,就原生支持各类 AI/ML 技术的融入,包括电信大模型。核心关键点在于,电信大模型是需要消耗大量资源的语言模型。

分析 O-RAN 架构,并遵循文献 [204] 中明确的机器学习框架初始协议,服务管理与编排(SMO),将成为未来无线网络中,管理电信大模型应用全流程的核心主体;而双无线接入网智能控制器体系,则负责利用电信大模型,实现更优的网络优化。

这一方向的核心挑战,在于需要海量的算力与内存,才能在合理的时间内,高效处理所有可用数据。通常从实现与硬件角度来看,服务管理与编排(及非实时无线接入网智能控制器),将被分配更多的计算资源与算力。

因此,配备了文献 [521] 所述的全量机器学习管理闭环的服务管理与编排,从设计上就天然适配电信大模型工具的融入。此外,服务管理与编排与非实时无线接入网智能控制器,可访问存储在多个数据库中、来自多源的丰富上下文信息,因此可利用生成式 AI 工具,实现网络的多模态推理与优化。

基于多模态电信大模型的推理与能力,为网络优化带来了多方面的价值:

第一,通过处理底层网络长期采集的海量数据,AI 模型可从短期与长期视角,反映网络运行的各类特征;同时可适配网络规模差异,针对节点数量少的小型网络(或网络片段),与包含大量基站与用户的大型网络,制定差异化的决策。

第二,电信大模型可融合服务管理与编排中可用的各类丰富信息,实现能力增强。这类上下文信息包括特定用户的偏好、无线环境 / 无线服务地图、公交与电车时刻表、当地市政部门的大型活动规划等。通过对这些数据的智能化处理,电信大模型可制定更优的优化决策。

第三,模块化应用(包括 rApps 与 xApps),无法独立运行专属的电信大模型。因此,将电信大模型作为 O-RAN 架构的原生组成部分,可为 xApp 与 rApp 开发者提供全新的机遇,帮助其打造更优的优化功能。

13.2.3 6G 数字孪生中的电信大模型

融合电信大模型的数字孪生(DT)技术,为 5G 行业向 6G 时代演进,带来了变革性机遇。通过创建设备、基站、通信链路等网络基础设施的实时虚拟副本,数字孪生可实现网络性能的精准仿真与优化。

将电信大模型融入数字孪生,可增强其智能化与自适应能力,让网络不仅能够映射物理系统,还能以前所未有的效率,完成分析、预测、主动解决问题。二者的协同,是管理 6G 网络复杂度的核心关键 ——6G 网络的核心特征,就是超密集连接、智能自动化、动态资源分配。

电信大模型在增强数字孪生能力方面发挥着核心作用,为网络管理带来了先进的自然语言理解、推理与决策能力。通过处理与解读海量数据集,嵌入数字孪生的电信大模型,可提取可落地的业务洞察,优化资源配置,以类人化的方式实现实时决策。

这让运营商能够模拟复杂场景,基于合成数据训练 AI 模型,实现更快、更精准的网络行为预测。最终形成一个闭环系统,电信大模型可增强数字孪生的内省、预测与主动能力,推动网络的自主化运营与持续自优化。

电信大模型的融入,还为 6G 网络的自动化与创新开辟了全新路径。例如,数字孪生中的电信大模型,可通过自然语言解读日志与指标,简化网络故障排查,实现运营商与智能系统之间的无缝协同;还可简化策略生成流程,适配不断变化的网络需求,为终端用户提供个性化的网络体验。

从规划与测试自动化,到实时 AI 训练、数据驱动决策,融合电信大模型的数字孪生,将成为下一代网络实现敏捷性、可扩展性、智能化的核心创新技术。

13.3 面向下一代网络的体系框架

综合电信大模型的所有挑战与创新使能技术,我们构建了一套完整的体系框架。该框架从概念层面,规划了打造真正自主化下一代(Next-G)网络的完整架构、技术栈与核心原则。

图 68 展示了这套整合后的完整逻辑框架,用于规划电信大模型驱动的下一代自主化网络。MAESTRO [522] 是一项对这些概念进行深入阐释与拆解的标杆性创新研究。该框架基于打造真正自主化网络的前沿原则与核心使能技术构建,下文将对这些核心维度进行深入分析,包括云原生原则、意图驱动网络、多智能体系统与自动控制系统

图68 下一代逻辑网络框架

13.3.1 云原生下一代网络

云原生原则,是实现 6G 网络所需的动态网络自动化的核心基础,尤其在电信大模型的融合与管理方面。通过微服务架构、容器化、持续集成 / 持续部署(CI/CD)流水线,云原生设计为 6G 超动态环境,提供了所需的模块化、可扩展、灵活的基础设施。

这些原则让网络功能与电信大模型,能够独立完成部署、升级与扩容,无缝适配流量负载、用户需求、服务要求的持续变化。这种模块化设计,降低了系统复杂度,缩短了开发周期,增强了自动化运营的可靠性。

云原生原则的核心优势之一,是简化了网络配置与管理。通过声明式 API、自动化配置工具、Kubernetes 等编排框架,运营商能够在多样化环境中,高效、统一地管理复杂的网络配置。这简化了电信大模型的部署与优化 —— 电信大模型的运行,依赖海量的算力资源与动态数据流。

此外,云原生自动化减少了人工干预,最大限度降低了配置错误,加快了创新网络功能的落地速度。在实时自适应能力与智能化为核心要求的 6G 时代,云原生原则为动态编排、电信大模型的高效部署、网络持续优化,提供了坚实的基础,成为下一代网络基础设施不可或缺的组成部分。

13.3.2 意图驱动网络(IBN)

意图驱动网络(IBN),是 6G 等下一代网络的核心技术,因为它简化了网络管理 —— 运营商只需指定高层级的目标,无需制定详细的配置方案。在高度动态、复杂的环境中,设备、服务、用户需求的数量极为庞大,传统的人工配置方式已不再适用。

意图驱动网络让运营商能够定义预期结果(例如时延要求、安全策略、带宽分配),网络可自主调整参数,实现这些意图。这种自动化与抽象能力,不仅降低了运营开销,还提升了网络敏捷性,让网络能够实时适配环境与需求的变化。

对于专为电信应用定制的先进 AI 模型 —— 电信大模型而言,意图驱动网络提供了一套框架,将高层级业务目标与网络运营对齐。电信大模型可解读运营商指定的意图,将其转化为网络基础设施中可执行的配置方案。

通过意图驱动网络,电信大模型可更高效地实现网络优化自动化,预测潜在问题,落地前瞻性措施。意图驱动网络与电信大模型的协同,打造了更智能、响应更迅速的网络,能够在下一代电信环境中,提供个性化服务、提升资源利用率、优化整体用户体验。

13.3.3 优化方法

控制理论与自动控制系统中的标准优化方法,是 6G 等下一代网络中,保障网络意图稳定落地、持续执行的核心关键。这些方法提供了基于数学理论的框架,用于管理电信网络固有的动态与多变条件,例如流量负载波动、信道质量变化、用户需求动态调整。

通过持续监控网络状态,应用控制算法,这些方法可对网络配置进行精准调整,确保时延、吞吐量、能效等高层级意图持续落地。即使在充满挑战、不可预测的环境中,这种稳定性也能保障服务的可靠交付。

将优化技术融入意图执行流程,可保障网络的韧性与自适应能力。例如,模型预测控制(MPC)、基于反馈的控制闭环等方法,可根据信道质量、设备移动性的实时变化,动态调整资源分配、优化路由策略。

这些技术,为 AI 系统生成的决策提供了鲁棒的落地机制,与电信大模型的能力形成互补。二者共同构建了一套完整的体系:意图被转化为可执行的策略,系统对策略的合规性进行监控,并持续优化调整,在多样化、持续演进的环境中,维持网络的性能与稳定性。标准优化方法的融入,保障了下一代网络能够达到 6G 时代所需的可靠性与效率要求。

13.3.4 多智能体组网

多智能体系统(MAS)在下一代网络中发挥着关键作用,尤其是在多租户模式、分布式架构成为主流的场景中,如图 68 所示。在这类环境中,租户、运营商、服务等大量独立主体,需要在共享的网络基础设施中共存与协同。

多智能体系统提供了一套框架,让代表这些主体的自主智能体,能够以动态、可扩展的方式进行协作、协商、解决冲突。这对于多租户网络中,维持网络效率、保障公平的资源分配、化解潜在纠纷至关重要。此外,多智能体系统实现了分布式决策,这对于管理分布式 6G 网络的复杂度与规模,是不可或缺的。

电信大模型通过引入先进的上下文理解与自然语言能力,增强了多智能体系统的能力。这些能力让智能体能够解读精细化的意图,通过自然语言高效交互,制定与整体网络目标一致的决策。

例如,电信大模型可通过解读与生成策略、基于网络环境与租户需求的上下文知识解决冲突,促进智能体之间的无缝协同。多智能体系统与电信大模型的融合,为下一代网络提供了强大的协同机制,可支撑自主资源管理、前瞻性故障处理、自适应服务供给等应用落地。二者的协同,保障了分布式、多租户网络的凝聚力、高效性,以及对持续变化需求的响应能力。

13.3.5 小语言模型(SLMs)

小语言模型(SLMs)在下一代网络中的重要性持续提升,因为其能够实现高效决策,同时大幅降低开销与基础设施需求。与大模型不同,小语言模型所需的算力、内存、存储资源更少,非常适用于资源受限环境的部署。

其轻量化架构,使其能够在单块 GPU 上运行,实现低成本的规模化扩展与更低的能耗。尽管体量更小,小语言模型在意图解读、异常检测、策略生成等众多电信应用场景中,仍可提供足够的精度与性能,是实际落地场景中的实用解决方案。

小语言模型尤其适用于网络边缘等低时延、资源受限的环境。随着边缘计算成为 6G 网络的核心基石,将智能模型部署在靠近终端用户的位置,对于最大限度降低时延、提升服务响应速度至关重要。

小语言模型可在这类分布式环境中高效运行,实现本地化决策与实时调整,无需依赖中心化基础设施。这使其成为动态资源分配、实时监控、边缘设备协同等边缘应用场景的不可或缺的技术,保障下一代网络能够满足持续演进需求,实现所需的敏捷性与效率。

好书推荐

本书由吴冬升、李大成担任主编,机械工业出版社出版。书中在分析智慧城市重点建设内容和智能网联汽车重点发展内容基础上,进一步探讨智慧城市与智能网联汽车融合发展带来的车联网智能道路基础设施、新型能源基础设施、地理位置网、现代信息通信网、车城网平台建设和发展情况。并且介绍智慧城市与智能网联汽车融合创新发展的相关案例。

吴冬升 博士

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

「5G行业应用」是聚集TMT行业资深专家的研究咨询平台,致力于在5G时代为企业和个人提供客观、深入和极具商业价值的市场研究和咨询服务,帮助企业利用5G实现战略转型和业务重构,专注提供5G行业最新动态及深度分析,覆盖通信、媒体、金融、汽车、交通、工业等领域。