音频 / 语音用户接口(VUI)是未来人机交互的一个重要的新兴趋势,将越来越多地用于智能家居控制、楼宇自动化、智能零售、联接的汽车、医疗等物联网垂直领域,这涉及语音触发、识别、处理技术,同时设计人员还面临如何提高能效的挑战。针对本地和云端,安森美半导体都有相应的 VUI 方案,提供先进的语音触发、识别、处理、控制等功能,具备出色的计算能力和能效,确保卓越的用户体验。

 

VUI 架构及分类

图 1 是基于麦克风阵列的高级语音接口架构,本地处理需要进行说话人跟踪、语音增强,其中涉及波束成形、唤醒词检测、声源定位、降噪、语音检测等技术,云端方案则涉及自然语言处理。其后,指令还需通过音频播放功能播放出来,同时需进行回声消除。

 

图 1:基于麦克风阵列的高级语音接口架构

 

本地 VUI 以预存的词或句为识别单位,说话人可以是特定用户也可以是非特定用户,而云端 VUI 基于人工智能进行语义理解和语音合成,说话人是非特定用户。本地 VUI 通过蓝牙联接网络,而云端 VUI 通常通过 WiFi 联接。本地 VUI 的功耗和信息泄露的风险相对更低,云端 VUI 具有更高的识别率和扩展性。相对而言,本地 VUI 比云端 VUI 的功耗低。设计人员可根据特定应用需求决定是用本地 VUI 方案还是云端 VUI 方案。

 

本地 VUI 方案

根据本地 VUI 方案的特点,它必须能进行双向语音通信,能识别非特定用户语音,支持充足的指令和多种语言,可灵活扩展,最好把波束成形和降噪等技术集成到单个芯片上以降低成本和减小占位。如安森美半导体的单芯片方案 LC823450,含双 Cortex-M3 核,集成数字信号处理(DSP)用作语音前端处理,SRAM 提供 1656k 字节内存,无需配备辅助内存芯片,含两个数字麦克风 I/F 接口、两个数模转换器,包括回音消除、降噪等先进功能,具备极高扩展性、小占位,功耗超低,若结合生态系统合作伙伴的语音控制技术如 Sensory 的 TrulyHandsfree,支持唤醒词和语音命令的定制,适用于家居自动化和音乐播放的语音交互。

 

图 2 所示为本地 VUI 方案的一个示例应用框图及评估板。采用安森美半导体的超低功耗音频处理单芯片 LC82345X、麦克风预放大器 FAN3852、低压降稳压器(LDO)NCP170、同步 PWM 开关降压稳压器 NCP3170、单声道音频功率放大器 NCP2823。安森美半导体凭借在电源管理的经验和专知,使这方案实现超低功耗,这是此方案与其他竞争对手方案相比的一个优势。现有的方案虽然未集成 WiFi、蓝牙双模的模块,但安森美半导体已收购了 WiFi 领袖 Quantenna,已具备相关技术,未来会考虑将 WiFi 模块也集成进去。

 

图 2:语音控制应用框图及评估板

 

云端 VUI 方案

从应用场景来看,云端 VUI 除了进行语义理解和语音合成,还可推送各种服务,如智能语音助手除了可播放音乐、讲故事,还支持智能零售,如打车、叫外卖等。当前云端 VUI 的一个痛点是工作频率较高,需外接存储器和闪存,耗电量大,物料单(BoM)成本高。安森美半导体的音频 DSP 系统单芯片(SoC)LC823455 方案很好地解决了这些痛点问题,集成 4M RAM,无需外部存储,除了 CPU 核外还含波束成形、降噪、回音消除功能,集成预实现的音频硬件(模数转换器、数模转换器及功放),降低 BoM 成本,因降低时钟频率从而提供功耗优化的 MCU,功耗超低,提供稳定的联接和极高扩展性,宽广的封装阵容支持各种音频产品,如音乐播放器、录音器、智能家电、WiFi/ 蓝牙音箱等。

 

图 3 所示为智能音箱参考设计框图,此参考设计基于 LC823455,有 4 个 ONA101V 和 1 个 ONA40 功放,含 USB-C PD 源 / 汲接口,支持 Strata 平台,设计人员只需将此评估板插入装有 Strata 的电脑,即可自动识别并开始下载相关的所有文档及配套资料,包括原理图、布板、测试报告、用户指南等,同时出现图形用户界面(GUI),显示所有相关参数和选项供工程师开始评估,帮助加快和简化开发。此参考设计目前支持亚马逊 Alexa 语音服务,安森美半导体也在同中国国内一些语音服务商接洽,未来也会支持国内语音助手。这方案最显著的一个优势也是超低功耗,经过将其与竞争对手方案的功耗进行测试,安森美半导体的方案功耗约为竞争对手方案功耗的一半。

 

图 3:智能音箱参考设计框图

 

安森美半导体的移动及智能音箱音频技术 / 知识产权

安森美半导体具备丰富的知识产权支持移动及智能音箱的设计开发,包括音频处理系统、D 类功放、麦克风预放大、高性能音频开关,提供具竞争力的优势助力设计人员设计出具竞争优势的产品。

 

在音频处理系统方面的竞争优势包括小的 PCB 占位、高度集成的 SoC(CPU+DSP+音频)、集成 ARM Cortex-M3 双核、专有的 32 位 DSP。

 

在 D 类功放方面,支持小于 10 W、10W 至 30 W,针对大于 30 W 的应用仅提供样品。其中小于 10 W 的功放尺寸小,采用模拟输入,10W 至 30W 的功放支持数字接口,提供最佳的动态范围、增益误差漂移。

 

对于麦克风预放大,安森美半导体的方案采用最小的标准间距 WLCSP 封装将模拟音频转换为数字音频,支持不同的传感器接口。

 

音频开关方面,安森美半导体提供最小阻抗 / 面积的耗尽型开关。

 

周边技术:USB Type-C 和 D 类功放

USB Type-C 使每个端口都能成为电源、数据、视频或音频端口,大大地方便了用户,将越来越多地用于各种电子应用,如语音交互。安森美半导体提供完整的 USB Type-C 方案阵容支持音频应用的开发,包括供电、复用音频信号、信号开关、接口保护等,具有最小的占位、超低静态功耗,集成丰富的保护功能。

 

智能音箱等新兴音频应用对功放的要求越来越高,安森美半导体针对性地开发出了一系列 10 W 以上功率等级的 D 类功放产品线,结合陶瓷封装技术、CMOS 电路技术及可针对不同应用定制的功率 MOSFET 技术,提供低热阻、高频互联、高功率密度、低噪声(<70 uV)、低总谐波失真(THD<0.03%)等优势。以 ONA101V 为例,这是一款单通道数字输入 D 类功放,动态范围 105 dB,带喇叭采样数字输出功能,该功能实时采样所驱动喇叭的电压和电流,可使用微控制器上运行的算法来计算喇叭特性。这些参数可用于计算喇叭电阻、回响、温度等。根据这些值,可以创建算法来执行一系列任务,从而实现喇叭保护、范围扩展等功能。

 

总结

语音交互正日渐流行,语音识别和自然语言处理技术是 VUI 的基础,安森美半导体提供本地 VUI 方案和云端 VUI 方案,集成波束成形、回音消除、降噪等先进的语音处理技术、超低功耗电源管理及 USB Type-C、D 类功放等周边器件,并携手生态链合作伙伴,大大降低 BoM 成本,同时具备出色的计算能力和超低功耗,提供极佳的用户体验。