一、微波炉为什么要上语音控制
无论是家里还是在公司微波炉是厨房里使用频率很高的的电器之一,但它的交互方式几十年来几乎没变过:按键、旋钮、触摸面板。场景稍微复杂一点,这套交互就暴露出短板。小编就曾经刚入职一个公司,中午去热饭,忘记是哪个品牌的微波炉,一堆旋钮和按键,真的一脸懵不知道怎么去使用,还是旁边的同时帮忙操作的,我当时就想,一个微波炉搞那么复杂干嘛?
我直接语音控制不好吗?
手上全是油,想给微波炉加30秒。擦手、按键、再回去切菜,十几秒过去了。你在灶台前翻炒,锅里不能离人,微波炉那边热好了在滴滴响,你得跑过去关掉再跑回来。老人眼神不好,面板上密密麻麻的按键根本看不清,每次热饭都得叫你帮忙。
语音控制不是花哨功能,它解决的是这些真实存在的痛点。说一句话就能操作微波炉,不用碰面板,不用看屏幕,不用停下手里的事。
目前市面上的微波炉语音方案主要有两条路线:一条走WiFi联网+云端ASR,识别效果好,但是依赖网络,芯片模块成本相对较高;另一条走离线语音识别芯片本地处理,不需要联网,响应即时,成本可控。本文讨论的是第二条路线,基于唯创知音WTK6900系列离线语音识别芯片,给你一个从百元机到高端旗舰都能落地的完整方案。
二、WTK6900系列芯片选型分析
WTK6900系列是唯创知音面向智能家电推出的离线语音识别芯片产品线,覆盖不同的产品需求。选型时你主要关注三个维度:封装大小决定PCB面积和成本、识别距离决定使用体验、命令词数量决定功能丰富度。四颗芯片均通过UART协议与主控MCU通信,协议格式统一,换型号不需要重写通信层代码。
| 参数 | WTK6900P | WTK6900HA | WTK6900HC | WTK6900FC |
| 定位 | 入门经济型 | 标准开发型 | 增强控制型 | 高端旗舰型 |
| 封装 | ESOP8 / SOP8 | SOP16 / SSOP24 / QFN32 | SOP16 / SSOP24 / QFN32 | SSOP24 |
| CPU / 内核 | 32位内核 192MHz | 32位内核 192MHz | 32位内核 192MHz | 220MHz, DNN-HMM |
| 识别距离 | 约2米 | 约3米 | 约3米 | 5-8米 |
| 命令词数量 | 约15条 | 多条 | 多条 | 约300条 |
| 内置存储 | 4M SPI NOR Flash | 512KB/1MB SPI Flash | 512KB/1MB SPI Flash | 2MB Flash+640KB SRAM |
| 工作电压 | 2.4V-5.0V | 2.8V-5.2V | 2.8V-5.2V | 3.6V-5.5V (PMU输入) |
| 典型功耗 | 工作14mA, 休眠5uA | -- | -- | 145-250mW (内部PMU) |
| 内置功放 | 0.5W D类功放 | -- | -- | -- |
| 音频输出 | D类PWM直驱喇叭 | 两通道16位DAC, SNR>=95dB | 两通道16位DAC, SNR>=95dB | -- |
| 特色功能 | 极简8脚封装 | MP3/WAV解码, 在线平台制作工程 | 低功耗休眠, 被动播报, 5级音量, 掉电记忆 | DNN-HMM深度神经网络, 远场识别 |
| 工作温度 | -40℃~85℃ | -40℃~85℃ | -40℃~85℃ | -40℃~85℃ (外部晶振) |
(一)WTK6900P 入门方案:极简8脚封装,适合百元级微波炉
WTK6900P是整个系列中封装最小的型号,只有ESOP8或SOP8,8个引脚。它内置了4M SPI NOR Flash存储和0.5W D类功放,可以直接驱动8欧姆喇叭,外围只需要麦克风、喇叭和几个阻容元件就能工作。BOM成本极低。
这款芯片支持约15条离线命令词,对一台基础功能的微波炉来说完全够用。你可以配置以下命令集:唤醒词"你好小厨"、开始加热、停止加热、暂停、继续、高火、中火、低火、解冻、30秒、1分钟、2分钟、3分钟、5分钟、取消。
2米识别距离覆盖家庭厨房的常规操作半径。用户站在微波炉前50厘米到1米范围内下达指令,识别率稳定。休眠功耗仅5uA,整机待机不受影响。工作电压2.4V至5.0V,可以直接从微波炉主控板的5V或3.3V取电。
WTK6900P的UART指令格式与全系列一致:7E 06 FF 06 01 [词条ID] [校验] EF。主控MCU收到识别结果后,解析词条ID,执行对应动作(启动磁控管、设置定时器、切换功率档位等)。
(二)WTK6900HA 标准方案:在线平台开发,适合中端机型
WTK6900HA基于32位内核,主频192MHz,封装可选SOP16、SSOP24或QFN32,给PCB Layout提供了灵活性。内置512KB或1MB SPI Flash,支持MP3和WAV音频解码,两通道16位DAC输出,信噪比不低于95dB。这意味着反馈语音不限于简单的滴滴声或合成音,你可以用真人录制的MP3提示音,大幅提升产品质感。
HA的一大特点是支持唯创知音在线语音平台制作工程。你不需要自己训练模型,只需在平台上定义唤醒词和命令词,导出固件烧录到芯片即可。命令词数量比P型多得多,一台带烧烤、蒸煮、变频等多功能的中端微波炉,命令词动辄三四十条,HA完全可以承载。
(三)WTK6900HC 增强方案:低功耗+音量控制,适合多功能微波炉
WTK6900HC与HA同属一个平台,封装和核心能力相同,但在控制指令层面增加了四个实用功能,对微波炉产品来说每一项都用得上:
低功耗休眠指令(02命令):微波炉待机时,主控MCU通过UART发送02指令让语音芯片进入休眠,功耗降到极低。关门状态下麦克风不工作,不耗电。用户触发唤醒词时主控再发唤醒指令。
被动播报指令(A0命令):可以在主控判断加热完成后主动触发语音播报,比如"加热完成,请取出食物",而不需要用户先说唤醒词。这条对微波炉的交互体验提升非常明显。
音量控制指令(A1命令):支持1至5级音量调节。微波炉晚上热夜宵时用户希望音量小一点不打扰家人,白天则可以大音量。主控MCU可以把这个功能开放给用户设置。
掉电记忆:芯片断电后能记住上次的音量级别和状态,重新上电自动恢复。不用每次开机都回到默认值。
HC的成本比HA高不了多少,换来的体验提升却很实在。尤其是被动播报和音量控制,在微波炉上属于高频使用的功能。如果你正在做的机型带有菜单烹饪或多段火力,建议直接上HC而不是HA。
▎ 适用场景:带菜单烹饪的中高端微波炉、微蒸烤一体机、需要休眠节能的智能微波炉、出口日韩欧美对用户体验要求较高的机型。
(四)WTK6900FC 高端方案:300条命令词+8米远场,适合旗舰微波炉
WTK6900FC是整个系列的天花板型号。SSOP24封装,CPU主频220MHz,内置2MB Flash加640KB SRAM。核心差异在于采用了DNN-HMM深度神经网络声学模型,相比传统HMM模型在噪声环境下的识别准确率显著提升。厨房环境有抽油烟机噪音、炒菜声、水龙头声,普通语音芯片面对这些背景噪声识别率会明显下降,FC的DNN模型就是为这种场景设计的。
支持约300条离线命令词,这意味着你可以把微波炉的每一项功能都用语音控制:不仅是基础的火力和时间,还包括每种自动菜单的名称(热牛奶、解冻肉、蒸鱼、烤鸡翅、爆米花等)、重量输入(100克、200克、500克)、时间精确到秒的设置。甚至可以支持多轮对话,用户说"热牛奶",微波炉播报"建议中火2分钟,可以吗",用户说"可以"即可启动。
三、硬件设计与接入要点
3.1 UART通信协议
WTK6900全系列通过UART与主控MCU通信,协议格式统一,数据帧固定7字节。主控MCU只需要一个空闲UART口。波特率默认115200,8位数据位,1位停止位,无校验。收到语音识别结果后,芯片通过TX脚推送词条ID;MCU收到后根据ID映射表执行对应功能。由于四颗芯片共用同一套协议,日后从P型升级到HC或FC,MCU端代码基本不用改。
帧头: 7E 长度: 06 命令: FF 子命令: 06
参数长度: 01 数据段: [词条ID]
校验: [累加和低8位] 帧尾: EF
3.2 电源设计
微波炉主控板通常提供5V和3.3V两路电源。WTK6900P和HA/HC可以直接从5V取电,FC建议从PMU的稳定电压输出端取电。注意一点:微波炉启动时磁控管瞬间大电流会在电源线上产生脉冲噪声,语音芯片的供电需要加LC滤波(10uH电感+100uF电解+0.1uF陶瓷),否则可能出现识别错误或芯片复位。
对于HC型号,主控在微波炉待机期间应发送02休眠指令让语音芯片进入低功耗模式,整机待机功耗可以控制在微安级。
3.3 麦克风选型与结构设计
麦克风是影响识别率的最大变量。建议选用灵敏度不低于-38dB的全指向硅麦,信噪比尽量在60dB以上。P型和HA/HC型用单麦即可,FC型如果追求极致远场效果可以用双麦阵列实现波束成形。
结构上注意两点:一是麦克风开孔要朝前,正对用户操作站位方向,不要放在微波炉顶部或侧面;二是开孔位置要避开散热风扇的出风口,风噪会导致误唤醒。如果面板是金属材质,需要在开孔处做非金属装饰环,避免金属屏蔽。
3.4 喇叭与功放
WTK6900P内置0.5W D类功放,可以直接驱动8欧姆/1W的喇叭。HA和HC没有内置功放,需要外接一颗Class-D功放芯片(如NS4150或HT6872),成本增加约0.5元。FC同样需要外置功放。喇叭功率建议1W至2W,尺寸视微波炉前面板空间选择20mm至40mm圆形喇叭。
3.5 电磁兼容注意事项
微波炉内部有2.45GHz大功率微波辐射,这对任何电子器件都是严苛环境。语音芯片及其外围电路的PCB区域应远离磁控管和波导口,建议保持5厘米以上距离。音频走线避免与高压电路平行,芯片区域建议加屏蔽罩接地。晶振选型使用有源晶振比无源晶振抗干扰能力更好。
四、命令词设计建议
命令词设计得好不好,直接决定用户用不用得起来。以下几个原则来自我们的实际量产经验:
1、唤醒词控制在3至5个字。太短容易误触发(单字唤醒词像"开"或"关"绝对不能单独做唤醒词),太长用户懒得说。"你好小厨"、"小厨你好"、"微波助手"都是经过验证的选择。
2、命令词使用口语化短句。"开始加热"比"启动微波加热功能"好,"停止"比"终止加热程序"好。用户说的是口语,不是产品说明书。
3、避免发音相近的命令词。"高火"和"中火"容易误识,可以用"大火"和"中火"替代,或者直接用"火力1档"、"火力2档"。
4、设置一条全局取消词。不管当前在哪个菜单层级,用户说"取消"就能回到待机状态。这是安全底线。
5、给每句命令配置对应的语音反馈。用户说"高火",微波炉播报"已设置高火",确认感能大幅减少用户重复下达指令的情况。
如果使用WTK6900FC,还可以加入模糊语义处理。用户说"热一下牛奶",芯片不能识别"热一下"这种非标准命令,但可以把"热牛奶"作为可识别命令词,实现近似效果。更进阶的做法是在命令词库中加入自动菜单名称,用户直接说菜单名即可启动对应程序。
五、方案总结
四颗芯片覆盖了微波炉语音控制的全价位段:
| 方案档位 | 芯片型号 | 核心卖点 |
| 入门 | WTK6900P | 8脚极简、内置功放、5uA休眠 |
| 标准 | WTK6900HA | MP3音质、在线平台开发、命令词多 |
| 增强 | WTK6900HC | 被动播报、5级音量、掉电记忆 |
| 高端 | WTK6900FC | DNN-HMM、300条命令、5-8米远场 |
选型不复杂。如果你做的是百元级走量机型,WTK6900P的8脚方案几乎不占PCB面积,外围简单,上量后BOM成本极具竞争力。如果你做中端主力机型,HC比HA多出来的被动播报和音量控制是真实改善用户体验的功能,建议直接上HC。如果你做高端旗舰,FC的DNN-HMM模型在厨房噪声环境下的优势是传统模型无法替代的。
所有WTK6900系列芯片均支持UART通信,协议统一,你只需要一套MCU代码就能覆盖从入门到高端的全部型号。在线语音平台可以让你的软件工程师在拿到样片当天就完成唤醒词和命令词的定义,无需等待原厂支持。
130
