• 正文
  • 相关推荐
申请入驻 产业图谱

离线语音识别芯片从选型到量产:手把手带你走完完整流程

22小时前
222
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

几年前做智能开关面板项目,第一次接触离线语音方案。各家离线语音芯片型号都非常多,不同的词条数量,不同的识别距离,不同的识别率搞的头都大的,最后还是找了原厂的工程师协助选型,慢慢的积累了一些经验。最近发现不少同行在选型时对离线语音识别芯片的定位有点模糊,量产环节也有些细节值得注意。干脆把从选型到量产的全流程整理出来,希望对你有帮助。

选型指南:不同型号的定位与优势

以唯创知音这四颗芯片为例,名字看起来差不多,各自的定位和适用场景其实很清晰:

WTK6900P 是入门级高集成方案。内置4M SPI NOR Flash,支持15条左右命令词,2米远场识别。亮点是集成了0.5W D类功放,采用ESOP8/SOP8封装,休眠功耗仅5uA,工作电流14mA。特别适合小玩具、简易遥控灯、成本敏感型产品。UART接口简洁,外围电路简单。

WTK6900FC 面向高性能需求场景。主频220MHz,内置2MB Flash、640KB SRAM,搭载BNPU V3神经网络加速单元。支持300条命令词,5-8米远场识别,SSOP24封装。还集成了IIS、PDMPWMIIC等多类外设,适合智能家电工业控制等复杂应用。

WTK6900HA 主打灵活易用。主频192MHz,Flash可选512KB或1MB,支持3米识别。提供SOP16、SSOP24、QFN32三种封装。最大特色是支持通过唯创在线语音平台自行制作工程,可用离线语音识别下载器更新固件。需要频繁调整词条或自主烧录的场景,这颗最方便。

WTK6900HC 是旗舰级全功能型号。主频240MHz,Flash最大4MB,支持5米识别,还集成了蓝牙V5.1(BR+EDR+BLE)。一颗芯片同时搞定语音识别和蓝牙连接,适合需要APP配网或蓝牙音箱联动的产品。SSOP24封装下保留了大量GPIO,扩展性很强。

快速选型参考:低成本、小词条、简单控制选P型号;词条多、距离远、外设丰富选FC;自主烧录、灵活调整、中等性能选HA;需要蓝牙、追求最强性能选HC。

硬件设计:这些要点手册都写清楚了

电源布局的关键要求

翻阅这几份手册,你会发现电源滤波电容的放置有明确规定:电容必须紧靠芯片电源引脚,距离控制在1.5-2mm以内。这是确保芯片稳定工作的基础。

具体到每颗芯片:FC的AVDD、VCC、VOUT、VREG四个引脚各接4.7uF电容到地;HA和HC的VOUT接105电容(1uF),VREG接105电容;P的VOUT的LDO输出电容按推荐值添加即可。

另外,MIC电路应远离功放、射频、PWM信号走线,以保证语音识别的信噪比。手册中的参考布局图非常直观,直接照着做就行。

麦克风选型与连接

这几颗芯片官方推荐驻极体麦克风,型号JMO-627BA283R-10TC38。灵敏度-28dB,信噪比70dB,性能稳定。

连接方式各有特点:FC采用差分输入(MICPR/MICPL),抗共模干扰能力强,适合长距离走线;HA和HC采用单端输入(MIC+),MICLDO提供偏置电压,电路简洁;P提供单端和差分两种接法,参考手册里的参考电路即可。

一个小技巧:在麦克风偏置电压(MICLDO)输出端对地并联1uF电容,能进一步降低电源噪声,提升录音质量。

UART通信电平说明

所有芯片的UART接口均为3.3V TTL电平。如果主控MCU是5V供电,手册明确建议:对于耐压受限的引脚(如WTK6900P的第8脚),应增加电平转换电路。常见做法是用两个NPN三极管搭建双向转换,或者使用专用电平转换芯片。HA、HC和FC的部分UART引脚具备5V耐受能力,但手册推荐仍按3.3V逻辑设计最可靠。

软件协议:掌握这套UART指令就够了

这几颗芯片的UART协议高度统一,掌握下面几条常用指令就能应对绝大多数场景。

通讯参数:波特率9600或115200,8数据位,无奇偶校验,1停止位。采用十六进制收发。

帧格式:7E 06 FF 06 01 词条ID 校验和 EF

7E:起始码

06:后续数据长度(FF 06 01 词条ID 校验和 共6字节)

FF 06:扩展码

01:命令码(识别结果上报)

词条ID:识别命中的词条编号

校验和:从“长度”到“词条ID”累加,取低字节

EF:结束码

举例:识别到“打开灯光”(词条ID=02),芯片输出:7E 06 FF 06 01 02 0E EF。校验和计算:06 + FF + 06 + 01 + 02 = 10E → 低字节0E。

查询软件版本(C0)

发送:7E 03 C0 C3 EF。芯片返回的十六进制数据转成ASCII字符串,例如WTC250331-A1-K3,其中包含发布日期和内部版本代号。量产前通过此指令确认固件版本是否正确,是个很实用的验证步骤。

音量控制(A1)——HA/HC支持

7E 07 FF 06 A1 01 AE EF,末尾的01表示音量等级(1~5级可调)。该指令支持实时调节,且芯片会记住最后一次设置,下次上电自动恢复。

唤醒与低功耗管理(A7、02)

主动唤醒芯片:7E 06 FF 06 A7 00 B2 EF

进入低功耗模式:7E 06 FF 06 02 00 0D EF

退出低功耗:只需发送任意一帧有效数据即可唤醒。

HA和HC的低功耗模式功耗在几十微安级别,P型号更是低至5uA,非常适合电池供电产品。

被动播报与应答(A0)

这个功能用于主机主动触发芯片播报指定语音。例如按下一个按键,希望芯片说“灯光已打开”,发送:7E 07 FF 06 A0 00 02 AE EF,其中02是词条ID。芯片成功执行后会回复7E 06 FF 06 A0 05 B0 EF作为确认。在按键+语音双控的产品中,这个功能非常实用。

量产环节:三个重要注意事项

固件烧录方式

FC通过RX/CLK和TX/DAT两个引脚烧录,配合专用下载器操作。HA和HC支持在线语音平台(https://wt588f.waytronic.com:8443)制作工程,然后使用离线语音识别下载器更新固件。P通过第8脚(P00/P06)下载,上电时该引脚需保持高电平

批量生产时,可根据实际贴片工艺选择先烧录后贴片,或贴片后通过预留测试点烧录,两种方式都成熟可靠。

回流焊温度控制

手册给出了明确的回流焊温度曲线。手工焊接时:热风枪温度不超过350°C,时间不超过15秒;加热平台焊接时:温度不超过260°C,时间不超过15秒。交给SMT厂生产时,直接将手册中的温度曲线图提供给工厂,他们会按照标准工艺执行。

麦克风的一致性保障

手册中标明了麦克风的灵敏度范围(-31dB ~ -25dB,典型值-28dB)。为确保量产一致性,建议对来料进行抽检:在相同声压级下测试麦克风输出幅度,偏差在3dB以内的批次即可放心使用。另外,生产时记得给麦克风贴上防尘网,能有效防止长期使用中灰尘进入影响性能。

常见设计要点汇总

未使用引脚的处理:FC手册标注“NG”的引脚为暂未使用,保持悬空即可。

唤醒词与命令词的ID分配:参考标准词条表,唤醒词ID=01,10秒自动退出的特殊ID=FF,自定义词条时注意避开这些保留ID。

时钟源选择:FC若采用内部RC振荡器,工作温度范围为-10~70°C;需要-40~85°C全温范围应用时,建议外接晶体振荡器。HA、HC、P对时钟源的适应性更宽,外接晶振可进一步提升频率稳定性。

功放使能控制:HA参考电路中提及WT8062功放,使能脚低电平开启、高电平关闭。利用芯片的BUSY脚控制该使能脚,可在播放语音时自动开启功放,播放完成后关闭,获得干净的开机效果。

写在最后

离线语音识别技术已经非常成熟,唯创知音WTK6900系列覆盖了从低成本到高性能、从基础识别到蓝牙融合的多种需求。无论你是做智能家电、照明、玩具还是卫浴产品,都能找到合适的型号。

选型时关注主频、Flash容量、封装和功耗指标。硬件设计上,电源滤波和麦克风布局是重中之重。软件调试时,把UART协议调通,上述几条指令用好,整个开发流程就能顺畅推进。

如果你的项目正好有离线语音识别芯片开发的需求,希望这份从选型到量产的流程能给你一些参考。实践出真知,动手做起来会发现更多有趣的应用可能。

唯创知音

唯创知音

深圳唯创知音电子有限公司位于广东省深圳市宝安区,1999年成立于广州。历经二十多年的发展,公司已成为集研发、生产、销售和服务于一体的,专注于语音技术研究、语音产品方案设计及控制等软、硬件设计的国家高新技术企业。业务范围涵盖家电、医疗器械、安防报警、汽车电子多媒体、通信、电话录音、工业自动化控制、玩具及互动消费类产品等领域,公司的集成芯片和模块主要有:播放类、录音类、MP3类、蓝牙WiFi类、语音识别类。

深圳唯创知音电子有限公司位于广东省深圳市宝安区,1999年成立于广州。历经二十多年的发展,公司已成为集研发、生产、销售和服务于一体的,专注于语音技术研究、语音产品方案设计及控制等软、硬件设计的国家高新技术企业。业务范围涵盖家电、医疗器械、安防报警、汽车电子多媒体、通信、电话录音、工业自动化控制、玩具及互动消费类产品等领域,公司的集成芯片和模块主要有:播放类、录音类、MP3类、蓝牙WiFi类、语音识别类。收起

查看更多

相关推荐