扫码加入

  • 正文
  • 相关推荐
申请入驻 产业图谱

AI语音交互ESP32 S3替代方案WT3000A M系列

03/14 09:52
170
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

ESP32-S3是乐鑫推出的一款双核 Xtensa® LX7(最高240 MHz)的 MCU SoC,片上集成 Wi‑Fi 与 BLE,内置 512 KB SRAM,支持外挂 PSRAM,适合独立运行应用与轻量 AI,深受很多用户的喜爱,无论是个人用户还是企业都有不少人采用ESP32 S3方案来做AI交互。

今天要提到的AI语音交互替代方案相比于ESP32 S3来说成本要低不少,效果也是类似的。

ESP32 S3替代方案WT3000A  M系列模块

WT3000 M系列模块也是主打AI交互的语音模块,是有语音芯片厂家唯创知音推出来的一款主打语音交互的模块。

WT3000 M系列的语音模块是采用WT2606A芯片制作而成,WT2606A是面向B端市场推出的一款语音交互芯片,为了更好适配不同用户的需求,所以在WT2606A的基础上唯创知音又推出了WT3000 M系列的模块方便用户快速集成到自己的产品上,下面带大家一起来了解WT2606A和WT3000 M系列的模块。

相比于ESP32-s3 WT3000A M系列具有以下优势

开箱即用:WT3000A可以接入各种模型,支持多轮对话、上下文记忆、声音克隆、声纹识别,实现自然对话交互,支持文生图,点播歌曲等,开发周期短,因为配套齐全,开放接口多。

WT3000A双麦克风+端侧降噪,嘈杂环境识别率90%+,3-5米远场识别,流式识别边说边出字。离线200条词条+在线35+语种200+方言。

WT3000A在线TTS依托大模型,支持超拟人音色,支持35国语种200+方言,延迟低毫米级响应。

WT3000A采用MQTT+WebSocket双协议,MQTT传指令WebSocket传音频,端侧处理实时任务云端处理AI任务。

WT3000A:1小时Demo、1天原型、1个月量产,1-2人1-2周完成开发。

WT3000A提供血压计AI健康管家、智能锁方案、AI文生图打印机、会议实时翻译等完整方案。

当然,如果只想要芯片也可以选择我前面提到的WT2606A,WT2606A是一颗为本地语音触发引擎的辨识芯片,WT2606A是一款采用QFN42封装(具体尺寸详见芯片资料图示)的本地语音触发引擎识别芯片,内置2MB/4MB SPI FLASH,具备高性能32位内核(主频160MHz,支持硬件浮点)和神经网络离线语音识别算法,能在3米远场实现精准识别并有效抑制噪声。在音频方面,它支持多种格式(MP3、WAV、FLAC等)解码,配备双通道24位DAC(信噪比≥105dB)和ADC(信噪比≥95dB),还具备环境噪声消除(ENC)与回声消除功能。此外,芯片工作电压为2.2-4.5V,支持UART控制、SD卡和USB 2.0 OTG,工作温度范围-40℃至+85℃,适用于智能家电智能家居、智能玩具等场景。

当然最重要的是,在量产的情况下,WT3000A M系列的成本要比ESP32 S3低很多。

唯创知音

唯创知音

深圳唯创知音电子有限公司位于广东省深圳市宝安区,1999年成立于广州。历经二十多年的发展,公司已成为集研发、生产、销售和服务于一体的,专注于语音技术研究、语音产品方案设计及控制等软、硬件设计的国家高新技术企业。业务范围涵盖家电、医疗器械、安防报警、汽车电子多媒体、通信、电话录音、工业自动化控制、玩具及互动消费类产品等领域,公司的集成芯片和模块主要有:播放类、录音类、MP3类、蓝牙WiFi类、语音识别类。

深圳唯创知音电子有限公司位于广东省深圳市宝安区,1999年成立于广州。历经二十多年的发展,公司已成为集研发、生产、销售和服务于一体的,专注于语音技术研究、语音产品方案设计及控制等软、硬件设计的国家高新技术企业。业务范围涵盖家电、医疗器械、安防报警、汽车电子多媒体、通信、电话录音、工业自动化控制、玩具及互动消费类产品等领域,公司的集成芯片和模块主要有:播放类、录音类、MP3类、蓝牙WiFi类、语音识别类。收起

查看更多

相关推荐