• 正文
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

(金鼠纳福)ReSpeaker Core v2.0测评——DIY属于自己的AI音箱

2018/06/27 作者:电路城噜咔
9
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

最近火遍了大江南北的语音识别必将是各大公司争相进场的领域,各大平台都在出自己的语音识别云平台,而很多应用厂商想快速使用和对接语音识别云平台无疑需要花费比较大的功夫,花了大量的人力和时间往往也很难得到比较好的结果。是不是想要在短短几天就能玩转语音识别,然后修改修改代码就能轻松产品化呢?那你需要了解一下ReSpeaker Core v2.0。

Respeaker Core v2.0智能语音开发板 购买链接>

ReSpeaker Core v2.0简介

ReSpeaker Core v2.0专为语音接口应用而设计。它基于四核ARM Cortex A7的Rockchip RK3229,运行频率高达1.5GHz,具有1GB RAM。该电路板具有六个麦克风阵列,语音算法包括DoA(到达方向),BF(波束形成),AEC(声学回声消除)等。 ReSpeaker Core v2.0运行GNU / Linux操作系统。受益于功能强大且活跃的社区,开发板允许使用现有软件和工具进行开发,测试和部署,从而实现快速产品开发。ReSpeaker Core v2.0的设计初衷,是为了满足多样化的企业需求。开发板主要分成两个部分,第一部分是包含CPU,内存(RAM)和PMU。第二部分是包含外设的外部载板,如eMMC,连接器和无线连接组件。开发板这两个部分,都可以通过Seeed的服务来定制。

ReSpeaker Core v2.0开箱

好了,我们来一起体验一下吧。

刚拿到的第一天外包装就被家里的猫主子啃了很多牙印在上面,由此推测盒子的口感一定很好。

外包装正面印着全英文的说明,简单的介绍了ReSpeaker Core v2。

外包装的背面是Seeed公司的介绍及设备清单。

打开包装后可以看到核心处理器板是通过邮政孔贴合在底板上,六边形板型显得很特别,随机带了一根MicroUsb的数据线,并没有给出纸质相关资料和使用说明(可在官网上找到对应资料的wiki网址)。

ReSpeaker Core v2.0较V1.0有较大改动,首先由原来的两块拼接的电路板变成了现在的所有设备都集成在一块电路板。处理器方面也是由原来的MT7688升级成了处理功能更强悍的RK3229。麦克风由原来的1个麦克风升级为现在的6个麦克风阵列。这些改变都使得V2版本的ReSpeaker Core有着更加卓越的表现。

整个板子的规格参数如下:

ReSpeaker Core v2.0正面板载资源如下:

背面分布排列着麦克风和RGB LED灯及音频放大驱动芯片

整个系统架构图如下:

扩展排针的定义如下:

主控芯片RK3229

主控使用的是瑞芯微RK3229,性能定位中端,主要用于IPTV/OTT机顶盒产品,采用28纳米工艺,拥有四核Cortex-A7,主频最高可达1.5GHz,支持4K 10Bit H.264/h.265解码,支持4K 60fps电视显示。

针对语音识别瑞芯微也是给出了6麦阵列的方案,官方给出的方案框图如下:

同时也给出了相应的声源测向、噪声抑制、波束形成、回声抵消、混响消除、远距离拾音、模型匹配的麦克风阵列算法。

高性能四通道数据切换器ADC AC108

AC108为高性能四通道数据转换器ADC,主要应用于智能语音远场麦克风阵列拾音,最多可级联16路麦克风。AC108的SNR为108dB,是当前业界最高。因此,产品推出后,获得了各大语音引擎公司、算法公司的兴趣,并迅速在智能音箱、TV、OTT盒子以及USB外设等产品中量产。

ReSpeaker Core v2.0共使用了2颗AC108,对6颗麦克风的模拟信号进行采集、处理和数据转换。

麦克风、RGB LED灯

开发板使用了贴片的模拟麦克风,丝印了S1963 2892的字样,分布在六角形板子的6个脚上。

LED驱动使用了3颗三极管串接限流电阻,8颗RGB LED灯采用了串联的方式,均匀分布在底板的一周。

WIFI、蓝牙、FM模块AP6212

WIFI、蓝牙使用的AMPAK的AP6212,这是一个WIFI+BT+FM的组合方案。模块组合了IEEE 802.11/b/g/n标准,模块提供了为WIFI提供了SDIO接口,为蓝牙提供了UART/PCM接口,而FM提供了UART/I2C/PCM接口。

单声道音频放大器S8508E

CS8508E是一款高效率,超低EMI8.0W单声道音频放大器。在电源电压为7.4V的情况下,CS8508E可以为4欧的负载输出6.8W的功率。CS8508E 无需滤波器的PWM调制结构减少了外部元件、PCB面积和系统成本,而且也简化了设计。2.5~8.8V宽电压工作范围,D类模式高达90%的效率,AB类D类模式可切换的Ω 的负载输出6.8W的功率。在D类模式下快速的启动时间和纤小的封装尺寸使得CS8508E成为双节锂电池在串联的电源供电情况下最适用的音频功放。板载CS8508E为JST2.0音频输出接口外接的喇叭提供驱动。

上电使用

在Seeed的官网上可以找到ReSpeaker Core v2.0的使用说明手册:网页地址

开始使用之前你需要另外准备一张大于4G的TF卡和一个音响。小编拆了小米蓝牙音箱将喇叭焊了转接头接到了JST2.0音频接口上。

根据wiki使用说明上的说法,如果你需要使用ReSpeaker Core v2.0做一些开发则建议使用官方提供的lxqt+sd版本的系统镜像文件。
但小编根据wiki提供的下载链接下载下来的映像在使用语音识别示例的过程中一直报MRAA错误,之后官方更新了wiki但在进行SHA256校验时与校验文件不一致无法烧写,于是小编认真的把官方关于ReSpeaker Core v2.0问题的帖子通读了一遍终于找到了正确的系统镜像“respeaker-debian-9-lxqt-sd-20180610-4gb.img.xz”。浪费了很长时间,希望官方提起精神上传完文件亲自下载测试一下。

在此给出正确固件下载链接:下载地址

烧写可以使用Etcher,在电脑上打开软件插入TF卡,按照提示步骤烧写系统固件,烧写完成后将TF卡插入开发板,上电后电路板正面的USER1、USER2灯会来回闪烁直至有一灯常亮即完成了系统安装,安装过程大约需要10分钟左右。整个系统安装过程和树莓派相似,比较简单。

完成系统安装之后使用Mircro Usb连接OTG接口,待系统启动后电脑上出现一个串口设备,Windows10可自行搜索安装驱动。

通过PuTTY的串口可登陆系统。

根据说明文档提示连接WIFI并进行系统更新后即可进行下一步操作。

ReSpeaker Core v2.0提供了丰富的语音识别应用示例,在此小编给大家演示一下Amazon的Alexa。

  • 步骤1:安装AVS库(Python)

sudo apt update

pip install avs

  • 步骤2:授权Alexa

通过VNC登陆,打开终端输入指令。

~/.local/bin/alexa-auth

桌面自动弹出登陆网页,登陆亚马逊账号即可完成授权。

  • 步骤3:安装Alexa应用

cd ~

git clone https://github.com/voice-engine/voice-engine.git

cd ~/voice-engine/examples

  • 步骤4:运行Alexa应用

python kws_doa_alexa_respeaker_v2.py

此示例包含了DoA声源定向检测,从不同角度说出唤醒词“Alexa”得到不同的角度值,如图所示第一次和最后一次的唤醒在同一个方位。

下面是AVS的实际效果,过程需要科学上网,效果还是很好的,实际唤醒距离也可以达到手册所说5米以上,而且一边看世界杯一边进行操作也是可以的。

测试视频

小结

如今语音识别服务平台越来越完善,识别精准度也越来越高,一个集成度高、容易开发、功能强大、性价比高的语音识别硬件平台将会越来越受各大厂商青睐,ReSpeaker Core v2.0正是这样的硬件,节省了大量的开发成本,从而能让产品快速上线,这正是很多工程师和智能硬件生产商所期待的。

整体体验下来,硬件平台性能不俗且很好上手。也有觉得十分不应该的就是官方给出的说明文档里的链接固件有问题,论坛的回复速度还是不够及时,希望官方能及时更正。

值得一提的是通过自己写Python代码可以使用MRAA对自己的一些外设进行操作,可将ReSpeaker作为一个语音控制器来使用,例如通过板载外扩数据接口连接无线网关就可对家里接入网关的智能设备进行控制,是不是一件很酷的事情呢,感兴趣的还是亲手来试试吧。

猜你喜欢:

2018国内工程师/创客最值得拥有开发板 Top 10排行

相关推荐

电子产业图谱