近年来,基于MEMS技术的传声器得到了广泛的应用。缩小尺寸和声学特性的改进带来了一些应用程序,这些应用程序允许我们与智能手机视频和FaceTime共享信息和体验。智能手表可以用来打语音电话。我们与数字助理交流,让我们的智能音箱播放我们最喜欢的歌曲,或通过语音控制智能家电。此外,MEMS麦克风可用于在长途飞行或听音乐时主动消除噪音。理论上讲,这很简单:麦克风将声压波转换成电子信号。实际上,麦克风提供不同级别的性能,几个参数是决定专用功能和应用程序性能的关键。当今尖端设备的潜力可能会受到所提供音频原始数据质量的严重限制。

 

用虚拟现实创造一个真正的沉浸式体验

想象一下,戴上虚拟现实眼镜,发现自己身处太平洋上一个阳光明媚的岛屿上。你在一个美丽的海滩上,欣赏着风景,走在棕榈树之间,听着海浪的声音。五颜六色的鹦鹉在你头顶上尖叫。如今,创造360°视频体验所需的硬件已经出现了,而且越来越受欢迎(图2)。然而,轻松创造附带的360°音频的能力却落后了。波兰录音技术开发商Zylia使用领先的69分贝SNR数字MEMS麦克风,使世界上第一个便携式录音室成为可能。三阶Ambisonics音频记录器Zylia ZM-1麦克风阵列可以为虚拟和增强现实(VR/AR)捕捉沉浸式3D音频(图1)。通过使用多个设备,甚至可以录制六自由度的声音。为了让虚拟现实成为一种真正的沉浸式体验,MEMS麦克风的高保真音频拾取与Zylia先进的数字信号处理算法和麦克风阵列技术相结合是关键。没有错过任何音频细节要求麦克风接近工作室麦克风质量。MEMS麦克风不仅可以提供这种性能,而且有助于进一步小型化360°录音设备。

 

图1 Zylia三阶Ambisonics录音设备


放大或减弱周围的声音

一些耳机已经被设计为最佳的360°音频收听。使用VR/AR goggles,用户可以将他们的环境转换成交互式的视听音景,并捕捉、触摸和塑造声音。通过在耳机中集成高级麦克风,周围的声音可以减弱或放大。主动降噪确保用户只听到他最喜欢的节拍,没有飞机噪音,睡个舒服觉。透明听觉模式已经开发出来,用户可以选择有多少外部声音环境,通过高级麦克风捕获,融入增强音频体验。这款耳机通过复制具有难以置信的真实感的空间效果来补充增强现实体验,帮助用户精确地感知和定位虚拟声音。通过将适当水平的外部声学环境与特定的虚拟音频世界相结合,我们便能够创造出真正沉浸式的社交体验。这些耳机可以排除分散注意力的外部噪音,这样听者就可以不受干扰地专注于感兴趣的音频内容。将主动噪声消除与主动语音增强相结合,意味着即使在嘈杂的环境中,也能听到对话中的每个词。

 

未来的通信系统

先进的音频功能减少了朋友和同事之间的感知距离。世界各地的团队都开始使用先进的视频会议系统来提高通信质量。为了提高这些设备的性能,高级MEMS麦克风越来越多地与高级音频处理相结合,如盲源分离或波束形成(图2)。今天的视频会议系统是完全集成的单元,包括编解码器、显示器、摄像机麦克风和扬声器。适用于公司的方法可能很快也会改变人们的社会生活。例如,Facebook就利用这些技术来加强朋友和家人之间的交流。在未来,设备还将包括虚拟和增强音频和视频功能。下一代的MEMS麦克风将成为智能手机等小型设备的高级通信功能的关键。

图2 今天的视频会议系统是完全集成的单元,包括编解码器、显示器、摄像机麦克风和扬声器


强大的音频和视频体验与智能手机

以前需要一个笨重的摄像机,现在可以用一个手掌大小的设备来拍摄。智能手机拍摄的视频把我们都变成了讲故事的人,让我们有机会不仅与家人和朋友,而且通过社交媒体与数百万观众分享我们的经历。

 

虽然智能手机的视频录制已经取得了显著的进步,提供了慢动作或延时等功能,但音频捕捉还没有发展到同样的程度。即使是最先进的智能手机仍然只能捕捉单声道音频,只有少量的立体声支持。难怪智能手机发出的声音很差、平淡、乏味——与优越的视觉效果不匹配。但变化正在发生:高级MEMS麦克风和先进的音频处理将智能手机音频录制带到一个新的水平。特殊的录音选项允许智能手机用户将声音放大到任何他们选择聚焦的方向。音频缩放提供了录制用户想要听到的和抑制其他声音的选项。

 

下一代语音用户界面

语音命令和与数字语音助手的对话正变得越来越流行。不幸的是,它们仍然经常需要异常响亮的声音指令,甚至是在远处喊叫。语音识别公司正在为下一代语音用户界面改进处理器和算法。在最新版本中,Alexa现在可以识别出你在低声说话,并低声回答你,以免在晚上打扰你睡觉的家人。不久之后,人们就可以通过语音命令来关闭不同房间的灯或电视。优质的MEMS麦克风和尖端的音频处理技术是使声控设备真正为日常情况做好准备的关键因素。

 

基本技术

MEMS传声器采用半导体生产工艺大批量制造。典型的设计结合了MEMS传感器和ASIC。该传感器产生一个电信号,为模拟麦克风放大或由ADC处理的数字麦克风在ASIC。MEMS麦克风,它将音频转换成电信号,基本上是一个直流偏置电容,在其中一个膜(或膜片)的运动引起的音频压力改变电容器板或板的电压。

 

膜片和后板的行为就像一个平行板电容器。当膜片由于传入声压而振动时,膜片与后板之间的间隙和电容发生变化。MEMS麦克风将这些变化提取为电信号。处理巨大声音的压力水平的主要挑战是膜的巨大机械运动,这将导致变形时,膜的位移到它的极端。第二个挑战是设计ASIC来处理MEMS元件产生的大信号。由于音频处理算法假设为线性信号,任何超过1%的失真都会导致高级音频处理所依赖的音频质量显著下降。一种方法是实现一个MEMS传感器元件,将移动膜放置在两个电容器板(双后板)之间。这产生了一个全差分输出(与单端输出相比),这有几个优点。双后板MEMS传声器由于其对称结构而使失真最小化。移动夹在电容器板上的两层膜(双膜)也可以达到同样的效果。

 

下一代高端MEMS麦克风:密封双膜

与单个后板的MEMS麦克风相比,双后板技术的引入使线性参数显著增加。下一步是带有密封双膜的电容式MEMS麦克风。电容区域的密封实际上可以实现无噪声音频信号捕获。信噪比从70 dB进一步提高到75 dB。2018年的第一个原型机已经在4.0 × 3.0 × 1.2 mm的封装中实现了75 db的信噪比。新一代的第一个设备已经被用来演示上面讨论的高级音频功能。工程样品已经为该领域的领先客户提供了先进的音频记录、主动噪声消除、通信和语音用户界面。