•         音频(模拟)

记得当时测完音频后给我的一个印象是:音频的硬件设计部分其实还是蛮简单的,但软件方面的处理是很复杂的.主要的最终目的是最大程度的还原最接近现场的声音.我就测试项目来展开介绍下对音频部分的理解感悟.

还是和视频一样,先来介绍下音频信号的产生和记录.

下面这张图是最入门的音频图:

1.  如果是最传统的方式话,忽略后面的A/D转化,把它变成录音设备,比如磁带等等.

2.  可能现场不止2个话筒,为了最真实的声音,可能会放n个话筒;

3.  A/D转换后速率是1.5Mbit/s,也就是存储1分钟的声音需要1.5M*60=90M存储空间,并且这只是2话筒的情况.所以也是需要压缩的.

我接触到的音频算法有2种:MPEG和Dolby,当然还有其他的如DTS,SDDS

4.  之前接触到Dolby最新的技术是Dolby Atmos,它是由128个独立音频混合而成的.我猜测不太可能现场放128个各个方向的录音设备,可能是很多是用软件模拟算法算出来的.

接下来回到主题,主要记录一些音频的硬件部分测试:

在初中物理就学到过,声音的三要素:响度,音高和音色.

响度:对应于电路上来说就是电压幅值大小;

音高:对应的就是声音的频率(主频率);

音色:对应的就是声音的谐波和相位(立体声原理);

其实相关的测试就是基于这声音的三要素在测的;

响度:

响度在音频输出部分主要受2个因素影响:节目源的声音和设备的音量。

设备的音量很好理解,就是你按遥控器就可以调节电视机的音量.

节目源的声音谈下我自己的理解和感悟:

1.  在录制的时候,现场肯定会有响度差别很大的声音:举个最极端的例子,一根针掉在地板上的声音和**爆炸时的声音. 那这2个声音肯定会被无差别的被录音设备所记录

2.  这两个声音的响度差了n个dB,试想,你在看电视时,为了听见针落地的声音而把音量调在一个level上,而这时突然来了个爆炸声,那岂不是太扰民了ORZ.

3.  所以这里就涉及到一个声音压缩的问题:大概机理就是先确地录制的这个节目源的平均电平(平均响度)是多少,再把最大音量和最小音量控制在平均音量一定范围内.可能这样你就无法真实体会到爆炸和针掉地上的音量差,但会比较和谐~~

平均音量也是通过软体可以调节的(这个测项叫对白归一话dialog normalization),而根据不同应用场景控制音量范围的方式的测项叫做DRC(Dynamic Range Control)

此外测试时还需要确定我们做的产品的音量可以变化范围是能符合各种DRC的,因为会有个测项叫做DR(Dynamic Range),就是在测系统输出的最小和最大音量差.

当然测DR之前必须要先测系统输出的最大音量(节目源最大音量+设备最大音量)

音高:

就是频率,在做验证的时候很简单,就是测下系统对各种频率的声音信号有多大衰减就可以了.

音色:

关于音色部分的测试,主要是关于噪声(SNR)和谐波(THD)的问题,交调失真(IMD)的问题.

SNR:测的是系统在不播声音时会有多大噪声(和最大音量相比)

THD:很难直接测,一般只测THD+N.就是在1KHz的地方播放一个max level声音,再把这个声音滤掉,测量level.因为这时不止包含THD,还包含Noise,所以叫做THD+N.

 

模拟音频基本测项就这些,但有时Dolby等协会会有额外要求,比如会要求THD+N扫频测试等等.

还有做一些软体的验证:比如

Downmix:把多声道音频变为2声道输出,并且2声道还分Lt/Rt or Lo/Ro(是否包含多声道信息)

立体声的极性(对应音色的相位)是否正确.

MPEG和Dolby或和DTS level matching:这项在测各个不同编码Aduio之间的平均电平的是否匹配, 不然你从一个节目换到另一个节目会有音量不匹配问题,可能每换一次节目,就需要重新调一次音量.

 

音频部分测试的感觉就是软体为先,硬件部分相对还是很简单的.

音频部分就记录这么多,下一篇会是DC2DC部分