承接上文听力补偿相关的内容,顺便聊一下针对人体工学部分的探索。

 

关于耳机定制化:听力测量(Audiometry)和人体工学(Ergonomics)(上篇)

 

说到耳机,以及人体工学相关,可能很多人会想到Bose耳机的运动系列——鲨鱼鳍硅胶耳套,也会联想到像freebit这类深度钻研耳机相关人体工学设计,并进行license授权以运营的公司,它服务的客户品类很广,像是JBL,Amazon,Audio-technica,Under Armour,都是他的合作客户。(以下资料均来自官网,为保护知识产权,不会额外释放其他信息)

 

Freebit


这一类公司的做法是,结合目前对于人体工程学的探索,以及大量采集样本,以及与声学品牌公司合作等经验方面的累计,研究出一种尽量通用的设计,可以最大程度上保证不影响声学稳定性的同时,保证与人耳合理的力结合,优点是尽量做到通用,但是针对部分定制化需求更高的用户,耳机厂商依旧在进一步尝试,如何做更细致的定制化流程。

 

Freebit C shape(官网)


其实,定制化已经悄悄潜入我们生活,并逐渐成为现代消费模式的一种新的扩展——不论是在购买耳机时,选择激光雕刻一句自己喜欢的slogan,还是在定制化一双自己选择色彩配搭的鞋子,还是在奢侈品上做一些手脚,让产品更加锦上添花,很多年轻人纷纷在平常的消费生活中,寻找一些属于自己的特别点。

 

各品类定制化


首先,收费比较高的1of1定制,很多针对音乐从业者,可以在耳朵上倒模,声音也定制化调节。

 

UE客制化耳机

 

音频参数可选择的空间很大


那么,针对大众的定制化,大量的耳机品牌比如,Bose,Sony,Sennheiser,Jabra,Plantronics等耳机品牌的App均提供EQ定制化,也就是用户可以选择自己调整EQ曲线,当然不是完全随意的调节,多数情况下,品牌方还是会提供一些选项,比如:Bass Boost,Treble boost,Smooth等等,用户就可以根据自己的喜好,比如选择重低音“动次打次”比较强的音乐,然后调节一下EQ按钮,听着就蛮有感觉的。

 

App也可以来让用户自定义一些功能按钮,比如Plantronics的产品就很符合“喜欢科技产品的同学”可以自定义按键的功能,不过的确是有些繁琐。

 

Plantronics的App

 

Plantronics的App

 


同时,音频品牌公司,也尝试通过现有的App,结合一些第三方的技术,为用户提供除了外观以外,在使用上的定制化服务。比如Creative与SXFI。只需要通过手机拍照,就可以针对声音,以及听音方式进行定制化。

 

Creative官网页面


接下来,大家在集中探索的一块领域,主要依赖两方面技术,第一类,是图像识别,比如中值滤波算法,也就是但我们对耳朵拍照之后,可以消除部分光影造成的干扰,清晰的导出人耳轮廓的线框图。其实这一块技术最早是考虑到将人耳作为新的生物识别技术。最早,美国犯罪学研究专家Afred Iannarelli发表相关论文,并应用于美国法律执行机构采用。

 

Burge&Burger人耳识别技术示意图

 

后续出现有代表性的,Burge&Burger人耳识别技术。先是采集个体头部灰度图,对图像梯度的Gaussian金字塔使用可变形轮廓(deformable contour)方法进行人耳定位,在使用Canny算子进行边缘检测。阀值上下限为46和20。对较大的曲线段使用edge relaxation形成,去除较小的曲线段,形成Voronoi图表,识别在此阶段完成。即将提取的曲线与模板进行比对。光照和位置的变化使得这种方法非常不可靠。为了克服这种影响,他们将问题转化为描述曲线之间的相邻关系,而这种关系不受几何变换和光照的影响!这种方法还考虑了误差校正的问题。对由油脂和耳垢的堆积而产生的虚假阴影形成的错误的曲线进行去除处理。并对由此可能会折断的剩余的曲线进行行合并处理。

 

以及还有Moreno提出的外耳图像识别法,图a所示的点作为为外耳图像特征点。以这些特征点构成特征向量,作为神经元的输入,并且该向量与图像变换和尺度变换无关。分类器的输出与待识别个体相对应特征点的提取在外耳轮廓图上进行得到轮廓图的方法是先对原始图像使用双Sobel 滤波器(水平和垂直方向)将得到的图像进行阀值控制,然后相加得到轮廓图。

 

这已经非常接近我们在讨论人体工学,人耳特征点相关的技术了。

 

但是,这种标记的点位,还不够,因为考虑耳机舒适性。除了从平面的角度,观摩耳朵三角区最深的深度,以及耳屏,对耳洞,耳屏间切迹等位置的研究,对于耳朵的舒适性,特别重要。

 


在此基础上,也会有更加精确的方式,也就是直接扫描后,可以获得耳朵的轮廓,这种方式非常近似于塑模的方式,也可以通过扫描来获得人耳的数据,但是需要特定的机器,设备成本高,扫描的时间虽然不常,可是我们没有办法把这些移植到手机应用端。因此,对硬件设备的过高要求,喝不可移植性,让我们开始考虑一个新的角度——使用2d照片进行3d建模。首先,找出各张照片中的特征点,进行两两匹配,现在常用的算法是由 David Lowe 提出的SIFT 方法。然后根据匹配的结果,利用射影定理计算得到相机位置等场景信息,流行使用的是基于 Levenberg-Marquardt 算法的 Bundler。我们也可把这一步称为稀疏重建(Sparse Reconstruction)。接下来将场景信息与原始照片结合在一起,有了场景信息,我们就能进行多视立体重建(Multi-view Stereo Reconstruction)了。由于处理的图像精度通常都比较高,所以这一步的计算量很大,执行效率也因此成为判断算法优劣的标准之一。除了效率之外,还需要考量重建的精度以及完整性,因为这些因素决定了点云的质量。PMVS 算法是目前表现最好的多视立体重建算法。另外,为了表示和稀疏重建的区别,这一步也成为密集重建(Dense Reconstruction)。最后根据三维点云构建三维模型,我们已经得到了物体表面的一系列三维点云,但是还需要把这些点连成面,才能在一般的三维建模软件中使用。现在比较常用的是泊松表面重建算法(Poisson Surface Reconstruction)。

 

以上技术的应用,在建筑行业的应用已经相当广泛,针对算法精度进行调节,我们则可以获取更加便捷的方式,拍几张照片,就足够我们针对耳朵建模,并根据数据库来总结出耳朵大致偏向耳形,更加适合的耳机类型,以及硅胶部分的大小,这时候,我们就考虑一种更加便捷的对应方式。不一定要针对用户的耳朵建模做出完全符合的方案,但是,因为我们储备了足够的人耳模型数据,甚至可以更细化的区分男性女性,三角区比较深,or比较长的耳型,来针对耳朵形状,做更深入的推荐,比如三角区较深,耳洞比较大的耳朵,往往觉得ANC耳机佩戴的时候非常舒服。三角区较为浅,耳屏间切迹角度比较尖的耳朵,或许更喜欢Airpods的耳机更合适。

 

综上,关于定制化,在人体工程学方向的一些讨论,总体来说,我们还需要更复杂的数据库,让耳机佩戴体验更好。