加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 十字路口顾盼
    • To B——难挖的富矿
    • 车载——难在“卷”上赛道
    • To C——难在碎片中生存
    • 写在最后
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

我在大厂做AI语音,2022也迷茫……

2022/05/20
1360
阅读需 11 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

相比遍地开花的人脸识别,智能语音的存在感似乎弱了很多。是错觉还是现实?

AI大厂的老王,做智能语音产品经理有几年了,在语音唤醒、ASR、NLP、TTS方面积累了不少经验,不过,挖掘语音需求和场景始终是他心头的一座大山。如何找到足够好的落地场景?如何将方案和需求精准匹配?老王觉得,用户的真实痛点永远是个谜。

小李曾感到幸运,硕士一毕业就加入了一家风头正劲的创业公司做智能语音算法工程师。不过,几年下来,他感觉公司业绩并没有很大起色,语音产品只打入了家电和玩具市场,量不算大,利润薄得可怜。再反思自己,虽然身边很多智能硬件也都有了语音控制和交互能力,哪怕天天都在用的手机也有,但他基本是不用语音功能的。自己尚且如此,其他的消费者呢?智能语音功能是伪需求吗?小李对当年一脚踏进的赛道陷入了深深的迷茫中……

从事智能座舱语音交互研发的大刘,原本在国际大厂做通用语音平台,去年被现在的公司挖来,专门适配车载场景做语音开发。对眼下的赛道和薪资,大刘都很满意,唯一有些焦虑的是,各大品牌纷纷涌入这个市场,“高质量、差异化”是老板天天挂在嘴边的要求。“汽车一定是手机之后,智能语音落地的大市场”,大刘深信。

十字路口顾盼

老王、小李、大刘可能是语音细分赛道不同体量、不同方向从业者在当下的缩影。

2015年曾是语音赛道的高光时刻,中国智能音箱的发展正是起步于这一年。语音市场热度攀高,互联网巨头、产品方案公司,在这一年后纷纷入了局。经历几年激烈竞争后,智能语音公司现在走到了一个十字路口:向前,落地不及预期;向左向右,场景需要逐步渗透。可一旦上了路,就不能原地不动,更不能后退。

于是只能见到几家屈指可数的“老司机”,平稳行驶通过;其他一些对自家技术实力有信心、愿意继续冲一把的,正在铆足劲踩油门,寻求下一个突破点;另一些既没有技术壁垒,又没有可持续盈利场景的公司,已经在犹豫要不要踩刹车……

不得不承认,整个智能语音行业正在经历一轮洗牌,留下真正有技术实力、盈利能力强的企业。 步入冷静期的智能语音,下一步怎么走?

To B——难挖的富矿

《2020—2021中国语音产业发展白皮书》显示,2020年我国智能语音市场规模达到217亿元,同比增长31%,2021年预计达285亿元,同比增长44%。随着规模的不断扩大,融合应用不断丰富,智能语音技术在智慧教育、智慧医疗、智慧城市、智慧制造等领域加速落地。

不过,有行业人士指出,广泛的应用领域也就意味着更多元化的使用场景。然而,目前的语音技术对于使用场景具有较强的限制性。尽管快速更新迭代的神经网络架构已经将安静环境下的近场语音识别的错误率降低3%以下,但现实环境中,多数应用场景无法满足理想的环境条件,在进行语音识别时需要同时考虑到各种噪声、信道等因素。

为了使语音识别技术在更广泛的使用场景下保持良好的表现,智能语音厂商需要提供硬件与软件协同的一站式服务,并且需要根据实际痛点需求进行针对性地优化。硬件+软件+服务,显然,这是头部公司才拥有的入场券,对企业的全栈能力、数据能力要求都较高。

此外,面向企业、行业等To B市场,语音厂商的上下游合作模式非常关键。例如切入传统行业需要提供包括核心设备的完整解决方案,需要与传统行业集成商或最终客户进行定制化、深度合作,这对技术输出水平、生态资源等都是较大的挑战。

车载——难在“卷”上赛道

语音交互功能是汽车智能化的重要特征之一,它在汽车上的优势比较明显——能够帮助驾驶者降低对车内设备或其它智能便携设备的手动操作依赖,增加驾驶安全性。据亿欧智库数据,2021年中国语音交互车载应用的市场规模为22.2亿元,2022年预计可以到达25.1亿元,2019年-2022年复合增长率达到20.8%。2021年中国新发布的乘用车,语音交互功能在座舱内的渗透率已经位于第4位,达到86%。显然,语音交互功能已经成为中国乘用汽车座舱内的标配功能。

不过,“车规级”语音毕竟不同于普通应用场景,有独特的挑战需要克服。主要体现在三方面:

首先,要应对汽车移动状态下的网络抖动,在保证声音保真率的情况下尽量压缩对流量及硬件性能的消耗。

第二是语音高保真度带来的挑战。一般情况下,大部分车载语音系统的语音采样率为16kHz(一秒钟有1万6千个采样点),量化水平在8比特(每个采样点数据量为8比特)。但大部分车载语音模型在采样率和量化水平上都会高于这一数值,这就涉及到高质量语音模型与实时处理、传输等资源的结合,需要合理规划车身资源与边缘计算、云计算的结合。

第三个挑战主要是合成语音的歧义问题,这在所有语音场景中是一个普遍挑战,只是在不同场景下,用户对歧义的容忍度有差别。特别在车载场景中,驾驶员注意力需要高度集中,歧义问题需要引起重视,减少对用户体验的影响。

目前看来,车载智能语音产业链的上、中、下游边界逐渐趋于模糊,竞争结构正在重组。以科大讯飞、思必驰、云知声、捷通华声等智能语音处理引擎及应用供应商为例,他们处于产业链中游,作为上游的需求方,业务范围逐渐向上延展;作为下游的供应方,合作模式逐渐向下深入。

并且,头部公司在产品技术水平、业务涵盖范围、用户生态等方面具有优势,已经占据了较高的市占率。对于行业新秀来说,则需要通过定制化方案、价格优势方面寻求更多客户资源。

To C——难在碎片中生存

智能语音在消费设备中的典型应用包括智能手机、可穿戴设备以及小部分智能家居产品等。智能家居市场由于规模庞大、且正处于智能化升级期,成为智能语音的主攻方向之一。

经过几年的市场普及,消费者对语音产品已经有初步概念,之前还只是部分单品通过语音交互实现智能化,比如智能手环、智能电视、智能音箱等,而2020年之后,几乎是全品类向语音智能化渗透,包括灯具、开关、空调、电动窗帘、电风扇、卫浴、厨具等。

不过,智能家居的痛点仍然存在,体现在智能语音领域,具体包括缺乏统一标准和场景化服务、用户体验感差、核心元件国产化率低等等。

行业人士认为,智能语音在与传统家居市场的融合过程中,可能有无数的“坑”可能要踩,但一个首要原则是实用性,试图强力改变用户习惯,或是同质化的产品,最终都难以规模化发展。

其次,在解决设备只有联网才能实现语音功能的问题上,离线语音已经显露出一定的优势。它能够针对性地对单个产品进行声音控制,且无需将数据传向云端,充分保证了用户隐私。不论是大家电还是小家电,均可实现离线语音控制系统的配对。

此外,一些行业人士也表示,在激烈且碎片化的语音市场竞争中,生态和商业模式很关键,技术和应用领先的时间差很关键。特别在智能家居逐步转向场景化、全屋智能化方向,有望催生出更多非刚需家电品类的需求,带来增量机遇,但只有真正便捷、智能化的语音体验才有望成为家电各品类产品的标配。

写在最后

语音赛道玩家众多,但盈利仍是多数企业的核心挑战。不同类型厂商面临的挑战也不同,中游技术层服务商研发投入巨大;下游应用环节,在触达行业核心需求上仍面临难题。特别是对于碎片化的智能硬件市场,爆款效应明显,如果不能真正起量,将难以摆脱亏损的阴影。在这样的行业大环境中,大部分初创企业困难重重,而头部企业在不断拓展自身产业链,构建完整的生态结构,大者恒大的两极化发展态势恐将越来越明显。

经过多年发展,智能语音产业逐步步入平台期,技术和市场应用正面临着新的挑战。核心技术仍有待继续突破,下一步发展的关键创新点,除了语音领域的不断迭代,也需要交叉融合领域的创新。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
KLZ2012PHR220WTD25 1 TDK Corporation of America General Purpose Inductor,

ECAD模型

下载ECAD模型
$0.25 查看
0430450612 1 Molex Rectangular Power Connector, 6 Contact(s), Male, Solder Terminal, HALOGEN FREE AND ROHS COMPLIANT

ECAD模型

下载ECAD模型
暂无数据 查看
2N2907A 1 TT Electronics Power and Hybrid / Semelab Limited 600mA, 60V, PNP, Si, SMALL SIGNAL TRANSISTOR, TO-206AA, HERMETIC SEALED, METAL, TO-18, 3 PIN
$0.85 查看

相关推荐

电子产业图谱

与非网资深行业分析师。主要关注人工智能、智能消费电子等领域。电子科技领域专业媒体十余载,善于纵深洞悉行业趋势。欢迎交流~