解读语音交互“硬”道理,“声智科技+小米”带来智能音箱大变革?

2017-09-14 15:48:36 来源:EEFOCUS
分享到:
标签:

在这波人工智能浪潮中,智能语音首先以交互的形式在智能音箱领域落地,而语音交互作为人机交互方式的升级版,随后必将渗透进家电、汽车、机器人等领域,甚至可能成为标配。

 

语音交互的“硬”道理
为了做好语音交互功能就需要相应的硬件支持,声智科技副总裁李智勇认为:智能语音硬件必须在唤醒率、误唤醒率、识别率上达到一定指标,才可让整体交互体验流畅。当然,语音交互涉及众多环节,在技术层面保障听清、命令控制精准的基础上,加上百度DuerOS、腾讯云小微等内容平台,才可能形成最终的完整方案。

 

 声智科技副总裁李智勇

 

声智科技是一家专注于声学前沿技术和人工智能交互的公司,也是小米AI音箱远场语音交互技术的供应商。被小米音箱采用的是SAI_MICAK_60_3229_EVK方案,为主打远场语音交互的6麦低成本方案,可应用于智能音箱、DOT、电视盒子等语音智能产品中,具有全方向唤醒、声源测向、定向拾音、噪声抑制、混响消除、回声抵消、远场语音识别、语义理解等多项功能,支持Alexa、DuerOS、Mor等第三方智能系统。

 

 

 SAI_MICAK_60_3229_EVK方案

 

李智勇表示:声智科技致力于解决当下语音交互最棘手的远场问题。小米智能音箱之前的各种智能音箱软硬架构上都和Amazon Echo高度相似,也就是说整个智能音箱行业都在学习亚马逊五六年前为智能音箱设定的架构(特征是麦克风阵列板和主控板是分离的),而小米+声智的方案与此不同,可看作智能音箱第二代架构,此变化推动了终端产品性价比的大幅提升。据业内消息,亚马逊第二代产品也将采用同种架构,此架构很可能一统未来智能音箱的天下,其它类方案(比如导入单独DSP做信号处理的)会彻底失去生存空间。


除了智能音箱方面的应用,声智科技的语音方案还应用在了智能医疗、机器人、智能汽车等领域。

 

面对声智科技语音方案是否实现功能与性能的理想化这个问题,李智勇表示,长线来看语音交互产品需要做到“用户随便说一句话,产品就能给一个精准响应”,而这还有很长一段路要走。当前声智科技可让用户流畅体验偏命令的语音交互,但真正赋予语音交互产品“智能”仍有很大提升空间。举例而言,未来智能音箱可针对不同人、不同的偏好、不同场景,播放不同的歌曲,实现这种智能程度还需要语音与视觉的融合。尽管智能音箱在功能与性能上都有无限的想象空间,但在落地环节却需要逆向思考,抓住“少即是多”原则,从核心体验出发,把某些功能的体验做到极致,这将比“什么都做,却什么都做不好”更有价值。

 

如何解决智能语音的瓶颈问题
语音交互与识别在应用落地过程中逐渐暴露出一些“局限性”,智能语音技术的瓶颈在哪?
 

第一个问题是远场环境复杂,夹杂噪音、混响、自噪声等,容易导致机器端“听不清”,从而影响后续一系列操作。解决了这个问题,偏命令控制的终端便能带来良好的用户体验。
 

第二个问题是更深层次的智能问题,真正的智能需要实现语义的突破、需要声音与视觉的融合,这样的方案才更适合做拟人形态的机器人。
 

李智勇表示,第一个问题关乎当下的终端产品能否真正落地,声智科技当前专注于解决这个问题,且目标很简单,就是要通过“技术--应用-- 技术”上的反馈把技术做到最好、把性价比做到极致,通过与小米合作成为国内把这些问题解决的最好的公司;第二个问题将影响到产品的应用范围,若不解决该该问题,产品应用就会相对垂直,不能成为真正通用型产品。

 

语音交互作为一种交互方式,其核心推动力就是用户体验的更简单便利。交互方式变革带来的影响极其广泛而深远,因此单个产品不能成本背后的推动力,但变革需要找的一个起点与支点。因此,语音交互首先在智能音箱领域落地,而智能交互还需不断革新才能逐渐渗透到各领域。

与非网原创内容,未经许可,不得转载!

 

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
赵碧莹
赵碧莹

与非网编辑,网名小老虎。通信工程专业出身,喜欢混迹在电子这个大圈里。曾经身无技术分文,现在可以侃侃电子圈里那点事。喜欢和学生谈谈心情、聊聊理想,喜欢和工程师谈谈生活、聊聊工作。不求技术“上进”,只求结交“贵圈”的朋友!

继续阅读
小米邀联发科COO 朱尚祖加入,竟是为了伸手高端芯片市场与华为一绝高下?
小米邀联发科COO 朱尚祖加入,竟是为了伸手高端芯片市场与华为一绝高下?

今年 7 月,一则传言曾惊动半导体业界:联发科 COO 朱尚祖很可能加盟某中国大陆智能手机品牌。现在,这个“智能手机品牌”终于浮出水面——它就是小米。就在昨天,小米CEO 雷军在自己的微博上宣布,朱尚祖正式加入小米,担任小米产业投资部合伙人。朱尚祖在联发科担任要职近 20 年,并协助联发科开创了其手机芯片事业高峰。这不禁让人猜测.....

小米空气净化器2S最全评测:雾霾的克星
小米空气净化器2S最全评测:雾霾的克星

近日,小米发布了空气净化器 2 的升级版小米米家空气净化器 2S ,并于双 11 当日正式上架开卖。

孙昌旭/潘九堂/朱尚祖均加盟小米,合伙人阵容强大
孙昌旭/潘九堂/朱尚祖均加盟小米,合伙人阵容强大

昨日小米CEO雷军宣布,联发科技原共同营运长(COO)朱尚祖正式加入小米,担任小米产业投资部合伙人。朱尚祖是小米产业基金继孙昌旭、潘九堂之后引入的又一位重量级人才。

苹果的犹豫让HomePod比亚马逊Echo智能音箱差太多
苹果的犹豫让HomePod比亚马逊Echo智能音箱差太多

北京时间11月22日报道,最初,苹果HomePod智能音箱只是一个业余项目,曾经数次下马、上马。它在功能方面也不如亚马逊Echo。

智能音箱大火,分享全栈语音识别工程师修炼手册
智能音箱大火,分享全栈语音识别工程师修炼手册

近日,百度发布了渡鸦智能音箱和DuerOS开发板SoundPi,至此,国内再一名巨头加入智能音箱大战。迄今为止,国内战场上的巨头有阿里、京东、腾讯、百度、小米、科大讯飞等,国外则有苹果、微软、亚马逊、谷歌、脸书、三星等。

更多资讯
高交会最强“音”,“造物者”决战硬件创新

11月20日,助力高科技盛会,“寻找造物者—2017云创造物智能产品创意大赛”总决赛在深圳展览中心隆重举行。大赛是由云创造物主办,云创工场、云创硬见、电子圈、机智云、中电港、安创空间、合创资本和金百泽科技等数十家单位联合承办。

富士康曝非法加班,iPhone X高科技产品背后是中国式无奈?
富士康曝非法加班,iPhone X高科技产品背后是中国式无奈?

今天早上英国《金融时报》发表了一篇题为“富士康郑州工厂非法使用学生加班组装iPhone X”的文章,文中指出:苹果(Apple)在亚洲的主要供应商雇用学生非法加班组装iPhone X。厂家在遭遇生产延迟之后正竭力赶上需求。

比特币暴涨背后,其实是个“比傻”游戏

前后历时八年,价格从几美分涨到了近5000美元,比特币创造出无数“财富神话”。

乐视员工持股被清零,贾跃亭为何频频失信

“我的100万股被清零了,老贾(贾跃亭)太坑了!”一位乐视致新(乐视网子公司)前高管对记者抱怨,自己的乐视致新股权打了水漂。

京东方A一跃成为A股市场大明星,市值飙升的背后

京东方A昨日放量大涨6.38%,股价再度逼近前高,成交量放出近日天量,成交金额达167亿元。但与此同时,数据显示,上周京东方A资金流出超34亿元,居个股资金流出额首位,7.67%的换手率也达到近日新高,或暗示资金在当前位置产生分歧。

微话题

工作 or 考研?

又到一年招聘季,考研or工作让你实现了怎样的逆袭?……
Moore8直播课堂