专访思必驰:当语音成为重要的人机交互方式,这个市场还有哪些可能

2017-12-27 16:25:13 来源:EEFOCUS
标签:

 

临近2017年末,国内各大科技媒体开始各种形式的年终盘点,而大家都避不开的关键词非AI莫属。经历了前几年VR、无人机等技术从热炒概念到落地的不温不火后,电子产业似乎终于找到了一个兴奋点,而且这个兴奋点有着太多应用场景的可能性。回想这几年AI概念爆发的起点,这样一款终端产品不容忽视--智能音箱,随着众多科技大佬包括亚马逊,谷歌、BAT、京东、小米、联想等的加入,正是这款消费产品让AI概念在实际应用场景中找到了首个落地点。虽然据GFK在11月份发布的数据,这一年里智能音箱在国内市场的实际销量可能只有35万台,远未达到预期,但这不妨碍智能音箱背后的语音交互这种AI技术的燃点被触发,可以预见,未来几年语音交互将在越来越多的终端产品和应用场景中出现。


谈到语音交互技术,这里面涉及语音合成、语音识别、交互界面、麦克风阵列和语义理解等多个技术分支,每一个分支还有很大的技术提升空间。

 


同时在语音交互技术领域,亚马逊以及国内的科大讯飞逐渐成为技术领导者,思必驰、声智科技、海知科技等科技新贵还在不断涌现。而随着一些互联网公司包括BAT、京东、小米等也开始部署和开发自己的语音交互技术,未来几年内这一领域的市场竞争格局仍存在很大的变数。

语音交互还有哪些技术课题需要攻关?不同玩家在做大市场时都有怎样的布局和玩法?未来BAT等互联网企业和现有技术提供商之间将是怎样的一种关系?带着这些问题,与非网记者于近日采访了思必驰公司CMO龙梦竹女士。

 

思必驰公司CMO龙梦竹


语音识别、语义理解还有哪些事情要做
上面提到语音交互技术涉及多个技术分支,大厂如亚马逊和科大讯飞基本上全部都自己来开发,其他大多企业则依自己的优势在不同技术分支上下功夫。


单就思必驰而言,龙梦竹介绍,其核心技术有5大方向,包括语音识别、语音合成、语音识别++、智能对话和语义理解。该公司的优势在于针对垂直的行业市场包括车载、家居和机器人方向提供语音交互解决方案。针对不同的应用场景,龙梦竹表示,这其中语音交互的底层算法是通用的,都需要通过大数据算法对音频进行识别和处理,不同之处在于应用场景不同,具体的工程化设计就不同,这里面声场的远近,环境噪声来源和干扰等都有所不同,而具体到语义理解,不同的应用场景会有很大的不同,需要设备给出的回复也就不同,这其中最大的挑战还是对话的过程和场景。

 


龙梦竹提到,判断语音识别技术的准确度和正确率,业内通常有字识别率、词识别率和句识别率几个指标,其中字识别率是在一些比赛中会用到,通常大家考虑的是词识别率,句识别率则是对语义理解而言。同时针对大家关注较多的“语音唤醒”,也有唤醒率和误唤醒率这两个特性,而她也坦言,实际上因为语音交互技术的指标相对复杂,受不同环境和外界因素的影响较大,很难有一个真正客观的评判标准。


此前思必驰首席科学家俞凯在一次活动中也提到,语音交互技术从对话的层面,需要区分的是问答、闲聊还是多轮对话的形式,不同的对话模式,设备需要做出的反馈也不同,要通过不同的算法优化来实现,“问答基本上是一问一答,你说一句它会给你一个答案,偶尔会带有一点上下文,这并不是真正意义上多轮的东西;闲聊,比如微软小冰,是你不停的说,它就不停的跟你聊天。闲聊的准则就是以聊的时间来定义的,但不同于问答,这里面是没有什么目标意义的,所以闲聊要考虑如何把一些比较有趣的东西融入进去;最后一类是任务型的多轮对话,这类对话是要有比较扎实的数学基础的,把对话看做是一个序列决策过程。”


针对不同的对话形式和应用场景,包括思必驰在内的语音技术公司还有很多工作要做。

 

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
高扬
高扬

与非网总编。网称“羊在发现”,电子工程科班出身,三载研发历练,以我专业背景和对文字的热爱进入与非网,属偶然中的必然。愿不断发现电子奥妙、产业脉动,以我见我思还一个真相。工作之外,话剧、旅行、阅读是最大乐事。

继续阅读
AI芯片这么难造,思必驰为何选择加入造芯大潮?
AI芯片这么难造,思必驰为何选择加入造芯大潮?

在AI横行的当下,没有什么高科技能比AI更能激起广大用户内心的好奇,很多创业公司都在拿AI当噱头,几乎所有传统公司都竭尽全力向AI靠近。

CEVA推出基于神经网络的WhisPro™语音识别技术 用于语音助手和物联网设备

CEVA,全球领先的智能和互联设备信号处理平台和人工智能处理器IP授权许可厂商 (纳斯达克股票交易所代码:CEVA) 宣布推出基于神经网络的语音识别技术WhisPro™,瞄准智能云服务和前端设备使用语音作为主要人机接口的快速增长。

思必驰加入AI造芯大潮:明知山有虎偏向虎山行?

在AI横行的当下,没有什么高科技能比AI更能激起广大用户内心的好奇,很多创业公司都在拿AI当噱头,几乎所有传统公司都竭尽全力向AI靠近。于是去年智能音箱火了,天猫精灵、小爱音箱、亚马逊的Echo纷纷走入我们的生活,语音控制确实比硬件控制更加便捷,有些设备厂商甚至打出一个口号“能动动嘴解决的事情就不让用户动手”。

为智导互联引入AI概念,看本田在电动汽车、车联网上的绝地反击
为智导互联引入AI概念,看本田在电动汽车、车联网上的绝地反击

1月7日,本田2019年媒体大会在北京举办。在本届大会上,本田发布了包括第二代Honda CONNECT(智导互联)系统等在内的多项新举措。

我国人工智能产业在语音识别、计算机视觉、机器人、语言处理等领域哪方面比较突出?

人工智能是智能制造未来发展的核心领域,虽然中国机器人产业取得了一定的成绩,然而与美、日、德等发达国家相比尚有很大差距。

更多资讯
智能家居是否能成为格力的新市场?

今日下午,格力电器召开临时股东大会,对推迟了7个月之久的换届董事提名进行审议表决。大会上,董明珠透露,格力电器2018年税后利润为260亿元以上。

光学屏下指纹识别技术逐渐成熟,市场将迎来新一轮洗牌

在2018年的CES大会上,vivo率先发布了屏下指纹手机,在全面屏手机盛行的时代,无疑是投下一颗炸弹。现在的国产手机品牌基本上都在研发屏下指纹手机,听说国外的三星苹果也在跟进这项技术。另外日本的JDI公司也在研发,不过上市的时间要到今年。

从消费市场和企业市场看物联网发展潜力

随着越来越多的设备接入网络,并实现相互沟通,我们正在加速进入“万物互联”的时代。

服务机器人市场迎来爆发期,主要原因是人口老龄化趋势加快
服务机器人市场迎来爆发期,主要原因是人口老龄化趋势加快

随着人口老龄化趋势的加重,全球服务机器人市场迎来了爆发增长期,而中国的发展态势最为猛烈。

滚筒式手机、伸缩式手机这些手机未来会有市场吗?
滚筒式手机、伸缩式手机这些手机未来会有市场吗?

和Galaxy S系列10周年一样吸睛的折叠式手机将在下个月与S10一同公开,三星电子也强调,继折叠式手机之后,会持续研发出滚筒式、伸缩式屏幕等各种型态的手机。

电路方案