专访思必驰:当语音成为重要的人机交互方式,这个市场还有哪些可能

2017-12-27 16:25:13 来源:EEFOCUS
标签:

 

临近2017年末,国内各大科技媒体开始各种形式的年终盘点,而大家都避不开的关键词非AI莫属。经历了前几年VR、无人机等技术从热炒概念到落地的不温不火后,电子产业似乎终于找到了一个兴奋点,而且这个兴奋点有着太多应用场景的可能性。回想这几年AI概念爆发的起点,这样一款终端产品不容忽视--智能音箱,随着众多科技大佬包括亚马逊,谷歌、BAT、京东、小米、联想等的加入,正是这款消费产品让AI概念在实际应用场景中找到了首个落地点。虽然据GFK在11月份发布的数据,这一年里智能音箱在国内市场的实际销量可能只有35万台,远未达到预期,但这不妨碍智能音箱背后的语音交互这种AI技术的燃点被触发,可以预见,未来几年语音交互将在越来越多的终端产品和应用场景中出现。


谈到语音交互技术,这里面涉及语音合成、语音识别、交互界面、麦克风阵列和语义理解等多个技术分支,每一个分支还有很大的技术提升空间。

 


同时在语音交互技术领域,亚马逊以及国内的科大讯飞逐渐成为技术领导者,思必驰、声智科技、海知科技等科技新贵还在不断涌现。而随着一些互联网公司包括BAT、京东、小米等也开始部署和开发自己的语音交互技术,未来几年内这一领域的市场竞争格局仍存在很大的变数。

语音交互还有哪些技术课题需要攻关?不同玩家在做大市场时都有怎样的布局和玩法?未来BAT等互联网企业和现有技术提供商之间将是怎样的一种关系?带着这些问题,与非网记者于近日采访了思必驰公司CMO龙梦竹女士。

 

思必驰公司CMO龙梦竹


语音识别、语义理解还有哪些事情要做
上面提到语音交互技术涉及多个技术分支,大厂如亚马逊和科大讯飞基本上全部都自己来开发,其他大多企业则依自己的优势在不同技术分支上下功夫。


单就思必驰而言,龙梦竹介绍,其核心技术有5大方向,包括语音识别、语音合成、语音识别++、智能对话和语义理解。该公司的优势在于针对垂直的行业市场包括车载、家居和机器人方向提供语音交互解决方案。针对不同的应用场景,龙梦竹表示,这其中语音交互的底层算法是通用的,都需要通过大数据算法对音频进行识别和处理,不同之处在于应用场景不同,具体的工程化设计就不同,这里面声场的远近,环境噪声来源和干扰等都有所不同,而具体到语义理解,不同的应用场景会有很大的不同,需要设备给出的回复也就不同,这其中最大的挑战还是对话的过程和场景。

 


龙梦竹提到,判断语音识别技术的准确度和正确率,业内通常有字识别率、词识别率和句识别率几个指标,其中字识别率是在一些比赛中会用到,通常大家考虑的是词识别率,句识别率则是对语义理解而言。同时针对大家关注较多的“语音唤醒”,也有唤醒率和误唤醒率这两个特性,而她也坦言,实际上因为语音交互技术的指标相对复杂,受不同环境和外界因素的影响较大,很难有一个真正客观的评判标准。


此前思必驰首席科学家俞凯在一次活动中也提到,语音交互技术从对话的层面,需要区分的是问答、闲聊还是多轮对话的形式,不同的对话模式,设备需要做出的反馈也不同,要通过不同的算法优化来实现,“问答基本上是一问一答,你说一句它会给你一个答案,偶尔会带有一点上下文,这并不是真正意义上多轮的东西;闲聊,比如微软小冰,是你不停的说,它就不停的跟你聊天。闲聊的准则就是以聊的时间来定义的,但不同于问答,这里面是没有什么目标意义的,所以闲聊要考虑如何把一些比较有趣的东西融入进去;最后一类是任务型的多轮对话,这类对话是要有比较扎实的数学基础的,把对话看做是一个序列决策过程。”


针对不同的对话形式和应用场景,包括思必驰在内的语音技术公司还有很多工作要做。

 

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
高扬
高扬

与非网总编。网称“羊在发现”,电子工程科班出身,三载研发历练,以我专业背景和对文字的热爱进入与非网,属偶然中的必然。愿不断发现电子奥妙、产业脉动,以我见我思还一个真相。工作之外,话剧、旅行、阅读是最大乐事。

继续阅读
智能语音科技简史(2018版),这场技术革命从哪开始?

1952年,贝尔实验室(Bell Labs)制造一台6英尺高自动数字识别机“Audrey”,它可以识别数字0~9的发音,且准确度高达90%以上。并且它对熟人的精准度高,而对陌生人则偏低。

关于语音接口技术,这些可以了解一下

语音接口已经成为一个改变人机交互方式的全新切入点。这些系统如何工作?打造这样一款设备在硬件方面有什么要求?随着语音控制接口变得越来越普及,德州仪器(TI)的一位工程师对此技术进行了深入的了解,并分享了其对这项技术的认识和看法。

语音识别或成“身份证”一部分,说句话就知道是谁?

在中国,政府和企业对于人脸识别技术的部署力度在其它地区并不常见。如今,该国也已经快速地将目光转向了声音识别。 近日贵

陪玩、陪聊,还能教你学习,人工智能或将开启幼儿教育新时代

随着二胎政策的开发,关于幼儿教育的话题又一次火热起来。此前,某网站曾做过一个关于家庭消费预期的调查,其中最大的一笔开支计划就是“孩子教育”,占比高达45.6%。幼儿教育逐渐成为社会刚需,这从当下千金难求的学区房和遍地开花的补习培训班中就可以得到印证。

从《银翼杀手2049》谈起,语音交互已经来了吗?
从《银翼杀手2049》谈起,语音交互已经来了吗?

如果我们回到10年前,苹果的智能手机刚刚发布,而那时候,大部分人们还不知道,或者不能看到,想到十年后的移动互联网的应用(滴滴打车,美团外卖,微信支付等)将会如此剧烈的改变人们生活。

更多资讯
吃鸡游戏自带八倍镜,苹果手机这么牛?
吃鸡游戏自带八倍镜,苹果手机这么牛?

现在最火的游戏是什么?没错,“吃鸡”。大吉大利今晚“吃鸡”。每次在朋友圈,总是看到别人“吃鸡”截图,心里就很不爽,为什么别人总是能“吃鸡”。而我,每次“落地成盒”。

联想集团股价跌幅创纪录,可能被港股基准股指剔除

北京时间4月24日消息,联想集团的股价跌幅超过世界上其他任何一家科技公司,它越来越有可能被从香港的基准股指中剔除。

手机真的卖不动了?华强北店铺开始卖水果了

5亿部,这是中国智能手机一年的出货量,而其直接和间接拉动的市场更是达万亿元。因此,手机销量的好坏直接关系到上下游企业的兴衰,也牵动资本市场的神经。近日,工信部旗下中国信息通信研究院发布的报告显示,今年一季度,中国智能手机出货量同比下降26.1%。智能手机市场未感受到“春意”。

五一购机指南, 荣耀畅玩7C/ 魅蓝S6/红米5 Plus了解一下

再过几天,五一节即将来临,相信不少朋友都有在五一期间购机的计划,那么如果你想买到体验最好的千元机,新浪手机将目前相对靠谱的网购平台,翻了个底朝天,找出了几部消费者好评率最高的千元机,它们好评率最高可达100%,如果你五一期间想换千元机,相信群众的眼光,买它们没错的!

vivo X21黑金版明天发布,这样的外观你入坑吗?
vivo X21黑金版明天发布,这样的外观你入坑吗?

4月19日,vivo通过官微发布消息,宣布推出全新的vivo X21黑金版,并于4月25日开启预售,4月28日正式开售。vivo连续两年都推出黑金色版本,这次又有什么奥秘呢?

Moore8直播课堂
电路方案