专访思必驰:当语音成为重要的人机交互方式,这个市场还有哪些可能

2017-12-27 16:25:13 来源:EEFOCUS
标签:

 

临近2017年末,国内各大科技媒体开始各种形式的年终盘点,而大家都避不开的关键词非AI莫属。经历了前几年VR、无人机等技术从热炒概念到落地的不温不火后,电子产业似乎终于找到了一个兴奋点,而且这个兴奋点有着太多应用场景的可能性。回想这几年AI概念爆发的起点,这样一款终端产品不容忽视--智能音箱,随着众多科技大佬包括亚马逊,谷歌、BAT、京东、小米、联想等的加入,正是这款消费产品让AI概念在实际应用场景中找到了首个落地点。虽然据GFK在11月份发布的数据,这一年里智能音箱在国内市场的实际销量可能只有35万台,远未达到预期,但这不妨碍智能音箱背后的语音交互这种AI技术的燃点被触发,可以预见,未来几年语音交互将在越来越多的终端产品和应用场景中出现。


谈到语音交互技术,这里面涉及语音合成、语音识别、交互界面、麦克风阵列和语义理解等多个技术分支,每一个分支还有很大的技术提升空间。

 


同时在语音交互技术领域,亚马逊以及国内的科大讯飞逐渐成为技术领导者,思必驰、声智科技、海知科技等科技新贵还在不断涌现。而随着一些互联网公司包括BAT、京东、小米等也开始部署和开发自己的语音交互技术,未来几年内这一领域的市场竞争格局仍存在很大的变数。

语音交互还有哪些技术课题需要攻关?不同玩家在做大市场时都有怎样的布局和玩法?未来BAT等互联网企业和现有技术提供商之间将是怎样的一种关系?带着这些问题,与非网记者于近日采访了思必驰公司CMO龙梦竹女士。

 

思必驰公司CMO龙梦竹


语音识别、语义理解还有哪些事情要做
上面提到语音交互技术涉及多个技术分支,大厂如亚马逊和科大讯飞基本上全部都自己来开发,其他大多企业则依自己的优势在不同技术分支上下功夫。


单就思必驰而言,龙梦竹介绍,其核心技术有5大方向,包括语音识别、语音合成、语音识别++、智能对话和语义理解。该公司的优势在于针对垂直的行业市场包括车载、家居和机器人方向提供语音交互解决方案。针对不同的应用场景,龙梦竹表示,这其中语音交互的底层算法是通用的,都需要通过大数据算法对音频进行识别和处理,不同之处在于应用场景不同,具体的工程化设计就不同,这里面声场的远近,环境噪声来源和干扰等都有所不同,而具体到语义理解,不同的应用场景会有很大的不同,需要设备给出的回复也就不同,这其中最大的挑战还是对话的过程和场景。

 


龙梦竹提到,判断语音识别技术的准确度和正确率,业内通常有字识别率、词识别率和句识别率几个指标,其中字识别率是在一些比赛中会用到,通常大家考虑的是词识别率,句识别率则是对语义理解而言。同时针对大家关注较多的“语音唤醒”,也有唤醒率和误唤醒率这两个特性,而她也坦言,实际上因为语音交互技术的指标相对复杂,受不同环境和外界因素的影响较大,很难有一个真正客观的评判标准。


此前思必驰首席科学家俞凯在一次活动中也提到,语音交互技术从对话的层面,需要区分的是问答、闲聊还是多轮对话的形式,不同的对话模式,设备需要做出的反馈也不同,要通过不同的算法优化来实现,“问答基本上是一问一答,你说一句它会给你一个答案,偶尔会带有一点上下文,这并不是真正意义上多轮的东西;闲聊,比如微软小冰,是你不停的说,它就不停的跟你聊天。闲聊的准则就是以聊的时间来定义的,但不同于问答,这里面是没有什么目标意义的,所以闲聊要考虑如何把一些比较有趣的东西融入进去;最后一类是任务型的多轮对话,这类对话是要有比较扎实的数学基础的,把对话看做是一个序列决策过程。”


针对不同的对话形式和应用场景,包括思必驰在内的语音技术公司还有很多工作要做。

 

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
高扬
高扬

与非网总编。网称“羊在发现”,电子工程科班出身,三载研发历练,以我专业背景和对文字的热爱进入与非网,属偶然中的必然。愿不断发现电子奥妙、产业脉动,以我见我思还一个真相。工作之外,话剧、旅行、阅读是最大乐事。

继续阅读
AI技术如何探索与打破智能化的边界?

10月16日,由中国人工智能产业发展联盟、苏州思必驰信息科技有限公司、上海交大苏州人工智能研究院主办,与非网承办的2018年AIIA开发者大会分论坛在苏州国际博览中心隆重召开。

科大讯飞的 “没有主动造假”与“没有造假”
科大讯飞的 “没有主动造假”与“没有造假”

9月25日,科大讯飞AI同传“造假”的爆料人、知乎网友“Bell Wang”发文称,已与科大讯飞方面进行了沟通。其表示对科大讯飞的解释能够接受,“可以认为讯飞没有主动造假的行为”。同日下午,科大讯飞发文称“没有造假”,科大讯飞技术既能转写也能翻译。

不是人工智能机器人也不是自动驾驶汽车,科技的下一次飞跃竟然会是它?

北京时间9月25日早间消息,人工智能机器人和自动驾驶汽车可能是媒体关注焦点,但谷歌搜索业务负责人本·戈麦斯(Ben Gomes)表示,科技的下个飞跃将是语音技术的发展。他认为,更好地理解普通语言对互联网的未来至关重要。

国内智能音箱市场日渐火爆,出现了什么问题?

2014年,搭载了亚马逊虚拟语音个人助理Alexa的Echo面世,让人类同机器的交互方式出现了另一种可能。

AI语音交互市场为何如此火爆?

从智能故事机、早教娱乐机再到儿童智能音箱,几乎每一类都成为了当前市面上的爆品,成为2018年国内语音交互应用领域的一道“靓丽风景”。

更多资讯
现代零售业要坚决拥抱互联网,全面数字化成了不可阻挡的趋势?

10月15日,物美联合多点、链商优供在北京召开商业全面数字化高峰论坛。物美集团董事长张文中表示,现代零售业要坚决拥抱互联网,彻底回归商业本质,全面数字化是一个不可阻挡的趋势,数字化的目的是要提高供应链效率,改善顾客的消费体验。

华为Mate 20售价都赶上iPhone了,产品能赶上吗?

显然,作为年度最大热门,苹果9月手机发布会往往有着分水岭意义,承接上半年技术,展望下半年发展。在往年赶在这前后发布的安卓机很多,但能谈得上叫板,其实鲜有。

华为何刚:大屏长续航是Mate是基础,推广全球化是目的

今天华为在伦敦正式发布了Mate 20系列手机,包括Mate 20、Mate 20 Pro、Mate20 RS、Mate20 X四款手机,以及多款手机配件。会后华为华为消费者业务手机产品线总经理何刚接手了新浪科技的专访。

一文带你看完智能家居业十大生态圈模式

AI一夜之间爆发,云计算、物联网技术的快速发展,智能硬件不再强调App控制,而是通过语音等自然交互来控制,人与机器可以对话,机器可以学习人,可以感知环境,可以服务用户。

你以为糖果仅仅是一部手机吗?不,它还是......
你以为糖果仅仅是一部手机吗?不,它还是......

据2018年IDC数据,第一季度全球智能手机市场出货量3.361亿部,同比下降2.4%;中国信息通信研究院的《国内手机市场运行分析报告》显示,2018年1月到8月国内手机出货量2.66亿部,同比下降17.7%。

Moore8直播课堂