智能语音创造无限可能,世平:连接上下游,为生态构建出力

2017-09-03 19:48:55 来源:EEFOCUS
标签:

“语音识别已经有几十年的历史了,但是结合人工智能中的神经网络与深度学习,为语音识别提供了可能。未来的语音识别可以直接与人对话,理解人的语言,能通过声音来对智能产品进行复杂交互,简化人机交互,继眼睛(显示屏)、手(触摸屏)后,耳朵&嘴巴将成为下一代人机交互的主要形式。人机对话是革命性的东西,从简单家庭使用:开电视、切换频道大小声音、设定冷气及任何家电的控制都可以做到,语音可以做身份识别,语音助手可以提供私人定制服务。甚至智能语音可以取代人类大部分服务业与窗口行业,如一个餐馆可以节省 90% 的人力,点餐加工送餐收款全部由人工智能完成。” 在智能语音被视作人工智能突破口的当下,世平集团资深技术总监林建和认为智能语音可创造无限可能。

 

 

世平集团资深技术总监林建和

 

除了智能音箱领域,语音识别与交互还可应用于以下领域:

  • 能家电的开关与操作(例如:WiFi音箱、电视、灯,冰箱、电饭锅、空气净化器)
  • 家居管理(例如,智能照明、智能窗帘、智能床罩)
  • 机器人(陪伴机器人、扫地机器人)
  • 手机(例如拨电话给谁、传简讯给谁、发 e-mail 给谁、、拨放音乐、开启 APP 等等) 
  • 汽车信息娱乐系统(例如:导航, 简易功能的控制,播音乐、音量调整、拨打紧急电话、查询路况与询问路径周边设施等等
  • 人类服务业与窗口行业

 

林建和先生认为:智能语音在故事机/WiFi音箱、车载语音识别,家电等会先落地。

 

理由在于:
语音识别距离较近,识别效果会比较好,且相较于主流的触控型人机界面,语音交互具有先天优势,可真切的满足绝大多数人的互动需求。

 

在被看好的高端智能音箱、机器人(人机交互)、家庭医疗、智能购物等领域,仍需时日才可落地。主要由于这些领域对语音技术及实现效果要求较高,对于一定范围的失误都难以容忍,因此还有待技术的革新。另外,值得一提的是,用户习惯的养成非一朝一夕,因此从用户培养角度而言也需时日。


为智能语音发烧的硬件方案
既然智能语音可在这么多领域大显身手,那么从硬件角度而言,怎样的芯片才可称之为专为智能语音而生呢?

 

“瑞芯微RK3229、锐迪科RDA5981、联发科MT8516、全志R16、乐鑫ESP32 等都可称为专为智能语音而生,这些方案多是支持WiFi接入功能(还可能带有 BLE 功能)、内置 Codec、支持多通道麦克风阵列接口与语音识别算法,并接入主流语义云平台(科大讯飞、亚马逊 Alexa等)。”林建和先生解释到。

 

世平集团智能语音解决方案包括:
a. RK3229 多麦克风解决方案和 RK3036 双麦解决方案,麦克风阵列算法和语义平台已经连接 科大讯飞、思必驰、云知声等平台,并支持 Amazon Alexa。

b. RDA :RDA5981 + RDA5856,连接百度度秘平台,主打低成本语音识别方案。

c. MXCHIP VBS6100, 内置思必驰语音技术方案,搭配MiCO 操作系统,语音交互直达云端。

d. NXP i.MX7,连接 Amazon Alexa,Google Assistant,完美支持 Android Things。

e. TI TDA、Jacinto。

 

世平现在主要关注智能音箱与智慧家电等领域。林建和先生表示:当下,智能语音方案实现的功能与性能还有待改善。

 

理想的应用和产品定义是:可以把功耗做低,语音识别效果做好(更高识别率和对方言/口音的识别),实时性要高,体验更方便等。这有待于各原厂继续推出更有竞争力的产品,语音算法公司进一步加强算法技术,以提高人工智能水平。智能语音的革新也需要大型平台带头推动软硬件的结合,以提高接入数量,形成规模化的生态系统,给到用户带来更好的体验等。


智能语音布局:从整合资源到完善生态
林建和先生向与非网记者介绍了世平在智能语音方面的布局情况:

硬件方面
世平正在引入RDA5981语音识别方案,该方案搭载了DuerOS(度秘)对话式人工智能操作系统,可以赋予轻量级设备对话能力。该方案还支持ARM  mbed内核及安全网络协议栈,实现了与云端的安全连接,降低了设备商应用开发门槛。

 

另外,还将结合各芯片原厂资源,进行应用整合,以提升产品边缘计算能力。

 

生态方面
世平将与平台合作伙伴比如亚马逊、Apple、家电厂商、阿里巴巴、华为、电信运营商等平台/产品厂商做深度对接。

 

细究智能语音软肋,未来之路在哪?
正是由于世平看到智能语音落地过程中出现的问题,才有了以上布局与愿景。那么细究其技术痛点,林建和先生认为所有以下五点:

低功耗处理:当下的自动语音识别需要较高功耗才可实现,下一代产品需要做的改善是搭一个声音检测电路,只在检查到人声时才打开更复杂的语音识别电路。才用此方案,可将功耗降低90%以上,做到供电更持久。

 

识别率:由于方言与口音的原因,语音识别无法做到准确识别,还有待于语音识别算法公司进行继续优化。

 

语音识别的实时性:用户说完待识别的词条后,系统立即完成识别功能并有所回应,这就对电路的运算速度有较高的要求,这是一大难点。

 

体积和价格的要求:在要求有尽可能好的识别性能外,还要求体积尽可能小、可靠性高、价钱低等特点,这是需要充分平衡的因素。

 

互联互通:在智慧家庭应用中,场景单一联动不足,产品应用偏向语音助理专属装置,语音处理服务尚未渗透到其他可联网设备中,互联互通存瓶颈。突破点是建立生态圈,开放语音接入服务,提供语音接入基础模块。

 

智能音箱被誉为智能家居的入口,现在互联网厂商、运营商、家电厂商等都在积极布局,世平也是其中一员。林建和先生表示,世平是致力于元件通路商和系统方案整合者,我们希望能努力沟通上下游,一起完成该领域有竞争力的方案,促进整个领域的发展。我们现在是上与互联网公司沟通以接入云平台,下与各个原厂沟通以整合他们的方案并提供给客户,希望大家都可以加入这个生态中,把智能语音做强做大。

 

与非网原创内容,未经许可,不得转载!

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
赵碧莹
赵碧莹

与非网编辑,网名小老虎。通信工程专业出身,喜欢混迹在电子这个大圈里。曾经身无技术分文,现在可以侃侃电子圈里那点事。喜欢和学生谈谈心情、聊聊理想,喜欢和工程师谈谈生活、聊聊工作。不求技术“上进”,只求结交“贵圈”的朋友!

继续阅读
AI语音芯片是虚火还是实热?

短短两个月不到的时间,已经有超过5家公司对外宣布做了AI语音芯片。

小米小爱音箱mini/天猫精灵方糖和小度智能音箱横评:都还有成长空间
小米小爱音箱mini/天猫精灵方糖和小度智能音箱横评:都还有成长空间

今年年初,PChome智能硬件频道曾推出了一篇主流智能音箱的对比评测,不得不说,经过了2017年的萌芽阶段,智能音箱的市场认知程度已经有了明显提升,越来越多的消费者开始了解智能音箱能做什么,智能音箱的主要用户群体也从年轻男性的基础上又纳入了女性用户和儿童用户群体。

智能音箱竞争越来越激烈,谷歌、亚马逊、苹果位居前三
智能音箱竞争越来越激烈,谷歌、亚马逊、苹果位居前三

根据一份新的报告预测,智能音箱市场将继续保持强劲增长,谷歌和亚马逊正在争夺主导地位,而苹果则位居第三。

89元的“小度”智能音箱,销量能达到多少?

作为智能音箱行业的后来者,近年来百度的表现颇为激进。自收购了北京初创企业渡鸦科技之后,去年11月,百度正式推出了首款智能音箱Raven H,试图挤入这一“日渐饱和”的硬件市场。

智能音箱市场开启怎样的新格局?
智能音箱市场开启怎样的新格局?

众所周知,智能音箱的发展已经越来越普及,不仅仅是因为亚马逊、谷歌、苹果和微软都涉足其中。国内的百度、阿里巴巴、京东、腾讯等等也都有涉猎,各自的产品已经在电商平台上销售的如火如荼。

更多资讯
百年诺基亚正在进行怎样的转变?

7月18日下午,HMD在线上直播发布了Nokia X系列第二款产品Nokia X5。在HMD大中华区产品总经理车向光做完简短介绍之后,一场关于新品现场测评的脱口秀随之上演。

人工智能会是解救国产手机的良药吗?

大时代的背景过后,面对现在智能手机市场的平和与放缓在我们看来显得有些索然无味。或许对于现在而言手机创新已经进入瓶颈期,但我们对于未来仍需抱有更多期待。

OLED VS LCD,手机面板厂商之间的博弈会有怎样的结果?
OLED VS LCD,手机面板厂商之间的博弈会有怎样的结果?

受传统市场淡季和OLED产能爬坡信号影响,从今年年初以来,中高端的LTPS LCD面板价格持续下滑,下滑幅度在10-15%左右。目前中高端LTPS LCD单价趋于稳定在20美元左右,柔性OLED单价至少在60美元以上。

中电港限时秒杀
中电港限时秒杀

电子元器件、硬件设备优惠在哪里,《与非海淘》来帮你~

为何联发科和高通要帮助印度手机对抗中国品牌?

联发科和高通表示,他们正在与印度手机制造商密切合作,帮助他们在市场上卷土重来,因为他们已经失去了被中国品牌占据的重要市场份额。

Moore8直播课堂