加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

全新语音AI芯片亮相 启英泰伦将语音识别推向新高点

2022/07/28
1166
阅读需 9 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

“三芯起 万物声”启英泰伦第三代语音芯片发布会如约而至。历经三年潜心研发,启英泰伦正式推出全新第三代智能语音芯片,相较上一代产品,这款芯片创下算力更高、高度集成和算法新高的“三高”记录,全面覆盖高性能、低成本端侧语音和端云融合语音等应用。

离线语音AI芯片的“先行者”

近年来,随着5GAIoT等技术的快速发展与应用融合,人工智能产业及相关业务越来越受政府和产业界的关注与支持,在国家的“十四五”规划中,人工智能技术已被列为前沿科技领域的“最高优先级”,宏观环境不断向好发展。

在各类人工智能技术中,语音识别、自然语义理解(NLP)、机器学习居于重要地位,是人机交互技术的基础,其中,语音识别、NLP两项均与语音交互密切关联。作为人机交互中最符合人类日常交流形态的技术,语音交互方式更加自然,也更为便利。

从产业发展的角度看,技术突破和政策利好有效刺激了智能语音行业的发展。不过,从更底层的逻辑出发,人机语音交互体验的持续改善才是市场的核心推动力。更长远来看,智能语音的本质其实是实现人机之间的语音自由交互。

在智能语音识别发展早期,由于语音识别对算力的要求高,企业都是通过云端进行智能语音识别处理。然而,在主流方向如此明晰的情势下,启英泰伦却选择另辟蹊径,率先选择了离线语音AI芯片的方向。
 

那么,启英泰伦为何作出这一选择呢?对此,启英泰伦创始人兼CEO何云鹏表示,这一选择的出发点是基于对用户真实需求的深入思考。首先,离线语音是不依赖网络和云中心的真智能,既能给用户带来即时的灵敏响应,也能更好地保护用户的隐私。此外,出于对用户权益的考量,离线语音能确保用户拥有完整的、自主的智能设备使用权和控制权。最后,除用户体验外,还需考虑更广泛的用户的成本承受能力,不仅是让用户体验更好,也能用得起。

近年来,随着智能语音技术不断发展和应用的不断拓展,云端处理在响应可靠性、隐私保护、成本等方面的弊端逐步暴露出来。在端云融合的趋势之下,启英泰伦的这一选择也愈发凸显出其先见之明的一面。

BNPU 3.0将语音识别推向新高点

从实际应用场景来看,智能语音的需求大致可以概括为语义理解、特征识别、语音处理、实时交互四个方面。为了更好地满足上述用户需求,启英泰伦在算法攻关和芯片研发两个方面同时发力,埋头攻克一个又一个业内难题。发展至今,启英泰伦自研技术平台BNPU(脑神经网络处理器)已迭代三次,从BNPU 1.0、BNPU 2.0,一直到今天推出的BNPU 3.0版本。

每一代BNPU的问世,都是离线语音芯片和算法的一次突破和语音应用的助推。何云鹏介绍道,第一代BNPU实现的是端侧语音识别,是行业首款集成神经网络处理器的语音AI芯片,也是离线语音产业应用兴起的标志。二代系列芯片CI1102/CI1103及CI1122芯片则集成了第二代BNPU,不仅实现了离线语音识别功能,还能实现离线声纹识别和命令词自学习等个性化的功能。如今,第三代芯片又将把整个语音识别应用推向新的高点。 

 
从芯片算力方面看,三代13系列芯片内置BNPU 3.0和支持DSP指令扩展的RISC CPU两大内核,主频高达240MHz,并具有640KB系统SRAM

何云鹏指出,在实际应用中,用户对智能语音的要求极高,对于一个能听会说的设备,常以机器人,甚至超人的标准对待。比如,在人耳也不易听清的嘈杂环境中,会希望语音设备能听清;人耳很难同时听懂两个以上人说话,但要求语音设备能听懂。此外,很少有人能听懂各地的方言口音,但各地方的人会要求设备听得懂该地方言,甚至土话。 

为了满足上述苛刻要求,第三代BNPU作了大量技术迭代。除继承第二代的语音识别、声纹识别外,还支持了基于深度学习的降噪技术(深度降噪),人声分离技术(深度分离),命令词自学习2.0版本技术,以及行业首次突破性的离线NLP技术。 

此前,业界普遍认为只有云端才能实现NLP,而启英泰伦最新的技术已经可以采用端侧智能语音芯片实现NLP,将语音处理放在端侧,既保障了用户的体验感,又能降低云端搭建和运营成本,降低网络带宽消耗,也能提升用户使用的安全性。

为了帮助下游客户实现敏捷开发、快速落地的目标,启英泰伦还推出了语音AI平台。该平台支持10000用户同时开发,即时生成NLP模型,提供更自然的语音交互能力。

为用户打造专属守护精灵

随着互联网、5G和Wi-Fi等技术的快速发展,智能行业正从“单点智能”走向“情景智能”,专业的智能语音芯片技术在这一转变中扮演着至关重要的角色。

由于智能语音技术和NLP技术不断加速发展,智能语音的市场空间不断打开。目前,智能语音已在2C消费级的智能家居、智慧生活、智慧办公、智能驾驶;2B企业级的智慧医疗、智能客服等多个领域实现场景应用。据IDC的统计数据,2021年中国智能家居设备市场出货量已超2.2亿台,2022年中国智能家居设备市场出货量则将突破2.6亿台,同比增长为17.1%。

经过长达近7年的发展后,启英泰伦积累的B端客户已超过5000名,平台开发者则超过了1万名,使用启英泰伦智能语音平台的在校AI学员则超过10万名。离线语音方案的年装机量则超过2000万,并正快速向上亿年装机量发展。

 
启英泰伦的终极目标是打造跨设备、跨时空,用户专属,终身守护的守护精灵。何云鹏将这一目标划分为三个阶段,第一步是让人机交互更自然,更具普适性;然后通过更多的数据,让机器更理解人、更主动地为人类服务;最终目标是打造专属的守护精灵,它将是用户全方位的生活管家、健康安全卫士、百科知识导师和给与心灵陪伴的知己朋友。

为了更快地实现自身目标,启英泰伦正加强生态建设,提升应用开发平台,和合作伙伴们一切推动生态建设,努力降低AI语音应用的门槛。对于启英泰伦的理想,何云鹏感慨道“那些站在民族和人类立场的美好愿望,一个人的力量是微薄的,但多一份总会更好!一个人这么想,就会有更多人这么想,最终汇聚成浩浩荡荡一往无前的力量!”
 

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
ZTX651STZ 1 Zetex / Diodes Inc Small Signal Bipolar Transistor, 2A I(C), 60V V(BR)CEO, 1-Element, NPN, Silicon, TO-92 COMPATIBLE, E-LINE PACKAGE-3
$1.4 查看
BT152-800R,127 1 WeEn Semiconductor Co Ltd Silicon Controlled Rectifier, 20A I(T)RMS, 800V V(DRM), 800V V(RRM), 1 Element, TO-220AB, PLASTIC, SC-46, 3 PIN

ECAD模型

下载ECAD模型
$1.05 查看
33220 1 Hirel Systems Ltd General Purpose Inductor, 189uH, 12%, 1 Element
$0.39 查看

相关推荐

电子产业图谱