加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

造芯者胡郁:用半生来阐释「从 0 到 1」的 AI 攻城人

2021/09/28
1125
阅读需 13 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

胡郁与刘庆峰和科大讯飞的缘分,几乎可以说是命中注定的。

科大讯飞联合创始人、轮值总裁胡郁,离职了。

9 月 26 日下午,科大讯飞发布人事变动公告,公告称:胡郁因为打造更完整人工智能产业生态的需要,而辞去公司董事职务。

同一天,刚从科大讯飞卸任的胡郁,以聆思科技董事长的身份,出现这一公司的人工智能芯片战略研讨会上——值得一提的是,科大讯飞董事长刘庆峰也出现在这场会议上,并且就坐在胡郁身边。

(图自:LISTENAI

对于胡郁来说,这次职务变动,颇有归零之感,但又隐含着从 0 到 1 的创业意味。

不过,从 0 到 1 的感觉,胡郁并不会感到陌生——毕竟,这样的从业体验,在他 22 年的科大讯飞职业生涯中已经有了三次。

1

第一个从 0 到 1:

以学生身份担任联合创始人

胡郁与刘庆峰和科大讯飞的缘分,几乎可以说是注定的。

出生于 1978 年的胡郁是安徽省宣城市泾县人,这也是刘庆峰的故乡;不仅如此,虽然刘庆峰比胡郁大五岁,但他报考高考志愿是找胡郁父亲给的建议,两人可以说是世交。

更有趣的是,两个人都是以宣城理科状元的身份,考上了中国科技大学电子工程系;刘庆峰是 1990 年,胡郁是 1995 年,中间也是隔了五年时间——不仅如此,当胡郁入学的时候,刘庆峰刚好拿到中国科大电子工程专业学士学位。

1997 年下半年,胡郁上大三,他进入到了王仁华教授主导的中科大人机语音通信实验室。此时刘庆峰也在这一实验室,但他已经在负责国家 863 项目 “KD 系列汉语文语转换系统” 的研发——这一系统在 1998 年 12 月的国际汉语口语处理研讨会(ISCSL)上获得高度评价。

1999 年,刘庆峰决定创业,他自己出资十万,拉上 17 个兄弟们凑了一点钱,在中科大、安徽省经贸委的出资支持下,成立了科大讯飞的前身硅谷天音——这 17 位兄弟中,就有当时正在读大四的胡郁。

早年的讯飞公司

当年 6 月 9 日,安徽中科大讯飞信息科技股份有限公司组建,开始产业化运作,26 岁的在读博士刘庆峰担任公司总经理,王仁华教授担任技术总监和研究院院长。

到了 11 月,在讯飞公司框架下,六名中科大学生研制出我国第一台“能听会说”的中文电脑,获得总计 668.85 万元的技术股权。这里提到的“能听会说”电脑的研制是智能计算机研究领域的重要课题,也是我国“863 ”计划支持最早、持续最久的高科技项目。

21 岁的本科生胡郁,正是这六名学生的其中之一,他负责的是汉语语音库设计。

此后,胡郁一边继续在中科大读书,一边担任中科大讯飞公司的研究员,主要从事的是语音合成专项技术研究。接下来的数年间,科大讯飞在蹒跚中不断抓住机会发展,而胡郁也从研究员逐步担任基础研发部经理、讯飞语音联合实验室副主任等研发管理角色。

就这样,胡郁伴随着科大讯飞从 0 到 1 的起步过程。

2

第二个从 0 到 1:

国内第一个企业 AI 研究院院长

胡郁在讯飞的一路成长,在 2005 年是一个重要节点。那一年,科大讯飞成立了研究院,胡郁担任研究院执行院长,如今来看,这是国内第一个企业 AI 研究院。

那一年,胡郁才 27 岁。

当时的一个大背景是,科大讯飞在业务方向上看中了运营商的“彩铃”业务,这个业务需要解决的问题是语音识别问题。但科大讯飞的专长是语音合成,而非语音识别。为此,科大讯飞选择了与全球语音巨头 Nuance 合作,成为 Nuance 的代理,并且获得业务成功,最后在 2008 年上市——此为后话。

其实,在上述业务一路发展的过程中,科大讯飞其实也深刻意识到自己在语音技术上对 Nuance 的依赖不可持续,因此需要建立起科大讯飞自己的语音识别研发力量,而要单开语音识别这条线,刘庆峰得先找一个业务带头人。

这个人,就是胡郁。

胡郁开始做语音识别的一个契机是,当年他妻子在香港大学霍强教授处读博士后,想让胡郁跟着去陪读两年;霍强教授也是王仁华教授的学生,当时在语音识别领域已经形成自己的江湖地位。于是,刘庆峰去找老师王仁华商量,王仁华给了一个建议,胡郁在给妻子陪读的同时给霍强做研究助理,借此开始建立起科大讯飞在语音识别的班底。

于是,2005 年至 2007 年,胡郁给霍强当了两年研究助理——多年后谈到这段经历时,胡郁的说法是:“我在香港搞清楚了国际一流的研究怎么做这个问题,并经常把从港大学到的新东西及时带回内地。”

2007 年,霍强从香港大学转去微软亚洲研究院后,胡郁又去找王仁华教授的另一个学生江辉合作,江辉也是科大讯飞创业 18 罗汉之一,是当时中科大 BBS 上黑客版的版主,比刘庆峰高三届,因去东京大学读博士离开,后来又回到科大讯飞。

此外,在语音识别领域,科大讯飞也选择与清华大学王作英实验室合作。就这样,胡郁三箭齐发,开始逐步组建起科大讯飞在语音识别领域的团队。

左林大叔&胡郁

2008 年 6 月,胡郁更进一步,担任科大讯飞公司高级副总裁、讯飞研究院院长,负责领导科大讯飞公司语音合成、语音识别、语音分析、语音评测、声纹语种、语音信号处理等智能语音核心技术的研究及公司整体经营管理。

八年后的 2016 年,科大讯飞在国际语音识别大赛 CHiME上 取得全部指标第一;而在认知智能领域,科大讯飞又相继获得国际认知智能测试全球第一、国际知识图谱构建大赛核心任务全球第一等成绩。

3

第三个从 0 到 1:

让 To C 站在 AI 商业链顶端

对于胡郁来说,他在讯飞的第三个重要台阶,是 C 端业务。

毕竟,移动互联网随着 iPhone 的推出开始爆发,语音行业江湖掀起大浪潮,科大讯飞也感知到了这个趋势,于是它先是推出了“讯飞语音云”平台,又在随后上线了 Android 和 iOS 版的中文语音助手讯飞语点——当然,讯飞也与三大运营商达成合作,试图把握住移动互联网的机会。

一直以来,AI都是以 To B/G 的形式对外赋能,而在 To C 场景中鲜有成功的产品。

对于刘庆峰和胡郁来说,一直非常重要的是,如何让讯飞的技术触达更多的 C 端消费者。

对此,胡郁的说法是:“光凭技术很难成就一家真正伟大的公司,而技术创新、产品创新和商业模式创新都要天时地利……科大讯飞也是这么多年积累了一个成体系的技术体系,在这样的基础上,我们决定向 C 端输出”。

终于,2016 年这一年年底,科大讯飞做出新的组织结构调整,拆分成三个事业部;其中,消费者事业部赫然在列——这一次,作为刘庆峰的多年亲密战友,胡郁又一次被推到前台,他卸任研究院院长一职,担任消费者事业部的负责人。

于是,在胡郁的主导下,科大讯飞开始 To C 道路上的进军。

胡郁在 2016 年发布会上

从产品策略上来看,科大讯飞在 C 端产品上采用了三条内在的逻辑体系。第一条,是通过场景的细分将技术产品化,用技术解决刚需;第二条,是通过构建生态环境来联手合作伙伴一起拓展产品品类;第三条,是通过研发一专多能的全 AI 平台来扩大产品化的技术能力半径,提高自身的核心竞争力。

具体在产品上,从 2017 年开始,科大讯飞相继推出了翻译机、录音笔、智能笔记本、智能鼠标、会议宝、AI 学习机等面向消费者用户的智能硬件,甚至在近两年推出了智能 TWS 耳机 iFLYBUDS、智慧屏、投影仪等产品——当然,这些产品背后都是基于讯飞在语音和 AI 方面的积累。

从业务贡献来看来说,在胡郁和他的团队的努力下,自 2017 年到 2020 年,讯飞消费者业务连续三年保持超过 30% 的高增速,C 端营收占比在 2020 年上半年达 37.59%。

同时,2020 年科大讯飞的 C 端产品,在 618 大促期间整体销售额累计同比增长超 40%,双十一期间累计销售额同比增长 56%。

值得一提的是,在 2020 年 “618” 期间,身为科大讯飞轮值总裁的胡郁也出现在直播间上,为自家旗舰店的产品带货,也是非常拼了。

另外,在 2020 年疫情爆发的大背景下,胡郁也带领团队迎难而上,结合疫情需要,让人工智能产品在战"疫"中大显身手,"智医助理"、"新冠肺炎影像辅助诊断平台"、 "停课不停学"等智能产品在疫情期间也发挥了重要作用。

4

下一个从 0 到 1:踏上芯征程

古人云,四十不惑;43 岁的胡郁,已然过了不惑之年。

在这 43 年间,他用超过一半的岁月伴随了中国语音 AI 龙头企业科大讯飞 22 年有余的完整发展历程。他不仅参与了讯飞从 0 到 1 的发展壮大,也是讯飞研究院从 0 到 1 的掌舵者,更是讯飞 To C 的破局者——可以说,科大讯飞能有今天,胡郁是厥功甚伟的。

而如今,胡郁虽然离开科大讯飞,但又并非与之完全切割。

毕竟,聆思科技的大股东是言知科技,而后者背后的大股东和实际控制人正是刘庆峰;而根据刘庆峰自己的说法,聆思科技是科大讯飞人工智能生态战略的芯片支点——如此来看,身为聆思科技董事长的胡郁,与其说是离职,不如说是一次再创业。

只是这一次,胡郁的目标,是挑战更高的自研 AI 芯片领域,而且他拥有更高的独立自主权。

对于新的挑战,胡郁的说法是,在智能物联网时代,布局 AI 芯片符合国家战略需要与产业发展趋势,自己将从战略规划、产品研发、商业模式、募集资金等领域推动新公司快速发展,“用更长远的眼光布局未来”。

在某种程度上,这也正是胡郁的另外一个从 0 到 1。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
SN74LVC2G17DCKR 1 Texas Instruments 2-ch, 1.65-V to 5.5-V buffers with Schmitt-Trigger inputs 6-SC70 -40 to 125

ECAD模型

下载ECAD模型
$0.6 查看
9DBV0441AKLFT 1 Integrated Device Technology Inc VFQFPN-32, Reel

ECAD模型

下载ECAD模型
$4.96 查看
NC7WZ04P6X 1 Rochester Electronics LLC LVC/LCX/Z SERIES, DUAL 1-INPUT INVERT GATE, PDSO6, 1.25 MM, ROHS COMPLIANT, EIAJ, SC-88, SC-70, 6 PIN
$0.33 查看
Nuance

Nuance

Our innovations in voice, natural language understanding, reasoning and systems integration come together to create more human technology. Learn more.

Our innovations in voice, natural language understanding, reasoning and systems integration come together to create more human technology. Learn more.收起

查看更多

相关推荐

电子产业图谱