业界媒体 the Information 发表文章,讲述了为何苹果推出 Siri 七年之后,却在某些方面被谷歌亚马逊的智能助理赶超。乔布斯曾说 Siri 属于人工智能领域,而不属于搜索,但他的去世标志着 Siri 远大愿景的终结。以下原文内容:

 
2011 年,苹果公司在库比蒂诺总部举办了一个“让我们谈论 iPhone”活动,这是一个重要时刻,因为这是新任 CEO 蒂姆·库克做的第一个大型演示,他试图续写乔布斯的传奇。但是这个活动有点令人失望,因为该公司新的 iPhone 4s 升级有限,大家想要看的是 iPhone 5。
 
但 Siri 令人眼前一亮。评论家对 Siri 的潜力惊叹不已,认为它可能会是一种革命性功能。用户们似乎也同意这个看法,iPhone 4s 推出刚三天就卖出了 400 万台,创下了当时 iPhone 销售势头最猛的纪录。
 
时间过去差不多七年了,但 Siri 的一些问题依然存在。分析师认为,这可能就是苹果新推出的一款智能扬声器遭到差评的主要原因。这款扬声器名为 HomePod,售价 349 美元(约合人民币 2200 元)。尽管 HomePod 的时尚外观和音质赢得了赞誉,但测评报告中出现了“蠢笨”“烦人”和“令人尴尬的不足之处”这样的字眼,它的 Siri 功能颇受诟病。
 
Siri 曾经被认为是苹果公司的下一个重大创新。但是在推出七年后,它却成为了让苹果公司最新产品遭受拖累的主要原因。本文讲述的就是这其中的前因后果。
 
辩论不绝
相对于竞争对手亚马逊和谷歌,苹果在数字助理上拥有先发优势,为了了解苹果怎样从领先者沦为落后者,本文采访了苹果公司的十几名前员工,他们负责创建 Siri 或将其整合到苹果的生态系统中。其中大多数人都不愿具名,有些人是因为签署了保密协议,另外一些人则是担心遭到苹果高管的报复。
 
苹果公司想要重塑自己,成为创新而卓越的在线服务公司,而不仅仅是硬件设计公司,但在这条道路上,苹果走得并不顺畅。它在建立在线服务业务方面曾经犯过一些错误——尤其是在 iCloud 服务中。随着 iPhone 销售的继续放缓,在线服务方面的问题不解决可能会给公司带来大麻烦。
 
在接受采访的这些前员工中,很多人都承认,苹果是在 Siri 的技术尚未完全成型之前将它匆匆添加到 iPhone 4s 上的,这就在苹果公司内部引发了一场辩论,有些人主张继续修补 Siri 的缺陷,另外一些人则认为应该把它推翻重来。随着 Siri 的各个团队进入一场地盘争夺战,关于 “Siri 的理想版本应该是什么”的辩论也越来越多。Siri 应该是一个快速准确的信息获取工具,还是一个可以执行复杂任务的精巧助理呢?
 
对于团队领导者和中层管理人员来说,这个问题一直无法解决,他们缺乏乔布斯那种远见或影响力。接受采访的前员工表示,缺乏这种领导力和人员的不断变化让 Siri 在一些关键问题上止步不前,其中最主要的一条就是死守苹果的封闭文化,没有给外部开发人员提供更多机会来创建更多有用的 Siri 应用。
 
Siri 团队有很长一段时间是由比尔·斯达西亚(Bill Stasior)在负责,他是一位安静而低调的工程师,在 2012 年末加入苹果,之前是亚马逊的搜索专家。 斯达西亚负责 Siri 的核心技术 ——语音识别系统、自然语言处理系统和苹果的各种搜索功能。 Siri 的前员工表示,这些单元为了争夺注意力和资源,经常发生冲突。
 
苹果的发言人拒绝让记者采访斯达西亚。在一份书面声明中,苹果发言人称 Siri 为“全球最受欢迎的语音助理”,并对 Siri 在苹果设备上的能力做了介绍。
 
“我们在 Siri 的性能、可扩展性和可靠性方面取得了重大进展,采用最新的机器学习技术来创造更自然的声音和更主动的功能,”苹果在这份声明中写道。 “我们将继续深入研究机器学习和人工智能,以不断提高 Siri 回应的质量以及 Siri 可以回答的问题的广度。”
 
与亚马逊和谷歌产品相比
可以肯定的是,那种完美的数字助理目前还只能在科幻电影中看到,没有哪家公司真正拥有它,苹果的产品在某些领域领先于亚马逊和谷歌。 Siri 支持 21 种语言,而亚马逊的 Alexa 只支持三种语言,谷歌智能助理支持八种语言(谷歌上个月表示其助理即将支持超过 30 种语言)。 Siri 每月在 5 亿多台设备上使用,每周处理 20 亿次请求。
 
Siri 现在的响应速度比最初推出的时候快,并且因为它驻留在 iPhone 中,而 iPhone 又是有史以来最畅销的电子产品之一,那么苹果公司确实可以说,与其他任何数字助理相比,Siri 的用户更多。
 
但与竞争对手相比,Siri 的能力仍然很有限。苹果在 2016 年推出了 SiriKit 工具,让外部开发人员有机会为 Siri 创造新功能。然而,它在开发人员中引发的兴趣远不如苹果的设想。
 
相比之下,亚马逊的 Alexa 拥有 2.5 万个由第三方开发人员创建的“技能”。谷歌发言人表示,谷歌智能助理有 100 多万个“技能”,其中包括谷歌自己写的数字助理命令,比如通过谷歌地图进行导航,但也有第三方开发人员创建的功能(谷歌拒绝透露这类功能的数量)。而且对手们的平台也在迅速扩张:谷歌 1 月份宣称已经有 4 亿台设备搭载其智能助理,而亚马逊表示,他们在去年圣诞节期间销售了“数千万台”支持 Alexa 功能的设备。
 
“Alexa 出货时,它从第一天开始就非常稳定,”一位前 Siri 团队成员说。 “要让 Siri 变得这么稳定,员工需要抛下几乎现有一切,从头开始。”
 
改变世界的梦想
Siri Inc. 成立于 2007 年,它的基础是非盈利研究组织 SRI International 创建的技术。 Siri 最初的愿景是成为智能数字助理,响应用户的请求,并进行交互,以获得理想的回答。例如,Siri 的理想版本不会直接提供一家餐厅的电话号码,而是会先跟用户反复确认细节,如日期,时间和就餐人数,然后自己去帮用户定好餐位。
 
Siri 的创始人认为,达到这一效果的唯一途径就是创建一个开放平台,允许外部开发人员为 Siri 贡献功能,让这个智能助理的能力远远超出内部团队能够创建的水平。
 
“这相当于是在搞‘人工智能商店’,”Siri 初始团队的一名高管说。 “它应该是通过对话来协调互联网的一种方式。”
 
参与创建 Siri Inc. 的诺曼·维纳斯基(Norman Winarsky)说,乔布斯是 Siri 潜力的忠实信徒。 2010 年的一天,乔布斯打电话给 Siri 首席执行官道格·基特劳斯(Dag Kittlaus),邀请该公司的三位联合创始人到他的家中会面。这个会面持续了数个小时,乔布斯最终说服了他们拒绝求购者,投入苹果的怀抱,因为乔布斯表示,苹果有能力以更大的规模实现 Siri 的目标。
 
乔布斯极大地激励了 Siri 的联合创始人,让他们相信自己可以改变世界,“他让我们都相信了这一点。” 维纳斯基说。
 
苹果于 2010 年 4 月斥资 2 亿多美元收购了 Siri。当时 Siri 只有 24 名员工,但苹果很快聘请了更多人组成 Siri 核心团队。 18 个月后 Siri 在 iPhone 4s 上推出时,该团队已发展到近 100 人。
 
在收购 Siri 之后,乔布斯仍然密切关注着 Siri 保持。该团队的前任成员表示,他时常出现在该团队的每周例会上,并对将要推出的功能发表意见。当时担任苹果高级副总裁的斯科特·福斯泰尔也很支持 Siri。福斯泰尔做事的方式有比较强的对抗性,但他对这个产品能够做什么有着强烈的愿景,而且非常愿意亲自参与。他每天都会尝试一下这个技术,并且经常参加他们的会议,还会说:“昨晚上我发现了 10 件事。”一位前 Siri 员工回忆说。
 
为确保 Siri 按时发布,团队对初始设想做出了一些妥协。将产品开放给外部开发人员(也就是 “人工智能应用商店”) 的计划不得不放在一边。乔布斯希望 Siri 专注于做一些只有苹果公司才能完全控制的事情,但早期的 Siri 团队成员表示,乔布斯承诺他们会在晚些时候开始构建第三方生态系统。
 
在 2011 年 10 月 4 日苹果推出 Siri 之后的第二天,乔布斯因癌症与世长辞。 Siri 团队的成员说,他的去世基本上标志着 Siri 初始团队愿景的终结。
 
混乱的开始
Siri 团队仍然拥有福斯泰尔的支持,但他的注意力被其他大项目分散了了,包括即将推出的苹果地图。福斯泰尔安排了理查德·威廉姆森(Richard Williamson)来领导 Siri 的工作,负责让事情回到正轨上。
 
几名前员工表示,威廉姆森做了很多其他人不同意的决定,其中包括每年只更新一次 Siri 的能力。苹果通常对 iOS 就是每年更新一次。而且威廉姆森的工作背景是让软件在从后端服务器接收更新的手机上运行。团队成员表示,他们认为这种模式对于 Siri 来说不合适,他们认为 Siri 应该是一个不断改进的在线服务,而不是每年更新一次。一名前员工说,在第一年里,虽然服务器软件进行了多次稳定性和性能上的更新,但 Siri 在架构上没有任何变化。
 
威廉姆森通过电子邮件回应了采访要求,他写道,关于他认为 Siri 不应该持续改进的说法“完全不属实”。他说,有关“软件和服务器基础设施的技术领导力”方面的决定,是由级别低于他的员工做出的,他的责任是让团队走上正轨。
 
“Siri 发布后简直是一场灾难,”威廉姆森写道。 “它要么速度很慢,要么就用不了。软件里充满了严重的错误。问题完全在 Siri 初始团队的身上。”
 
这篇电邮发表后,基特劳斯在推特上做出了回应:“这个声明完全不属实……事实上,Siri 在刚推出时表现非常出色,任何新平台如果遇到了意外的大规模负载,都需要进行规模调整和 24 小时维护。”
 
Siri 最初推出时,用户数量超过预期,软件开始崩溃。工程师忙于保持后端正常运行,但基础架构根本就不是为了处理这么大流量建立的。一名来支援后台基础设施改进的员工回忆说,有一项 Siri 任务最初需要使用 500 台服务器,在改进代码之后,只需要五台服务器就够了。
 
卢克·朱力亚(Luc Julia)1990 年代曾在 SRI 与 Siri 联合创始人亚当·切尔(Adam Cheyer)共过事。这时朱力亚被找到管理 Siri 团队。几位前 Siri 员工表示,他们很喜欢朱力亚来当领导,但威廉姆森写道,朱力亚与苹果公司的一些人发生了冲突,其中包括福斯泰尔。当福斯泰尔要让朱力亚走人时,威廉姆森同意了。所以朱力亚在 Siri 团队待了不到一年之后就离开了那里。
 
威廉姆森写道,他试图让团队制作 SiriKit 工具包,以便让外部开发人员改进 Siri 的功能,但遭到团队反对,因为 Siri“初始的软件非常脆弱和僵化”。
 
威廉姆森和团队之间的分歧导致了 2012 年 6 月 Siri 联合创始人切尔的辞职。接下来,Siri 初始团队又有几名成员走了。而在那一年之前,Siri 的另一名联合创始人基特劳斯就已经离开。
 
2012 年年底之前,福斯泰尔和威廉姆森也离开了。因为 iOS 6 苹果地图功能发布时错误百出,十分糟糕,他们被苹果解雇了。福斯泰尔的离开让前 Siri 员工感到惋惜,因为他们失去了一位支持 Siri 的高级管理人员。
 
转向搜索
在苹果收购 Siri 后不久,乔布斯向公众解释了他的一些想法。
 
在 2010 年 6 月《华尔街日报》技术大会 All Things Digital 上,乔布斯表示:“Siri 不属于搜索领域,而是属于 AI 领域……我们没有计划进入搜索领域,我们对该领域不熟悉,它也不是我们关心的事情,其他公司在搜索上做得很好。”
 
不过,高质量的搜索功能是数字助理的关键组成部分。当用户提出问题时,AI 需要搜索知识来源,快速找出正确的答案。
 
但是,乔布斯要表达的正是 Siri 初始团队中许多成员坚持的观点:Siri 比搜索的覆盖面更大。Siri 一位团队成员表示,理想的 Siri 版本应该是 2013 年电影《她》中的操作系统 Samantha 那样。这部电影讲的是孤独的男主角爱上了操作系统 Samantha。
 
坚持这一愿景的团队成员表示,当他们获悉像斯达西亚这样的搜索专家被指派来领导 Siri 团队时,他们感到很怀疑。斯达西亚拥有麻省理工学院的计算机科学博士学位,还帮助创建了亚马逊搜索部门 A9.com,从 2006 年至 2012 年担任 A9.com 的总裁兼首席执行官。
 
一些在斯达西亚领导时期的 Siri 团队成员认为,他在语音和自然语言处理方面的背景不强,无法成功领导这个团队。
 
“我觉得,尽管他到苹果的时候对 Siri 非常感兴趣,但长期目标始终是创建一个搜索引擎,”斯达西亚领导时期的一名前员工说道。 “Siri 对他只是一个跳板。”
 
斯达西亚跳槽到苹果时,苹果的搜索工程资源分散在各个部门,出现了大量重复。当时的说法是,斯达西亚的职责包括将 Siri 和苹果现有搜索功能中所有不同的资源集中在一起,以改善 Siri 的核心性能。苹果公司想增强在搜索技术领域的存在,斯达西亚也负责主持这项工作。
 
“他的工作是把搜索作为一项核心资产,使其成为苹果公司的拳头产品,”一个在斯达西亚领导时期在搜索团队工作的人说。
 
收购和整合
斯达西亚领导了一系列收购活动,为苹果公司引入搜索人才和技术。据 TechCrunch 报道,2013 年 10 月,他们斥资 4000 多万美元的价格收购了 Cue。这家初创公司创建了一款个人助理 app,在用户的电子邮件中搜索出个人日程。
 
斯达西亚还领导了 2013 年 2 亿美元对 Topsy 的收购案。 Topsy 的技术被用在了 Spotlight 上。Spotlight 是 MacOS 和 iOS 操作系统内置的搜索功能,最初是在 2004 年推出的。
 
“如果斯达西亚发现了什么好东西值得收购,他就可以做主。”一位负责收购尽职调查工作的苹果员工说,“这么做的目标是尽可能多地收购并整合搜索人才。”
 
一位前员工表示,Topsy 团队最终发展为斯达西亚手下的一个庞大的组织,现在几乎与 Siri 团队的员工数量差不多。Topsy 首席执行官普拉卡西(Vipul Ved Prakash)继续领导着那个搜索团队,直接向斯达西亚汇报工作。
 
事实证明,将现有的 Siri 团队与斯达西亚的搜索部门结合在一起很麻烦。 Topsy 团队的成员不愿意与 Siri 团队合作,因为觉得他们觉得 Siri 很慢,基础设施经过修修补补,但自从发布以来就没有彻底换过新的。
 
“当时搜索团队有一种感觉,‘为什么我们不从头开始,创建我们需要创建的东西,然后再来协调两边?’”搜索团队的一名前成员说。“他们现在还在进行协调。”
 
Core Siri 和 Spotlight 是由 Topsy 的技术和 Siri 数据服务组合而成的;该服务的基础是从 iTunes 搜索移植过来的旧版搜索技术,但是针对 Siri 进行了修改,在 2013 年的时候推出。 Siri 数据服务处理维基百科、股票和电影放映时间等事项,Topsy 则处理 Twitter、新闻和 web 搜索结果。 Siri 数据服务团队最终被并入了 Topsy 团队。但是它们使用的是两种不同的编程语言,很难协调。
 
对搜索团队的整合导致了一些令人尴尬的结果。用户使用 Siri 和 Spotlight 时可能会获得完全不同的回答,这些回答是由两个不同团队构建的两种不同的搜索技术提供的。
 
“宫斗”和篮球
Siri 最初的技术涉及自然语言处理,它的用处是理解用户的意图。语音处理是用来检测用户讲的话,苹果最初将这项技术外包给了位于波士顿的 Nuance。斯达西亚到来后,苹果公司开始致力于构建自己的语音识别软件。
 
2013 年,该公司聘请了微软经验丰富的语音识别专家阿历克斯·阿西洛(Alex Acero)来领导一个新的语音识别团队。苹果还在 2013 年收购了语音创业公司诺瓦瑞斯技术公司,希望将其新的语音识别技术与核心 Siri 技术相结合,以改善 Siri 的语音交互能力。 Siri 团队认为,将这些技术结合起来很有意义,可能会为 Siri 带来重大改善。
 
但在 2014 年年底,这种团队联合开始仅仅 6 个月后就结束了。阿西洛继续领导语音识别团队,而自然语言团队则由曾在咨询公司麦肯锡工作的管理顾问安诺普·辛哈(Anoop Sinha)来领导。
 
接受采访的前员工表示,从来没有人向他们解释过联合为什么要终结,但这件事给人的感觉是辛哈在搞“宫斗”。
 
辛哈没有自然语言处理领域的背景,Siri 团队有几名成员从一开始就不喜欢他。一名前员工说,辛哈做决定的出发点似乎是办公室政治而不是科学。
 
辛哈和阿西洛不对盘是公开的,有一名前员工谈到了两人参加会议的情景:两个人会都让斯达西亚澄清他们中谁负责哪一个项目。这种“宫斗”引发了另一批员工离职,其中包括几名经验丰富的语音科学家。
 
辛哈的 LinkedIn 个人资料显示,他于 2016 年离职,现在是 Facebook 的工程经理。
 
基特劳斯和切尔又联手组建了一家名为 Viv Labs 的新公司,继续打造更好的数字助理,一些离开 Siri 团队的员工也投奔了他们。 斯达西亚对这样的情况很不爽。当得知基特劳斯和切尔仍然会去苹果园区和老同事打篮球时,斯达西亚担心他们挖走更多人。很快,两人就被禁止进入苹果园区了。
 
对手涌现
斯达西亚继续开展雄心勃勃的收购活动,试图改善 Siri。 2015 年 10 月,他牵头收购了 VocalIQ,这是一家英国 AI 初创公司,致力于动态学习系统,而不是提供程式化的响应。
 
VocalIQ 的一名员工说,VocalIQ 团队将 Siri 视为“手工制作的系统”,认为他们的技术有助于改善之。他说,VocalIQ 的技术旨在通过吸收和分析语音交互的数据,不断地调整准确性。知情人士透露,苹果已成功将 VocalIQ 技术整合到 Siri 的日历功能中。
 
苹果还在自然语言处理系统中引入了更多自动化机器学习技术。前 Siri 员工拉辛·萨阿(Rushin Shah)领导了将更多自动化机器学习集成到域选择中的工作—— 例如 Siri 需要弄清某个请求是要发短信,还是要打专车。萨阿在 LinkedIn 上的个人资料显示,他在 2017 年离开苹果公司,去了 Facebook 担任自然语言理解团队的高级经理。
 
与此同时,苹果公司在数字助理领域的优势地位已经不保。 2017 年 6 月,《华尔街日报》的一篇报道预测,HomePod 最好也就是排在家庭智能扬声器市场的第三位。
 
苹果公司似乎并未料到会面对这样的竞争。Siri 团队的两个成员告诉记者,该团队直到 2015 年才知道苹果有 HomePod 项目。亚马逊推出 Echo 是在 2014 年底。据消息人士透露,苹果最初的计划之一是将在没有 Siri 的情况下推出扬声器。
 
苹果决定将 Siri 加入扬声器项目后,Siri 语音识别单元开始与苹果以 30 亿美元的价格收购的 Beats 音频产品公司每周举行一次会议,一开始大约有 25 人参加这些会议。
 
Beats 团队负责开发麦克风上的降噪和波束形成算法,以便更好地提取用户的语音命令。苹果公司在湾区周围的一些公寓安装了麦克风,用来收集数据并复制家庭环境。
 
但 Siri 发展过程中最明显的失败在于它仍然缺乏第三方开发人员生态系统,而这被认为是 Siri 最初愿景的关键元素。根据前员工的说法,在多年搁置该项目并将资源转移到其他领域之后,苹果终于在 2016 年推出了 SiriKit。多名消息人士称,自 2012 年以来,苹果一直在断断续续地制作这个开发工具包。
 
苹果最终任命 Siri 老员工文尼特·科斯拉(Vineet Khosla)来领导 SiriKit 项目,让开发者能够把自己的应用与 Siri 连接起来。苹果看上去是想提升这个数字助理的功能,而不是依靠有限的本机应用来提供拨打电话或发送短信等少量功能。
 
但 SiriKit 的承诺尚未兑现。到目前为止,它仅包含 10 个 “意向域” —— 例如付款、订车、设置待办事项列表和查看照片等。SiriKit 项目的一些高级工程师已经离开了苹果,或是离开了这个项目。据知情人士透露,科斯拉也不再是 SiriKit 的领导,尽管他仍然受雇于苹果。现任 Siri 负责人罗比·沃克(Robby Walker)已经接管了 SiriKit 项目。
 
前 Siri 成员指出,虽然苹果公司想要把自己重新打造为一家服务公司,但其核心仍然是产品设计。相对于创建完美的在线服务,苹果更重视的是设计变革性的硬件,对于一些复杂的项目来说,这可能会引发问题。
 
“苹果公司的结构与这些努力背道而驰。”一位前 Siri 员工表示, “我认为要在那样的整体心态下开展工作,斯达西亚肯定是步履维艰。”