谷歌的机器学习利器 Cloud TPU 将首次全面对外开放。谷歌传奇芯片工程师 Jeff Dean 连发了十条 twitter 宣布了这一消息,第三方厂商和开发者可以每小时花费 6.5 美元来使用它,但需要先行填表申请。
此前,TPU 都被用于谷歌内部产品,随着 Cloud TPU 的开放,这意味着 AI 芯片和公有云市场将迎来新的变局。
谷歌同时发布了 Cloud TPU 的 beta 版,这一版本通过谷歌云平台提供,能够帮助更多机器学习专家更快地运行模型。Cloud TPU 是谷歌设计的硬件加速器,专为加速、扩展特定的 TensorFlow 机器学习工作负载而优化。
“把自用的 TPU 开放出来做云服务,显示了谷歌在云业务方面加大投资布局。谷歌将与所有提供智能云服务的厂商竞争;而芯片方面则将和英伟达展开竞争。”Gartner 研究副总裁盛陵海对记者表示。
尽管如此,谷歌和英伟达都否认双方存在直接的竞争关系。这是因为英伟达的芯片面向的是更加广泛的应用,而谷歌的人工智能芯片仅仅是聚焦于机器学习。受到人工智能需求的提振,英伟达的股价近两年上涨超过 6 倍。
早在去年 5 月 17 日的谷歌 I/O 大会上,谷歌就宣布正式推出第二代专注于人工智能的 TPU 处理器。TPU 是谷歌自主研发的一种专为人工智能运算服务的高性能处理器。比如第一代产品已经在数据中心和包括 AlphaGo 这样的人工智能当中使用,主攻运算性能。
而去年发布的第二代 TPU 芯片,不仅加深了人工智能在学习和推理方面的能力,而且谷歌是认真地要将它推向市场。根据谷歌的内部测试,第二代芯片针对机器学习的训练速度能比现在市场上的图形芯片(GPU)节省一半时间。
谷歌云计算团队首席科学家、斯坦福大学 AI 实验室主管李飞飞当时介绍称:“这些 TPU 可提供惊人的 128 万亿次浮点运算,它们是专为驱动机器学习技术的芯片。”与之相比,iPhone 6 可提供 100 万亿次浮点运算,英伟达的 Volta GPU 能提供 120 万亿次的浮点运算。
英伟达目前是图形芯片 GPU 的主导者。英伟达副总裁兼企业系统部总经理 Jim McHugh 表示:“英伟达的 NVIDIA GPU Cloud(NGC)正在为迅速壮大的全球用户普及 AI 变革性力量的高级神经网络。”NGC 已经向亚马逊的云平台提供服务。
谷歌在推出第二代 TPU 时,就推出了 Cloud TPU 云计算服务,用户可以租用,计费也将采取和 GPU 运算服务相同的模式,按分钟来计价。当时谷歌就表示,这款最新的 AI 芯片将不会卖给数据中心基于其它芯片制造商服务器上的公司,比如戴尔。
这也意味着,Google 在 AI 芯片方面的发展思路并非为了与 GPU 直接竞争,而是利用 TPU 在公有云行业差异化发展。谷歌首席技术官 Urs Holzle 表示:“本质上来讲,TPU 就是一个用于机器学习的超级计算机。我们的目标是要提供最好的云服务。”
谷歌在 2 月初公布最新一季财报同时,也首次公布了单季云业务的收入,达到 10 亿美元。相比之下,亚马逊和微软云的单季收入都已经超过 50 亿美元。谷歌在全球云服务市场目前排名第三。
从英伟达方面来看,根据最新一季度财报显示,英伟达数据中心业务是公司目前收入第二大来源,超过 6 亿美元,同比超过翻番,增长 105%。去年 9 月在中国的 GPU 技术大会上,英伟达宣布与中国的 BAT 达成数据中心方面的合作协议。
谷歌的进入让英伟达的投资人感到担忧。他们认为谷歌的参与将夺走大型数据中心运营商客户,从而将影响英伟达的盈利和收入。因为即使谷歌无法把自己的芯片商业化,也将为其赢得议价权。