• 正文
  • 相关推荐
申请入驻 产业图谱

姚顺雨这次把话说透了,腾讯AI开始进入下半场

3小时前
806
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

大家好,我是 cxuan,一个和 AI Agent 互相折磨的 builder。

我把这两天姚顺雨的访谈看完了,不得不说,这两天腾讯 AI 的信息量有点大。。。

6 月 5 日,腾讯云 AI 产业应用大会上,汤道生和姚顺雨做了一场公开对谈。

6 月 6 日,汤道生又接受了一轮媒体采访,把很多外界关心的问题继续摊开讲了一遍。

我看完之后的感受是:腾讯这次终于把自己对 AI 的想法说清楚了。

至于“腾讯终于要发力了”这种套话,反而没那么重要。每次大厂一开会都这么写,真没啥意思。

腾讯这次想说的其实很简单:模型只是一块。元宝、WorkBuddy、CodeBuddy、文档、会议这些产品和工具,得接到同一个任务流程里,让 AI 拿得到上下文、调得动工具,最后真的把事做完。

这可能正是腾讯最适合走的那条路。

我觉得腾讯最该做的,也就是这件事。

先说个容易搞混的。

这次的主角是姚顺雨,别和姚顺宇混了。

姚顺雨是清华姚班、普林斯顿 CS 博士,做 ReAct、Tree of Thoughts、语言智能体这些方向,之前在 OpenAI,后来加入腾讯,任腾讯首席 AI 科学家。

姚顺宇是另一位,清华物理、斯坦福理论物理博士,之前在 Anthropic 和 Google DeepMind。

两个名字只差一个字,但路线完全不一样。

两个 Shunyu Yao 照片对比图。

先把这个捋清楚,不然后面全串台了。

外界问腾讯 AI,最爱问的就是一个问题:腾讯在 AI 上的动作是不是变慢了?

ChatGPT 出来之后,OpenAI、Anthropic、Google、DeepSeek、KIMI、GLM、字节、阿里,都有过让外界记住的模型或产品。相比之下,腾讯过去一段时间确实不算最抢眼。

但姚顺雨这次没有直接回避。

他没有硬说腾讯动作一点都不慢。

他直接给大家抛出来了一个问题:AI 到底是一个短期游戏,还是一个长期游戏?

如果 AI 是两年内决胜负的短跑,那产品推进慢、模型发布慢、市场反应慢,确实好像是大家认为的那样。

但如果 AI 更像 PC 刚出现时的 70 年代,那现在其实还有大量产品形态还没填满。

现在最容易被记住的是 ChatGPT 和 Claude Code。聊天和写代码只是其中两类产品形态。多模态、具身智能、办公协作、企业流程这些东西,现在还没有定型,未来几年还会有新的产品形态跑出来。

这话里确实有解释过去节奏的部分。

但它也讲到了腾讯自己的产品条件。

说到底,腾讯这种公司,本来就不擅长每三个月做一次惊艳全球的模型发布会。

它更擅长把 AI 能力放进真实产品里,让大量用户每天用,再根据反馈一轮一轮迭代。

如果 AI 下半场更看产品,这条路就还有机会。

如果 AI 下半场最后只看模型,那腾讯确实会很难受。这话说直白点,腾讯就不适合天天跟人拼发布会节奏。

所以我觉得,腾讯这次讲“长期游戏”,是在把自己的想法讲清楚。

它确实更适合在产品里持续迭代。靠下一次模型发布会吸引注意力,对它来说没那么合适。

换句话说,这就是腾讯现在面对的取舍。


姚顺雨这次讲得最关键的一句话是:过去 AI 更重要的是找方法,现在更难的是找问题。

以前做 AlphaGo,是为围棋设计一套方法。

做翻译,是为翻译设计一套模型。

方法和问题基本绑定。

但预训练、后训练、大模型出来以后,情况变了。模型能力变强了,于是产品团队得重新回答一个问题:

到底该先解决哪个具体问题?

腾讯能拿出来的东西,首先是具体需求和上下文。

它手里有大量真实产品,也就有大量真实问题。

社交、办公、会议、文档、游戏、金融、医疗、教育、企业协作,都是问题。

而这些问题背后,还有上下文。

用户过去怎么用产品,企业内部有哪些资料,会议里说了什么,文档里改过哪些内容,开发流程里哪些地方最容易卡住。

这些东西,不是 benchmark 里能长出来的。

所以姚顺雨反复提 context。

简单讲,就是模型干活前拿到的那些“前情提要”。

模型越来越强之后,产品差距开始落到具体材料上。用户手里的资料、会议记录、文档修改历史、代码仓库、企业权限,这些东西能不能被 AI 用上,变得很重要。

说白了,AI 下半场拼的,是谁更知道用户到底想解决什么问题。 这会直接影响产品能不能帮用户把事做完。


Co-Design 比刷榜更重要

这次访谈里还有一个关键词:Co-Design。

这个说的是模型和产品共同设计。

你可以理解成,模型团队别只顾着刷榜,产品团队也别等模型训完之后,再把它放进产品流程里。

两边要一起定目标、一起看数据、一起改体验。

过去大家很容易盯着 benchmark。

数学多少分,代码多少分,长文本多少 token,排行榜第几名。

这些当然有用,但问题是,真实用户不会像 benchmark 一样提问。

真实用户经常会这么做:

先问一句话,然后聊着聊着又会追问、改口、补材料,还会把搜索、文档、会议、代码、表格混在一起。

这时候,模型能不能接住上下文,能不能把工具调起来,就比单次问答分数更接近用户体验。

所以汤道生在 6 月 6 日采访里提到,姚顺雨来了之后,推动混元从原来更在意外部 benchmark,转向以产品用户体验作为主要衡量标准。

这点我觉得比“某个榜单涨了多少分”更重要。

因为这代表模型团队终于要从给评测集交作业,转向给产品体验负责。

汤道生还说,训练 Hy3 之前,姚顺雨做了大量数据质量的工作,砍掉很多看起来很能堆数据量,但实际对模型训练没有帮助,甚至有害的数据。

这个动作说明了一件事。

很多人一谈模型训练,就默认数据越多越好。

但真实情况可能是,有些数据不是资产,是污染源。

敢砍数据,比敢堆数据更难。

这个决策其实挺狠的,也非常果断。

我觉得这比“混元某个榜单涨了几分”更说明问题。

因为榜单涨几分,普通用户可能根本感觉不到。

但如果元宝、WorkBuddy 里的回答更稳、任务跑得更快、用户愿意多用几次,这个变化才能吸引人持续使用。

目前看,Hy3 已经在元宝、CodeBuddy、WorkBuddy 这些产品里都接入了。

腾讯官方说,WorkBuddy 接入 Hy3 Preview 后,首次响应速度提升 54%,任务平均完成时间缩短 47%。汤道生也说,大概 80% 元宝用户已经在用 Hy3,留存率有明显提升。

图源:腾讯云开发者社区。

图源:腾讯云开发者社区。

这些数字不代表腾讯已经赢了,现在下结论还为时过早。

但至少可以这么认为:产品反馈开始进入模型训练、评测和产品迭代中。


腾讯这次还发布了“效率智能体工具集”,覆盖 20 多个垂直场景。

图源:腾讯官方大会资料。

个人侧有 QClaw、WorkBuddy、元宝、ima、腾讯文档。

企业侧有 WorkBuddy 企业版、ClawPro、腾讯云智能体开发平台 ADP 4.0、企点营销云。

看名字有点眼花。

但我觉得,这事儿别理解成腾讯突然发布了一堆 Agent。

更准确地说,是腾讯怎么把过去沉淀在各个产品里的能力,变成 Agent 能调用的工具。

腾讯文档要变成 WorkBuddy 能调用的 Skill。

腾讯会议沉淀会议上下文,让 Agent 理解、调用、生成纪要、提炼待办。

企业微信继续承担人与人、人与服务的连接。

WorkBuddy 则更像人和 AI 协作的工作台。

Agent 难就难在这里。

只套一个聊天框,然后让模型自己发挥,撑不起 Agent。

你得给它工具、记忆、权限、上下文和可执行环境。

没有这些,Agent 就是一个很会说话的客服。

有了这些,它才有机会真的干活。否则只能给一段看起来对的回答,任务还得留给人来做。

我觉得很多 Agent 产品现在的问题就在这。

聊天的时候看起来还行,一到执行任务,就能看出差距。

腾讯如果真有优势,也应该是在“动手环节”这里。再做一个更会聊天的入口,意义没那么大。


汤道生在访谈里提到一个细节,有点意思。

他说,过去产品研发是很典型的瀑布流:

产品经理写 PRD,交互设计师设计流程,视觉设计师做界面,前端后端实现,最后测试。

传统研发职责流转图。

AI 开始生成大量代码后,这条线不再这么一棒接一棒往下传。

很多工程师少敲一点键盘,把更多时间花在定义结果、架构设计、评测和测试上。

一个工程师甚至能像小组负责人一样,带着几个 Coding Agent 一起做需求、写代码、跑测试。这已经不是简单的“辅助写代码”了。。。

这和我最近用 Codex、Claude Code 的体验很相似。

等 AI 真能写很多代码,人最重要的能力就从“我能不能写出这一段”,变成“我知不知道这一段该不该写”。

以前实现能力是门槛。

以后更重要的是判断需求该不该做、模块怎么拆、接口怎么定、最后怎么验收。

腾讯官方还提到,CodeBuddy 已覆盖腾讯超过 95% 的工程师,整体编码时间缩短 40%。

图源:WorkBuddy 官网截图。

图源:CodeBuddy 官网截图

这个数字不一定能直接外推到所有公司。

但至少方向摆清楚了。

程序员不会立刻消失。更大的变化,是从写代码的人,变成驱动 AI 写代码并负责结果的人。

这对普通工程师来说,是机会,也意味着压力。


这次访谈里,汤道生讲商业化讲得比较谨慎。

WorkBuddy 这类智能体目前仍处在战略投入期,腾讯没有给团队设商业化目标。

因为 AI 产品现在最大的问题变了。

用户想用只是第一步,用得越多成本越高才是真压力。

移动互联网时代,边际成本很低,广告、交易、带货都有机会覆盖成本。

但 AI 不一样,推理成本是真金白银。

每一次复杂任务都要消耗 token、算力、工具调用和存储。任务越复杂,成本越不可控。

所以汤道生说,AI 原生服务很难单纯靠广告覆盖推理成本,更适合先用在那些高商业价值、能算得过账的场景里。

这也是现在所有 Agent 产品必须面对的问题。

Demo 做得再好,也只是第一步。

一旦进了真实业务,企业就要算预算、计费方式、责任边界和成本分摊。每一项都会影响产品能不能长期跑下去。

腾讯还有一个更具体的压力:算力。

汤道生多次提到算力紧张,有限资源优先满足内部产品,比如混元训练、微信、腾讯会议、元宝等。把 GPU 租给外部客户,优先级相对靠后。

这也解释了为什么腾讯不急着把 AI 包装成一个高利润故事。

它现在更像是在做基础设施和产品试错。

先把使用量、产品留存、模型反馈和工具链跑起来。

等这些数据稳定下来,再谈收费方式和利润空间。

现在很多 AI 产品有需求。

麻烦在于,需求一上来,成本也跟着上来。

用户越活跃,公司越肉疼。。。这放以前移动互联网里没这么明显,但 AI 时代确是实实在在的问题。


这次姚顺雨和汤道生的访谈,不能证明腾讯 AI 已经赢了,瑶瑶领先了。

但腾讯终于把自己想怎么做说清楚了。

单纯追模型榜单,这条路不可行。

只做一个聊天机器人,更不可行。

把所有希望押在某个爆款 Agent 上,同样不够。

腾讯这次讲的是把模型、产品、上下文、工具、数据反馈和内部协作方式放在一起做。

这条路更符合腾讯过去做产品的方式。

腾讯的优势,是场景多、产品多、用户多、内部工具链复杂。

腾讯的麻烦,也恰好是这些东西太多、太复杂、太难协调。

所以我不觉得腾讯这条路会走的很容易。

它的优势和难点是同一个东西:产品太多,场景太多,组织也太大。

所以后面不用盯着腾讯下一次模型发布会能不能讲得更漂亮。

到最后,还是得看元宝、WorkBuddy、CodeBuddy、QClaw 这些产品,能不能用上上下文,调起工具,把任务跑完,并且让用户愿意继续用。

AI 下半场不能只看模型发布会。

AI 下半场,要看谁能把模型放进真实业务里,让它长期稳定地把任务做完。

这也是我觉得这次访谈有价值的原因。至少腾讯这次讲了产品、上下文、工具和成本,没有只喊口号。


资料来源:

    新浪科技:《现场实录|汤道生对话姚顺雨:腾讯AI的下半场》腾讯官方:《腾讯云首发效率智能体工具集,构建面向多元人群的AI生产力入口》东方财富网转载界面新闻:《对话腾讯汤道生:AI业务还处于战略投入期 业务阶段性快慢很正常》腾讯云开发者社区:《混元3 Preview 相关资料》姚顺雨个人主页:https://ysymyth.github.io/姚顺宇 Google Scholar:https://scholar.google.com/citations?user=i4kyLbwAAAAJWorkBuddy 官网:https://www.workbuddy.cn/CodeBuddy 官网:https://www.codebuddy.cn/腾讯元宝官网:https://yuanbao.tencent.com/腾讯云 ADP 官网:https://adp.tencentcloud.com/zh

 

腾讯

腾讯

腾讯于1998年11月成立,是一家互联网公司,通过技术丰富互联网用户的生活,助力企业数字化升级。我们的使命是“用户为本 科技向善”。Founded in 1998, Tencent is an Internet-based platform company using technology to enrich the lives of Internet users and assist the digital upgrade of enterprises. Our mission is "Value for Users, Tech for Good".

腾讯于1998年11月成立,是一家互联网公司,通过技术丰富互联网用户的生活,助力企业数字化升级。我们的使命是“用户为本 科技向善”。Founded in 1998, Tencent is an Internet-based platform company using technology to enrich the lives of Internet users and assist the digital upgrade of enterprises. Our mission is "Value for Users, Tech for Good".收起

查看更多

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录