信息智能的时代,大概到2028年接近终局。物理智能的时代,刚刚开始,未来10到15年是最大的机会窗口。再往后,是人与机器深度融合的生物智能时代。
这是清华大学李升波在2026年百人会论坛上给出的AI发展三阶段判断。从2018年就开始推动端到端训练路径的清华团队,这次带来的不只是技术介绍,更是一套对整个行业发展节奏的系统性认知。
读完这篇,你会得到:清华对AI三阶段发展的完整判断、中国企业端到端落地的三大真实挑战与清华的解法、仿真技术的三代演进逻辑、以及智驾和机器人具身智能的训练难度对比。
AI发展三阶段:信息智能已近终局,物理智能方兴未艾
清华给出的判断是把AI发展划分为三个递进阶段,每个阶段有清晰的时间边界和技术特征。
第一阶段——信息智能:从ResNet、AlphaGo、ChatGPT到DeepSeek,这个时代的AI主要活在数字世界里,处理文本、图像、语音。清华的判断是,这个阶段大概到2028年基本接近终局——豆包、ChatGPT这类产品的交互形态已经相对成熟。
第二阶段——物理智能:AI进入物理世界,以自动驾驶和机器人为主要落地形态。这个阶段现在刚刚开始,未来10到15年是最大的机会窗口,会有大量新技术、新手段、新公司在这个领域涌现。
第三阶段——生物智能:量子计算、人造生命、人机深度融合。清华认为这大约在15到20年甚至更长远的未来才会到来。
这三个阶段不是并列的技术选项,而是递进的历史阶段。身处2026年,物理智能的窗口已经打开,但大多数人还没意识到这件事的体量。
端到端落地:中国企业面对的三个真实问题
清华在演讲中没有回避一个问题:尽管国内很多企业都在讲端到端模型、VLA模型,但真正的挑战是什么?清华给出了三个直接的追问。
①数据规模:我们的数据数量是不是能和特斯拉相提并论?清华的判断很直接——"不谈数据规模,只谈模型训练,是毫无意义的。"数据规模决定了性能的基本边界。
②算力支撑:我们的算力是不是能支撑过亿级参数规模的训练?特斯拉需要超大算力的云平台持续更新迭代,国内企业在这里面临天花板。
③算法路径:我们的训练路径是不是还局限在监督学习?DeepSeek的出现给了一个启发——更高效的算法可以打败靠数据规模和算力堆砌的路径。
清华的解法:通过仿真生成数据解决数据不足;通过强化学习而非模仿学习解决性能上限;通过高效算法设计摆脱算力依赖。这三点也是清华从2018年开始的研究主线。
仿真的三代演进:从物理引擎到世界模型,还远没到终局
清华有一个核心主张:仿真是解决数据不足的关键路径,但仿真本身也还远没有达到终局。
第一代是基于物理引擎的仿真平台,模拟激光雷达、摄像头、毫米波雷达等传感器,清华从2018年开始在这个方向深耕。
第二代是基于3D高斯重建(NeRF/3DGS)的场景重建技术,大幅提升了传感器仿真的真实感。
第三代就是现在大家都在谈的世界模型——可生成式场景,能够覆盖长尾场景,直接为端到端模型生产训练数据。
清华的GOPS强化学习平台从2021年开始持续开发,集成了一系列自研高效算法:DACC、RAD优化器、Lipschitz神经网络、安全强化学习RAX、多模态强化学习DENS、世界模型算法BOOM、感知滤波器Nano,以及面向大模型的STAP等。这些算法的核心目标,都是在算力有限的条件下提升训练性能。
从智驾到机器人:难度跃升5到10倍
清华认为,很多做自动驾驶的人员现在纷纷投身具身智能,这个方向是对的——两者的技术栈高度相通。但难度的差异,被很多人低估了。
从数据规模来看:自动驾驶大约需要1亿片段的数据可以达到入门级,而机器人可能需要10亿甚至百亿量级。从模型规模来看:智驾用1B到10B的参数基本够用,机器人100B才算入门。从训练难度来看:无论监督学习还是强化学习,机器人都有5到10倍于自动驾驶的难度提升。
原因是显而易见的:汽车行驶在结构化道路上,交互对象有限(行人、车辆、路侧设施);机器人要应对任意场景,自由度远高于汽车,目之所及的所有东西都可能是交互对象。
清华的判断:汽车是具身智能的第一步落地,也是通往机器人时代最好的工程训练场。积累的数据飞轮、算法经验和仿真能力,都将成为进入机器人赛道的核心资产。
清华的研究成果与开源工具
清华在演讲中也交出了一张实践成绩单:国内第一个端到端自动驾驶模型由清华完成,全神经网络化,覆盖感知、预测、决策、规划、定位和控制全链路,并于2023年完成实车实验验证。
此外,清华还面向行业开放了自动驾驶仿真软件和强化学习训练软件,希望通过开源方式支持整个行业的发展。GOPS平台整合了主流算法、测试环境和数据集,目标是一站式解决企业的训练难题。
高校的角色:清华在这次演讲里给出了一个清晰的定位——不是做产品,而是提供仿真数据生成能力、高效算法研究、以及开源工具链,帮助整个行业在数据不足和算力有限的条件下走得更远。
读完这篇,你已经拿到了
①一个时代判断:信息智能2028年接近终局,物理智能的10~15年大窗口刚刚打开,这是最重要的历史坐标
②三个真实问题:数据规模、算力支撑、算法效率——清华对国内端到端落地现状的直接追问,以及仿真+强化学习的解题路径
③仿真三代演进:从物理引擎到3DGS到世界模型,清华GOPS平台和一系列高效算法的研究脉络
④智驾到机器人:数据需1亿→百亿、模型需1B→100B、训练难度提升5~10倍,汽车是通往机器人赛道最好的训练场
"物理智能实际上现在刚刚方兴未艾。未来的10年或15年会有大量新技术、新手段、新公司在这个领域涌现。"
— 清华大学 · 2026年百人会论坛
本文根据清华大学李升波在2026年中国电动汽车百人会论坛演讲实录整理,采用Jack的洞察和表达AI skills,力求客观呈现演讲核心信息与行业趋势,给行业带来一些信息和启示,不代表Vehicle立场。
*未经准许严禁转载和摘录-获取本文参考资料方式:加入我们的知识星球可以下载公众号海量参考资料包含以上参考资料。
>>>>相关推荐
2026百人会论坛:卓驭科技|从智驾到物理AI,沈劭劼说这是生存判断不是战略判断
2026 百人会论坛:欧阳明高院士万字长文揭示“十五五”汽车技术终局
智驾定型之战:一文看透自动驾驶“端到端”的底层逻辑与架构演进
揭秘特斯拉 FSD 核心:端到端算法的“三大难点”与“独门解法”以及对语音控车的想法
2026 百人会论坛:华为|自动驾驶元年,L3不可跳过
自动驾驶的下半场,让机器拥有“常识”和“推演能力”的世界模型
154