今天理想汽车的Livis Day 上,李想说今天的车和手机其实都不智能,然后甩出了一颗芯片、两个模型和一套"具身智能"的世界观
发布会没有一上来就讲技术,而是先让座舱产品经理把"体验"摆出来。她对交互的定义挺反套路:交互不是屏幕上堆了多少界面、排了多少动效,而是"在这个空间里陪你过每一天的那个人"。她先复了一遍十年的演进线:从十年前那台从未真正上市的 SEV,到理想 ONE 的四屏、L789 的五屏,再到今天全新一代 L9 Livis。
一路下来车里的应用越来越多,而理想想做的是"在越来越多里找到越来越懂"。设计哲学两个词——克制(回到第一性原理,不加一个多余的东西)和直白(不渲染、不炫技,不管你什么年龄,看一眼就懂、点一下就有响应),最终要的是松弛、信任、像朋友一样在身边的感觉。
最直观的变化是那块去掉了黑色分割线的 29 英寸 6K 一体式超宽全景屏(屏占比 92.4%、1000nit)。他说试过主流 16:9、试过中等宽幅、也试过更高尺寸,要么仓促、要么对副驾不友好、要么侵占驾驶视线,最后才定在这个全景宽幅比例。
然后是硬件的"赛跑史",这段挺实在:理想 ONE 时代的车规芯片 820A 落后主流手机整整两年,到 8155、8295 时代追平手机主流水平(用户在小红书抖音上把它叫"车里的 Apple"),而这一代他直接放话——座舱硬件性能已经超越主流手机。
用的是全球首发的高通骁龙 8797 Elite 平台,NPU 320 TOPS 跑端侧实时 AI 模型;并且是行业第一个在全景屏上做到90Hz 高刷 + 180Hz 触控采样,自研底层系统压低触控时延。
她特意解释了为什么难:这块屏背后连着好几块屏,对带宽要求极高——L9 Livis 前排显示带宽 23.5G,而 iPhone 17 Air 才 7G,链路也长得多,最后要做到"热刀切黄油"般顺滑。
软件交互讲了两个关键词。
更广阔:打开地图是 16 寸级别的全景地图,EID 环境感知也更舒展,复杂路况下视野不再被局促的小窗框住,看视频则是影院级铺开。
更细腻:页面打开、按钮开闭、菜单滑动、控件回弹都连贯流畅,还有实时动态渲染的高斯模糊,以及光会随唤醒位置变化、与氛围灯联动的处理。
现场两位同事演示了一个人和两个人怎么用这块屏——驾驶员显示宽度是过去双联屏的 1.5 倍,泊车时 EID 自动放大、其他应用自适应缩小,三指一滑进入只剩跟随驾驶和流动光感的"放空空间";副驾上人后可以一键撑大成主副驾 1:1 分屏,一起看电影时主驾内容消失、视频宽度是双联屏的 1.7 倍,配前排零重力。他还强调全景屏的设计品味本身就是内饰的一部分——黑胶唱片般的分面流、星云环绕的放空桌面、山野潮汐日出般的氛围。
声音是这代另一个重点。他给的数据是用户 78% 的旅程都有音乐陪伴,所以上了全新的9.3.6 无瑕星环剧院音响(峰值 5440W、全车 28 个扬声器),九组水平环绕 + 三个矩阵低音炮 + 六组天空环绕,行业首创前排 5.2.2、后排 7.1.4 的双音区布局,前后排能同时播放全景声,系统级支持 96k 高采样,连 QQ 音乐、网易云的高级会员都不白花;下半年还会和合作伙伴在声音质感上继续升级。
单独点名的是Livis Pods 头枕音响——背靠背/水平对置扬声器叠加自研空间音频算法,声音不从脑后压过来,还抵消了头枕震动,配口碑很好的软枕,是展厅必打卡体验。
手机生态上,这次支持了"同级最大、最流畅的 CarPlay",还和车机硬件深度融合(HUD 联动显示地图、方向盘可控),Apple Music 用户配杜比全景声体验更佳,主流旗舰手机互联全支持。
他借此收尾——十年里理想坚持不用安卓公版应用,每个应用都做系统级适配,不为应用数量牺牲流畅度,也照顾到副驾、二排和第三排的每一个人。而这一整段细腻到极致的体验,恰恰是为了下一句反转作铺垫。
1. 一个反共识判断:今天的"智能"都不智能
李想话锋一转,抛了个挺扎人的判断:今天我们嘴上叫了十几年的"智能手机""智能汽车",其实都不智能。
他的逻辑是:行业公认的"智能"三件套——软件定义硬件、实时联网、可持续升级——只能算"功能驱动",本质还是一堆被调用的功能,不是一个有生命力的智能体。
他用智能汽车最要命的三个维度来拆这件事:安全上,传统智驾遇到没见过的复杂场景、极端天气,标准动作是直接退出、把方向盘丢给你——法规上完全合规,但对人恰恰最不安全,因为接近一半的智驾事故就发生在接管那一瞬间。
能力上,今天的智驾只会"向前开、左转、右转"这种预设功能,倒车倒不利索、不会像老司机那样找地方靠边停。效率上,越是赶时间、越是胡同窄路,大家越不敢用智驾,因为它比人慢。
所以他给"真正的智能"重新下了定义:要以保护人为核心,要学会人类的技能并独立完成任务,还要比人更高效。这套判断他认为同样适用于人形机器人和未来一切具身智能产品。
结论是——光修修补补不够,必须围绕"具身智能"重构整个系统。然后理想从三个维度交答案:能力(模型)、芯片、产品。这是整场发布会真正的主轴。
2. 能力:淘汰 MindGPT,端云两个新模型 + 马赫 VLA
基座模型负责人詹锟先生先讲"大脑"。
他把人脑类比成几个分区并行:语言逻辑、思考、听懂指令算"语言智能",三维视觉感知和躯体动作控制算"机器智能",两者必须焊死融合才是完整可用的具身智能大脑(他还特意点了一句,主管恐惧和情绪的那块脑区,他们故意不要)。
语言这边,理想直接把大家熟悉的 MindGPT 当"热身"淘汰了,推出全新基座大模型马赫 Mind-4 系列。云端是马赫 Mind-Pro,定位原生 Agent 模型,官方说在 IFEval 指令跟随、LongBench-v2 超长文本、AIME26 高阶数学、BFCL-v4 工具调用等公认基准上全部稳居第一梯队,在 Agent 专项榜单和实景实测里综合超过多数主流模型;更实在的是工程指标——官方称 token 平均消耗降 38%、工具调用冗余轮次降 47%、峰值 208 tokens/s、推理效率是主流 Agent 模型的两倍以上,背后是数百套业务沙箱 + 自研的混合 RL 训练体系。
端侧是马赫 Mind-Edge,多模态流式时序建模、always-on、全程在车端本地跑、数据不上传,强调"不是云端模型的阉割版,而是原生为车载场景做的端侧智能体模型"。
机器智能(也就是智驾)这段,詹锟在发布会上真诚的示弱。他说从美国回来的朋友都给他发同一句话——除了特斯拉,国内没有自驾第一梯队;他上个月亲自去硅谷把 FSD v14.3 连开两周,回来只剩两句话:特斯拉真的太强,压力真的太大。
然后讲马赫 VLA 的三点升级:更安全——官方称截至 6 月 14 日,理想全系智驾主动避险累计 1727 万次,其中重大避险 5.5 万次,相当于 2022 年至今平均每天主动避险约 1.2 万次。更高效——普通人发现危险到刹车平均要 0.45 秒,F1 车手极限 0.25 秒,马赫 VLA 的反应是 0.28 秒,逼近人类生理极限;这多出来的零点几秒,在 120km/h 下相当于提前约 6 米完成刹停。这背后是一条从"光子到车轮"的全链路重构:官方给的拆解是视觉输入时延降 47%、模型推理链路缩短 43%、线控底盘响应降 38%、OS 调度降 28%、端到端总时延降 40%。
更强大——施工区绕锥桶、挖掘机爪臂伸出来减速、空间不够主动切倒挡礼让、看懂穿黄马甲保安的手势、广州雨夜城中村窄路里腾挪……这些"像人一样"的能力。
能力从哪来?
他给了三个变量:双马赫 M100 车端算力 2560 TOPS,模仿学习数据再 +50%、强化学习数据 +15 倍,模型参数 +10 倍、每秒 token 计算量 +15 倍。
架构上把感知、预测、规划这种各玩各的模块化结构,统一成一个原生多模态 MoE 大模型,让"看见—理解—思考—行动"从一开始就在同一个框架里对齐;并喊出马赫 VLA → 马赫 World Model → RL Info 三维一体。
他还专门怼了一句行业卷激光雷达线数:128 线、256 线、512 线再高,也读不懂红绿灯颜色、看不懂路牌文字、认不出保安手势——所以理想用 3D ViT 让系统"从看见到看懂",可视距离提升 50%。
3. 芯片:马赫 M100,全球首款数据流 AI 芯片
CTO 谢炎讲芯片这段是发布会信息密度最高的部分。他先回顾了摩尔定律和登纳德缩放定律双重红利消失、冯·诺依曼架构统治七十年的代价(指令队列掩盖了并行度,海量晶体管被浪费在调度而非真实计算上),然后给出理想的选择:数据流架构——拆掉中央式指令队列,让数据流动来驱动计算。
这个架构其实是 MIT 几位教授在上世纪 70 年代就提出的,谢炎读研时接触到,过去没能大规模商用,是因为它的优势要算力规模足够大才显现、编程调试也更难,而 AI 计算恰好把这些前提凑齐了。
马赫 M100的硬指标:5nm 车规工艺,单颗算力 1280 TOPS,实际运行效率超过 82%(这个利用率比一般 GPU 高很多);一半以上晶圆面积给了 NPU,官方称由 56 个计算单元配数据处理模块组成,网格总线 + 数据环形总线双互联;CPU 是 24 核 Arm A78AE@2.3GHz 负责安全和系统控制;8 路 LPDDR5X、273GB/s 带宽。
对比口径很激进:在核心模型上有效算力是英伟达 Thor-U 的 3 倍、且是数倍而非略微领先;甚至在 M100 上部署 Qwen3.5-35B 通用大模型,跟一台约 4 万元的 DGX Spark 桌面超算比,官方称 prefill 速度 2.7 倍、decode 速度 1.5 倍。
学术背书是架构论文《M100: An Orchestrated Dataflow Architecture Powering General AI Computing》入选 ISCA 2026 工业分区——理想称自己是汽车行业历史上第一家,团队将于 6 月 30 日在会议现场分享。
另外,谢炎表示这款芯片不仅仅只能用于汽车,更多是智能AI的应用。光有芯片不够,理想在 M100 之上做了星环 OS,强调它从第一天就是 AI 原生,感知决策执行全链路融合,配合全线控底盘把端到端延时压到 0.28 秒、比人快 40%。
安全这块谢炎类比苹果:苹果安全是因为芯片和系统一起设计、从上电那一刻就开始;车的芯片被攻击威胁的是生命,所以理想把密钥保护、可信启动链、权限管控全部前置到芯片设计里,做芯片、编译器、操作系统、AI 算法、预控制器的全栈自研。
4. 产品:一辆车 = 四样东西
最后李想自己上场讲产品。他说很多人问"具身智能到底是机器人还是 AI 还是智驾",他认为这些都只是能力、不是产品。他重新定义这辆车是四样东西:一辆电动车(具身智能要有身体、能移动、能抵达)、一位职业司机(不是辅助驾驶,理解道路风险规则、独立完成出行)、一台 AI 计算机(算力强过旗舰手机电脑、内存显存一体、为大模型而生)、一位生活助手(你说任务它来做、懂你习惯)。而这四样合起来不是四个产品,是一个产品——就是理想汽车。
现场两位产品经理做了一串 Livis Agent 实测(声明是真在模型上跑、不是预设脚本):从"关车窗、氛围灯调橙、空调 18 度"这种规则指令,到"朋友坐 CA1314 来北京、素食、去望京安排接风宴、规划路线",到"燕京八景一日游"(Agent 自己发现其中两个景点已不开放,主动剔除),再到"厂长"乱序接四个孩子和老婆、最后给老四在三里屯过生日这种超复杂多点任务(中途还现场翻车重来了一次,挺真实)。
车控层面演示了哄二排小孩睡觉(自动降音量、放摇篮曲、调柔风、暗灯光),以及激光雷达被遮挡时车辆自己靠边停并跟车主沟通、自主去新国展找超充充电(全程车主只说一句话)、窄位自己掉头还跟对向车"礼貌沟通"。
5. 接下来的 OTA 节奏
李想说今年下半年版本很多,但有三个最重要的节点:7 月:智驾效率整体提升 30%,限宽墩、限高杆这类场景哪怕纯新手也能安全通过;现场演示的出行/导游类 Agent 技能上线;方便组队出游的"车友对讲机"功能上线(比微信还方便、不用额外带设备);"两天一度电"的哨兵模式上线;利用主动悬架的便捷换胎能力也在 7 月见面。
9 月:学会像人一样全面倒车,窄路会车、倒车让行都能替你解决;用主动悬架处理各种复杂路面;能操纵家里的智能地锁、开车库门;Agent 可以连接你的电脑和手机,去调用飞书、微信上的信息;带鱼屏的超级 CarPlay 上线,以及音乐爱好者期盼的无损音质 Apple Music。
12 月:让安全和效率全面超越人类——车主自己误碰方向盘退出、或避险打方向角度不够时,Livis 会像专业赛车手一样接管找到最安全轨迹;遇到交警疏导交通能听从指挥有序通行;走近车辆时通过非人脸 ID 自动切换账号、坐下即同步驾驶设置;并继续释放 M100 潜力,把反应速度提到 0.2 秒、官方称比人快 56%、超过 F1 车手。
另外智驾大模型本身的演进路线:第三季度向 AD Max 用户推送全新的马赫 VLA 版本,第四季度整体能力对齐特斯拉 FSD V14。
可以看出节奏很清楚:7 月解决"高频但尴尬"的场景痛点,9 月把 Agent 从车机延伸到"控车 + 连外部设备",12 月才是真正喊出"超越人类"那张牌。
6. 从业者视角:怎么看这场发布会
值得认的地方。
第一,这是国内少有的、把芯片—编译器—操作系统—模型—预控制器全栈自研拉通的车企,"模型-芯片同步研发"和苹果式垂直整合是一个路数。谢炎自己也是拿苹果打比方——操作系统告诉芯片该怎么设计、芯片反过来给系统提供外购方案给不了的差异化能力,长期看这是真护城河。
第二,数据流架构如果真能在量产上兑现 82% 利用率,那它挑战的是英伟达的 GPU 范式本身,意义比单纯多几个 TOPS 大得多——能进 ISCA 工业分区,说明这至少不是纯营销话术。
第三,"具身智能"这个叙事其实很高明:它把座舱交互、智驾、车载 Agent 三条原本各卷各的线,统一进"安全/能力/效率三维升维"的同一个框架,比友商单点卷激光雷达线数、卷屏幕尺寸要高一个维度;端侧原生大模型 + Agent 真控车,这个差异化方向是华为、小鹏、特斯拉目前路线里都没完全押注的。
但要泼几盆冷水。
一是别被算力数字带跑——这一点理想自己其实最清醒:谢炎团队那篇入选 ISCA 的论文刻意没写 TOPS,理由是到了 VLA / World Model 时代,纯 AI 矩阵算力意义有限,标量和矢量算力才更关键。换句话说,发布会上喊的 1280、2560 更多是给大众听的"标称值",真正决定体验的是有效算力和架构效率。更要紧的考验在量产端——自研芯片的良率、产能、单车成本、铺货规模,这些发布会上不会讲,却是决定这套全栈能不能跑起来的命门。
二是"Q4 对齐 FSD V14"是个极高的承诺,李想自己都说压力大,特斯拉也不是站着不动的靶子,对齐的兑现度需要时间验证,而不是发布会上说了就算数;
三是 1727 万次主动避险是漂亮的自证数据,但缺第三方统一口径;"比人快"在长尾极端场景下的稳健性才是真考题。
四是现场那些超复杂 Agent 演示(乱序接四个孩子、燕京八景)确实惊艳,但它演示的是能力边界,和用户日常高频刚需之间还有距离——而且飞书、微信、CarPlay、Apple Music 这些生态能力高度依赖第三方开放程度,理想能掌控的只有自己那一半。
往大了看,这场发布会真正的信号是:行业正在从"软件定义汽车"切换到"AI 定义汽车",而理想想抢的是范式定义权——既给地平线、英伟达、高通这些供应链施了压,也把车企自研芯片的军备竞赛又往上抬了一格。
写在最后
李想这场发布会最后一句话留得很克制:理想坚持做最好的自己,不要期望我们变成别人。配上他那套"过去十年造了一个移动的家,下一个十年要给车赋予生命"的叙事,野心其实写在脸上——他不只想造一辆更聪明的车,他想重新定义"车"这个物种。
至于这套"具身智能"是真范式跃迁,还是又一次领先半步的概念营销,答案不在发布会的掌声里,而在 7 月、9 月、12 月那三次 OTA 推送,以及马赫 M100 真正大规模上车之后,用户在胡同里、雨夜里、接管那一瞬间的真实体感里。
*未经准许严禁转载和摘录-获取本文参考资料方式:加入我们的知识星球可以下载公众号海量参考资料包含以上参考资料。
216
