扫码加入

世界模型

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

大型世界模型(LWM,Large World Model)

大型世界模型(LWM,Large World Model)收起

查看更多
  • 张江AI小镇蚂蚁灵波:4天发布四款模型!
    蚂蚁灵波科技连续开源四款具身智能模型,包括LingBot-Depth、LingBot-VLA、LingBot-World和LingBot-VA,显著提升具身智能在物理世界的应用能力,推动具身智能技术的发展。这些模型解决了具身智能模型泛化能力和部署效率的问题,为机器人在实际应用中提供了更强的自主决策和行动能力。
    444
    02/04 08:26
  • 特斯拉世界模型专利全解读:从“看见”到“想象”,Physical AI 的进化奇点
    特斯拉发布的一项专利揭示了其世界模型的核心技术,这是一种“数字孪生+平行宇宙”生成系统,旨在通过基于地面实况的3D模型和启发式规则生成虚拟驾驶场景,用于AI训练。该系统不仅打破了现实局限,还创造了大量边缘场景,并通过分块并行处理提高计算效率。未来,这种技术有望推动自动驾驶等Physical AI从被动学习向主动进化发展,增强其对物理世界的理解和适应能力。
    1821
    01/26 11:08
    特斯拉世界模型专利全解读:从“看见”到“想象”,Physical AI 的进化奇点
  • 轻舟的VLA与世界模型架构解读
    理想汽车推出搭载128 TOPs J6M和激光雷达的AD Pro,支持城区NOA的OTA,并由轻舟智航提供算法技术支持。轻舟展示了其融合VLA与World Model的下一代自动驾驶模型架构,该架构通过端到端的方式整合感知、理解和决策模块,实现了更智能的驾驶体验。
    763
    01/26 11:00
    轻舟的VLA与世界模型架构解读
  • VLA和世界模型在自动驾驶中可以融合吗?
    随着VLA(视觉-语言-动作模型)与世界模型在自动驾驶领域的关注度提升,这两项技术成为主机厂研发布局的重点。VLA通过统一模型框架整合感知、推理和动作生成,而世界模型则在系统内部构建动态模拟与未来预测能力。尽管两者侧重点不同,但融合可以提升自动驾驶系统的整体性能,增强环境理解和预测能力。然而,融合面临训练资源需求高、模型结构复杂和实时性挑战等问题。总体而言,融合VLA与世界模型有助于自动驾驶系统迈向更高可靠性和智能化水平。
    VLA和世界模型在自动驾驶中可以融合吗?
  • 对话高德飞行街景产品经理:全球第一个“飞行探店”是怎么做出来的?
    高德扫街榜推出“飞行街景”功能,利用前沿AI技术,让用户在出发前即可通过俯瞰和沉浸式视角了解店铺真实环境,解决用户决策链路上的信息不足问题。该功能旨在增强用户对店铺的信任和满意度,推动商家订单量显著增长。
    502
    01/09 10:24
    对话高德飞行街景产品经理:全球第一个“飞行探店”是怎么做出来的?
  • CES2026英伟达演讲对汽车产业的影响
    英伟达CEO黄仁勋在CES2026上强调AI已成为全球数字基础设施,通过开源AI平台构建跨行业生态,尤其是汽车领域的物理AI技术突破,成为量产新时代的核心标杆。NVIDIA推出的游戏基因驱动的Cosmos世界模型,通过开源生态打破数据孤岛和技术壁垒,助力汽车智能化转型。此外,全新Vera Rubin架构提升了GPU性能,降低单位算力成本,为大规模AI训练和推理提供经济性解决方案。
    CES2026英伟达演讲对汽车产业的影响
  • 吕廷杰:具身智能的飞跃必须突破“大脑智能”瓶颈
    具身智能发展正处于“婴幼儿时期”,核心依赖于“小脑智能”的成熟与“大脑智能”的缺失。随着空间智能、世界模型与5G、6G技术的协同,有望重塑万物互联的底层逻辑,推动智能体互联迈向新阶段。
    吕廷杰:具身智能的飞跃必须突破“大脑智能”瓶颈
  • 自动驾驶中常提的世界模型是什么?
    世界模型是自动驾驶系统内部用于表示外部世界并预测未来演变的一组模型或表征。它通过整合传感器数据,形成车辆能够理解和推演未来的内部信息,并进行多步未来预测,作为规划器的输入,提高系统的前瞻性和安全性。世界模型的应用有助于提升自动驾驶的性能,减少对昂贵传感器和高精地图的依赖,从而带来更安心的出行体验。
    自动驾驶中常提的世界模型是什么?
  • 「一脑多形」圆桌:世界模型、空间智能在具身智能出现了哪些具体进展?
    具身智能技术尚未收敛,世界模型和空间智能成为热点。专家们讨论了具身智能的发展现状、技术路线选择、世界模型在自动驾驶和机器人中的应用,以及具身智能的落地应用场景和面临的挑战。
    「一脑多形」圆桌:世界模型、空间智能在具身智能出现了哪些具体进展?
  • 世界模型是让自动驾驶汽车理解世界还是预测未来?
    世界模型在自动驾驶中扮演着重要角色,通过“内部表征+动态预测”机制,帮助系统理解和预测未来,从而做出更合理的决策。它不仅提升了系统的前瞻性和安全性,还能通过模拟极端情况来增强策略的鲁棒性。然而,世界模型并不能完全替代真实的道路测试,并且在处理长尾问题时需要谨慎对待合成数据的质量。总的来说,世界模型是自动驾驶技术的重要组成部分,有助于提升系统的智能化水平。
    世界模型是让自动驾驶汽车理解世界还是预测未来?
  • VLA与世界模型有什么不同?
    自动驾驶行业目前主要分为视觉—语言—动作模型(VLA)和世界模型两大技术路径。VLA通过视觉感知、语言理解和动作输出一体化,实现“看、想、做”的能力,适用于复杂语义场景和人机交互。世界模型则通过构建内部虚拟世界,进行预测和仿真,提高对动态场景的理解和应对能力。两者各有优劣,VLA擅长语义理解与可解释性,而世界模型在预测和仿真方面更具优势。综合运用两者的优点,有望推动自动驾驶技术更加成熟和安全。
    VLA与世界模型有什么不同?
  • 浙江大学研究员彭思达:底层空间感知技术对训练机器人有何作用?
    浙江大学研究员彭思达在GAIR 2025“世界模型”分论坛上分享了其团队在赋予机器人通用空间感知能力方面的多项工作,包括相机定位、深度估计和物体运动估计技术。彭思达介绍了一系列创新方法,如基于Transformer的图像匹配技术MatchAnything,用于相机定位;Pixel-Perfect-Depth解决深度估计中的飞点问题;InfiniDepth提升深度估计精度;以及SpatialTracker实现三维跟踪。这些技术有助于机器人更好地理解环境并做出决策。
    浙江大学研究员彭思达:底层空间感知技术对训练机器人有何作用?
  • 世界模型可以用于人形机器人训练么?
    本文探讨了使用仿真数据训练具身智能机器人的可能性,特别是通过Marble世界模型进行可编辑性测试的结果。虽然Marble在理论上提供了高度可编辑的功能,但在实际应用中发现其生成的内容质量不稳定,难以满足大规模训练的需求,并且编辑成本过高。因此,作者建议利用现有平台批量生成高质量、可控且可编辑的3D场景和资产数据,以提高训练效果。此外,尽管Marble能提供部分视觉数据,但对于动作数据的获取仍依赖于真实的物理交互,需借助仿真引擎模拟物理属性的资产来实现。
    世界模型可以用于人形机器人训练么?
  • ICCV涌现自动驾驶新范式:统一世界模型VLA,用训练闭环迈向L4
    理想汽车在ICCV 2025上展示了其从数据闭环迈向训练闭环的策略,强调了世界模型的重要性及其在自动驾驶领域的应用。通过构建云端世界模型,理想实现了训练闭环,增强了车端VLA模型的性能。此外,理想还开源了自己的星环OS,促进了汽车行业的发展。
    1168
    2025/11/10
    ICCV涌现自动驾驶新范式:统一世界模型VLA,用训练闭环迈向L4
  • VLA和世界模型,谁才是自动驾驶的最优解?
    自动驾驶技术的发展呈现两种主要路径:VLA(视觉—语言—行动)模型和世界模型。VLA通过视觉感知、语言理解和动作生成串联起来,利用语言模型进行高级推理,适用于复杂场景的理解和决策,但面临物理精度和安全约束的挑战。世界模型则强调空间认知与物理推演,通过仿真环境训练模型,具有出色可控性和物理一致性,但仿真与现实的差距难以完全消除,且对高精度传感器依赖较大。两者各有优劣,未来有望深度融合,共同推动自动驾驶技术的进步。
    VLA和世界模型,谁才是自动驾驶的最优解?
  • 自动驾驶上常提的VLA与世界模型有什么区别?
    VLA通过视觉、语言和动作的结合,实现从感知到决策再到动作的闭环,具有解释性和语义理解的优势;世界模型则侧重于动力学预测和未来状态模拟,适用于安全验证和策略评估。两者各有优劣,在自动驾驶领域应综合运用,确保系统的功能性和安全性。
    自动驾驶上常提的VLA与世界模型有什么区别?
  • Waymo自动驾驶最新探索实践:世界模型、长尾问题、最重要的东西
    Waymo提出了一种大规模AI模型架构,称为“基础模型”,它整合多种传感器数据,用于感知和行为任务。为了应对复杂的驾驶场景,Waymo采用了VLM技术处理大量语料库,并通过多模态融合提高精度。此外,Waymo强调数据筛选和整理的重要性,认为高效的高质量数据是确保模型性能的基础。在实际应用中,快速响应决策是关键,Waymo认为 Depots运营停车场和改装工厂对其业务至关重要。尽管Waymo在算法和开发方面取得了进展,但在工程落地和量产运营方面仍有待加强。
    2030
    2025/10/05
    Waymo自动驾驶最新探索实践:世界模型、长尾问题、最重要的东西
  • 分析丨智驾两大核心路线“贴脸开大”,车企如何“二选一”?
    智能驾驶技术路线之争揭开序幕,主要围绕VLA和WA两种方案展开。VLA通过视觉-语言-动作中间层实现可解释性和长时序推理,适合中小车企低成本快速迭代;WA构建数字孪生世界,强调理解和模拟现实,更适合大型企业长期投资。理想、小鹏等公司利用VLA实现快速落地,而华为和蔚来则押注WA,试图建立技术壁垒。2025年将成为智驾路线的关键转折点,VLA进入量产阶段,WA开始初步应用,行业竞争加剧,中小车企面临巨大压力。
    分析丨智驾两大核心路线“贴脸开大”,车企如何“二选一”?
  • 端到端自动驾驶的前世今生:不管VLA还是WM世界模型,都需要世界引擎
    香港大学Li Hongyang在CVPR自动驾驶Workshop上发表了关于端到端自动驾驶的开场演讲,定义了端到端自动驾驶,并回顾了其发展历史。演讲中提到,端到端自动驾驶正面临数据收集和极端情况模拟的挑战,为此提出“世界引擎”概念,通过从人类专家驾驶中学习,生成有价值的数据用于训练和改进端到端算法,以应对生产环境中的复杂情况。
    端到端自动驾驶的前世今生:不管VLA还是WM世界模型,都需要世界引擎
  • VLA与世界模型,会让自动驾驶汽车走多远?
    自动驾驶技术正朝着“理解和推理”的能力迈进,通过VLA(视觉—语言—动作模型)和世界模型实现从“会看”到“会想”的转变。VLA利用多模态大模型优势,将视觉、点云、地图等信息编码进统一语义空间,并通过语言模型进行逻辑推理和决策。世界模型则提供虚拟环境,增强数据多样性,加速模型训练。尽管面临三维特征表达、长时推理和算力限制等挑战,但随着技术进步,自动驾驶有望成为更加智能、可靠的驾驶智能体。
    VLA与世界模型,会让自动驾驶汽车走多远?

正在努力加载...