世界模型

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

大型世界模型(LWM,Large World Model)

大型世界模型(LWM,Large World Model)收起

查看更多
  • 「一脑多形」圆桌:世界模型、空间智能在具身智能出现了哪些具体进展?
    具身智能技术尚未收敛,世界模型和空间智能成为热点。专家们讨论了具身智能的发展现状、技术路线选择、世界模型在自动驾驶和机器人中的应用,以及具身智能的落地应用场景和面临的挑战。
    「一脑多形」圆桌:世界模型、空间智能在具身智能出现了哪些具体进展?
  • 世界模型是让自动驾驶汽车理解世界还是预测未来?
    世界模型在自动驾驶中扮演着重要角色,通过“内部表征+动态预测”机制,帮助系统理解和预测未来,从而做出更合理的决策。它不仅提升了系统的前瞻性和安全性,还能通过模拟极端情况来增强策略的鲁棒性。然而,世界模型并不能完全替代真实的道路测试,并且在处理长尾问题时需要谨慎对待合成数据的质量。总的来说,世界模型是自动驾驶技术的重要组成部分,有助于提升系统的智能化水平。
    世界模型是让自动驾驶汽车理解世界还是预测未来?
  • VLA与世界模型有什么不同?
    自动驾驶行业目前主要分为视觉—语言—动作模型(VLA)和世界模型两大技术路径。VLA通过视觉感知、语言理解和动作输出一体化,实现“看、想、做”的能力,适用于复杂语义场景和人机交互。世界模型则通过构建内部虚拟世界,进行预测和仿真,提高对动态场景的理解和应对能力。两者各有优劣,VLA擅长语义理解与可解释性,而世界模型在预测和仿真方面更具优势。综合运用两者的优点,有望推动自动驾驶技术更加成熟和安全。
    VLA与世界模型有什么不同?
  • 浙江大学研究员彭思达:底层空间感知技术对训练机器人有何作用?
    浙江大学研究员彭思达在GAIR 2025“世界模型”分论坛上分享了其团队在赋予机器人通用空间感知能力方面的多项工作,包括相机定位、深度估计和物体运动估计技术。彭思达介绍了一系列创新方法,如基于Transformer的图像匹配技术MatchAnything,用于相机定位;Pixel-Perfect-Depth解决深度估计中的飞点问题;InfiniDepth提升深度估计精度;以及SpatialTracker实现三维跟踪。这些技术有助于机器人更好地理解环境并做出决策。
    浙江大学研究员彭思达:底层空间感知技术对训练机器人有何作用?
  • 世界模型可以用于人形机器人训练么?
    本文探讨了使用仿真数据训练具身智能机器人的可能性,特别是通过Marble世界模型进行可编辑性测试的结果。虽然Marble在理论上提供了高度可编辑的功能,但在实际应用中发现其生成的内容质量不稳定,难以满足大规模训练的需求,并且编辑成本过高。因此,作者建议利用现有平台批量生成高质量、可控且可编辑的3D场景和资产数据,以提高训练效果。此外,尽管Marble能提供部分视觉数据,但对于动作数据的获取仍依赖于真实的物理交互,需借助仿真引擎模拟物理属性的资产来实现。
    世界模型可以用于人形机器人训练么?