4月19日,全球首个人形机器人马拉松——2026北京亦庄半程马拉松暨人形机器人半程马拉松鸣枪开跑。超百支人形机器人赛队与1.2万名人类跑者同场竞技,完成21.0975公里赛程。最终,荣耀“闪电”机器人以50分26秒夺冠,成绩超越人类半马世界纪录。
争议随之而来。
从去年开始,让机器人跑半马这件事就伴随着一个灵魂问题:它有什么意义?
很多人认为,这依然是机器人行业的概念炒作和作秀,远没有真正进入工厂场景来的有实际意义。
但中科育成投资认为,让机器人跑半马,有意义,只是普遍说表面了。
一、大家都在说的表面意义——对,但不够
大多数报道会告诉你:这是测试稳定性、续航、运动控制能力。这些都对,但都停留在表层。
“测试机器人在长时、长距下的可靠性”这话没错。但问题是:为什么必须是半马?如果只是为了测试可靠性,完全可以在实验室里让机器人在跑步机上跑42公里——更可控、更省钱、数据更干净。
所以半马一定提供了实验室给不了的东西。
二、很少人说的真实意义:测试的是人机系统的工程化能力
半马测试的不是机器人,而是[人机系统的工程化能力]。
这才是关键。
实验室里,机器人跑断了腿,工程师可以随时停下来换零件、调参数、重启系统。但赛道上不行。
半马的真实赛制是:
工程师必须在机器人附近跟着;
可以干预,但干预会损失时间;
换电池、修故障、扶起摔倒,都计入综合时间成本。
这恰恰模拟了商业场景中最真实的情况:
你不是在测试机器人能不能完全自主,而是在测试[一个工程团队+一台机器人]这个组合系统的现场响应能力、故障恢复速度、工程化成熟度。
这跟工厂里部署机器人完全一样:
会有故障;
需要工程师介入;
介入的时间就是停机损失。
谁的系统需要介入的次数更少、介入后恢复更快,谁就更有商业价值。
半马的本质,是一场故障压力测试,而不是运动能力测试。
三、更深层的意义:倒逼行业建立公共Benchmark
半马正在做一件更重要的事:倒逼行业建立人形机器人的性能度量标准。
你知道现在人形机器人行业最缺什么吗?可对比的、可复现的、有公信力的benchmark(基准测试)。
自动驾驶有Nuro、Waymo的MPI(接管里程);
四足机器人有 locomotion benchmarks;
工业机械臂有循环时间、重复定位精度。
但人形机器人呢?每个团队都在用自己的数据集、自己的测试环境、自己的“成功定义”。
半马,可能是目前唯一一个“所有团队在同一环境、同一规则、同一评判标准下”的公开测试。
这不完美,甚至很粗糙,但它是一个起点。
更深远的意义在于:当半马持续办下去,它会倒逼行业共识的形成。
明年会不会增加负重跑?(测试负载能力)
后年会不会增加障碍物避让?(测试非结构化地形)
再后年会不会增加中途操作任务?(测试移动+操作融合)
如果真能这样演化,半马就会成为人形机器人行业的“ImageNet时刻”,在一个公共的竞技场,让所有算法、所有硬件、所有系统架构,在同一把尺子下被衡量。
作为VC,我们最该关注的是这一点。
不是因为现在的半马有多科学,而是因为任何行业从混沌走向成熟,都必须经历“建立公共度量标准”这一步。
四、附加意义:降低行业认知门槛
对舆论和资本来说,机器人半马的开展可以在很大程度上降低理解成本。
自动驾驶、大模型都有很直观的对比指标,而且在生活和工作中已经能够使用和接触到。
但人形机器人对大众、对非技术投资人来说非常抽象。
半马是一个所有人都能看懂的故事:能跑完半马 ,证明这机器人的基础稳定性还是在线的。
这是降低行业认知门槛的绝佳载体。
五、半马测不到的东西:盲区同样重要
必须承认,半马不是万能的,它至少有三个明显的盲区:
移动≠操作
半马主要测试动态行走/奔跑能力。但人形机器人的核心价值在于移动+操作+感知的融合。一个能跑完半马的机器人,可能依然无法完成拧螺丝、抓取不规则物体、在狭窄空间转身等任务。
稳定性≠商业化
人形机器人的商业化还需要考虑成本(几十万 vs 轮式底盘几千块)、续航(换电池次数)、负载能力(工厂需要搬重物)、安全性(与人协作时的碰撞力控制)等。半马未直接测试这些。
规则环境 vs 真实环境
赛道是相对规则的路面,而真实场景有碎石、草地、楼梯、沙地、狭窄通道……半马只是第一关。
所以,半马是必要不充分条件——跑不好一定不行,跑得好也不代表行。
一个延伸的判断
如果你问:半马这件事值不值得继续做?
我们的答案是:值得,但必须进化。
从[纯跑步],到[跑步 + 中途抓取任务],到[跑步 + 避障 + 负载 + 抓取],再到[完全非结构化赛道(碎石、草地、楼梯、沙地)]……
如果赛事主办方有这个进化意识,半马可能会成为中国人在人形机器人领域定义的全球标准。
如果没有,它就只是一场每年一次的科技秀。
你觉得它会走向哪一边?
欢迎在评论区留下你的看法。
267