都知道人形机器人真机数据贵,但没想到贵到这么离谱。
要支撑一个机器人模型的训练,且能够谈得上具备泛化能力的模型,如果采用的全部是真机数据,建设数据采集工厂和运营成本,大概得数十亿元(人民币&美金)以上的资金投入。
如果再考虑场景的泛化性、跨本体能力,那数据量需求和资金成本就更不可想象了。
数十亿人民币和数十亿美金,是中国和美国的差异,从这个角度看,人民币和美金的购买力平权了。
怪不得几乎所有的人形机器人公司,都在疯狂融资,疯狂在各地建设机器人数据采集基地,不亚于当年图像识别和大语言模型时代的数据标注工厂流水线。
人形机器人行业,已经从算力和数据集上的大力出奇迹,演进到了资金投入上的大力出奇迹。从这个规模的投资体量上看,数据仿真将是一个迫不得已的选择,9条仿真数据+1条真机数据,可能是最具性价比的选择。
后面地方招商可以考虑一下仿真数据基地的建设,至少可以带来算力建设投资,并解决算力消纳问题,而且如果采用光轮智能的“人工操作+仿真环境”的模式,也能大大带动就业……
至于为什么大部分机器人公司舍近求远,不用仿真数据数据,而是砸重金去做真机数据采集?主要是因为目前还没有厂商真正解决Sim2Real Gap问题,而且也没有形成仿真数据的产业生态。说直白点,能把仿真数据用好还是有一定壁垒的。
以下为几个数据支撑,仅供参考:
银河通用机器人王鹤:一台人形机器人制造成本最少10万,买1万台用于数据采集,意味着10个亿。每台两班倒雇人遥操需要4个人,一个月可能就是小几万。此外还需要标注和质检,每个月维护1万台机器人的成本在数亿到十亿。
——数据来源:张小珺商业访谈
RAYAN MALIK:每台机器人的资本支出(CAPEX)为10万美金(5000台机器人总支出为5.5亿美金,另加10%的备份成本);年度维护费用为资本支出的20%(即每年1.1亿美金);人工监督运营成本(每10台机器人配备1名全职人员,含工程师与安全人员)约为每年1.5亿美金;场地与安全合规成本约为每年3000万美金;机器人本体计算成本约为每年800万美金;每台机器人每天2小时数据的存储成本约为每年2500万美金。基于这些粗略假设,总成本约为20亿美金。
——数据来源:《Scaling to a Trillion Tokens,Building a GPT for robotics》https://rayansmalik.substack.com/p/scaling-to-a-trillion-tokens-in-robotics
————
创道硬科技,专注于科技领域投融资服务,为创业企业、投资机构、科技服务机构和政府产业园提供如下服务:
1)科技融资服务:FA融资顾问、企业融资优化咨询。
2)公司治理&管理:股权激励架构设计和搭建。
3)培训&媒体&活动:硬科技行业主题交流会、硬科技新势力创业访谈。
业务联系:riseen001
233