人形机器人现在阶段最大的痛点是什么?
人形机器人看这篇我的深度采访就可以了。
人形机器人,现在能帮你做家务了么?人形机器人,现在五月份,还是老样子……搞不定最重要的模型问题。
啥意思呢,就是可以训练它端茶倒水了,但我现在水杯在抽屉(A),饮水机在另一个地方(B),我在C点。没办法跟他说一句话:帮我倒杯水过来……然后机器人自己把水杯找到拿出来,然后去饮水机倒水,再给我。
又或者我现在有一床凌乱的被子,我让机器人帮我叠,机器人搞不定。
现在的机器人,能做到什么程度呢?
我固定的床铺,固定的被子和大小,我给它训练过后,帮我叠好。
这里的区别是什么呢,就是现在,人工智能是否有真正的“智能”,还是伪智能,实际上只是一个概率的算法。
所以现在的机器人,更适合在规定场景中作业,比如固定的农场大棚,固定的巡线检查。要说那种能和人交互的,暂时很难做到,最多也就是扫地机器人那样的水准。
泛化能力和思考延迟,是最大的硬伤。
现在特斯拉在做的就是世界模型的数据采集。这个东西我们讲通俗点,比如看到一个锤子,我豆包识图,那么会有一个思考的迟滞让我知道这是个锤子……这是有延迟的,接着我要把这个锤子拿起来……那拿起来需要多少力量,施加在锤柄上又需要多大力量,这些都很复杂需要预训练。如果世间万物的大概数据储存在一个机器人的大脑里,那么对数据的要求是极为庞大的。如果这些数据储存在云端,那么即使token免费,也有高延迟的问题。
所以说,泛化性差的问题是VLA(语言视觉动作)解决不了或者暂时很难解决的。今年以前,机器人的解决方案还是基于llm的vla模型(视觉→语言→动作)。
但是曙光初现。

这篇文章,讲了之后我们要用WAM,世界动作模型来训练机器人,因为我们人类的实际行为,是先预测再有动作最后达到同步的,机器人也需要这样。另外讲了怎么通过第一人称视频来学习理解动作和真实世界的物理规律。
现在英伟达搞了个模型,叫dream dojo,差不多就是让机器人在虚拟的世界里练习,进化,去极大地提升数据的采集和深度学习的效率。这个dream dojo是和wam一起相辅相成的。也就是说,像特斯拉这种基于真实世界遥操作采集数据的方式可能是死胡同,泛化性解决不了。
我个人对人形机器人是比较谨慎的,观点是人形机器人是未来,但现在还是波段为主,就像ai那篇划时代的论文(attention is all you need)出现后,18/22都炒过一波,但直到25年才出现主升浪一样。人形机器人的时间不会比这个短。
但等到人形机器人真开始落地了,这个市场会是人类历史上最大规模的,超过汽车。还得几年时间。
评论区
已归档 21 条 / 原站约 34 条评论抓取时间:2026-05-11 00:58:13
其实不需要太复杂,皮肤整软乎点,外形整漂亮点就行了[吃瓜]
都不说完全能用于生产工业的机器人了,光伴侣机器人,我觉得就能比整个汽车产业要大[看看你],当然,要是那个时候大众都还有工作有钱能买东西的话[流泪]
现在有一个数据采集岗,用传感设备居家做家务
目前还是厂里实用,24小时完成固定且简单的工作。就像自动驾驶,最开始是物流园区和港口里用。
2000年以来中国汽车发展的情况就是未来机器人在全世界发展的情况
波段好啊,就等top降下来,再接回来
一句话总结,现在的人工智能和通用人工智能不是一种东西
实现灵活的手指不比世界模型难度低
再过十年,那种特定工作的机器人能不能成熟点啊[大哭]
这东西用来打架一流,家务事还得等等[飙泪笑]
还是先做工业机器人的票吧
话说奥大怎么看腾讯?在460左右好像止跌了,见底了么?但我对它财报偏看空
人形机器人就和当年的水变油、架空超级巴士、国产CPU这些东西一样的,就是一个骗局。
奥大,ai泡沫如果哪天破了会不会把机器人也给带坑里啊[思考][思考]
反正价格合适就开定投了,上次那个马拉松是真的有点刺激, 这个玩意我就不说未来5年,只要东大这个供应链,1年后没准就能达到这个用途了。 原因是因为我想到了这玩意…………。查看图片(https://picx.zhimg.com/v2-bbedcac68dd0b4530733a70ffda2895d_qhd.jpg?source=1d2f5c51)
好东西都是军转民,留意一下军用的
有一个非常核心的问题,在传说中,神按照自己的样子造人,但人类成长以后,神就隐没了,想想人类现在自己在干什么[捂脸]
看一下Genesis AI的最新Demo,番茄炒蛋了
知乎的付费专栏和知识星球哪边内容更全一些呀?还是两边都一样?
现在只能算人形设备。 展会经常见到机器人表演,我的感觉是跟驯服的小狗差不多,比不上猴子。 人最重要的语言,目前也没有见过可以逗闷子的
躺在科技里,在奥大这里收集信息。