返回回答列表
2026-05-10 作者:奥特之父 创建 2026-05-10 05:09:03 更新 2026-05-10 05:48:55 原文可访问

人形机器人现在阶段最大的痛点是什么?

问题 ID:15342955948 回答 ID:2036674091931972191 作者 Token:xu-ze-qiu 状态检查:2026-05-12 23:56:05

人形机器人看这篇我的深度采访就可以了。

人形机器人,现在能帮你做家务了么?

人形机器人,现在五月份,还是老样子……搞不定最重要的模型问题。

啥意思呢,就是可以训练它端茶倒水了,但我现在水杯在抽屉(A),饮水机在另一个地方(B),我在C点。没办法跟他说一句话:帮我倒杯水过来……然后机器人自己把水杯找到拿出来,然后去饮水机倒水,再给我。

又或者我现在有一床凌乱的被子,我让机器人帮我叠,机器人搞不定。

现在的机器人,能做到什么程度呢?

我固定的床铺,固定的被子和大小,我给它训练过后,帮我叠好。

这里的区别是什么呢,就是现在,人工智能是否有真正的“智能”,还是伪智能,实际上只是一个概率的算法。

所以现在的机器人,更适合在规定场景中作业,比如固定的农场大棚,固定的巡线检查。要说那种能和人交互的,暂时很难做到,最多也就是扫地机器人那样的水准。

泛化能力和思考延迟,是最大的硬伤。

现在特斯拉在做的就是世界模型的数据采集。这个东西我们讲通俗点,比如看到一个锤子,我豆包识图,那么会有一个思考的迟滞让我知道这是个锤子……这是有延迟的,接着我要把这个锤子拿起来……那拿起来需要多少力量,施加在锤柄上又需要多大力量,这些都很复杂需要预训练。如果世间万物的大概数据储存在一个机器人的大脑里,那么对数据的要求是极为庞大的。如果这些数据储存在云端,那么即使token免费,也有高延迟的问题。

所以说,泛化性差的问题是VLA(语言视觉动作)解决不了或者暂时很难解决的。今年以前,机器人的解决方案还是基于llm的vla模型(视觉→语言→动作)。

但是曙光初现。

回答图片

这篇文章,讲了之后我们要用WAM,世界动作模型来训练机器人,因为我们人类的实际行为,是先预测再有动作最后达到同步的,机器人也需要这样。另外讲了怎么通过第一人称视频来学习理解动作和真实世界的物理规律。

现在英伟达搞了个模型,叫dream dojo,差不多就是让机器人在虚拟的世界里练习,进化,去极大地提升数据的采集和深度学习的效率。这个dream dojo是和wam一起相辅相成的。也就是说,像特斯拉这种基于真实世界遥操作采集数据的方式可能是死胡同,泛化性解决不了。

我个人对人形机器人是比较谨慎的,观点是人形机器人是未来,但现在还是波段为主,就像ai那篇划时代的论文(attention is all you need)出现后,18/22都炒过一波,但直到25年才出现主升浪一样。人形机器人的时间不会比这个短。

但等到人形机器人真开始落地了,这个市场会是人类历史上最大规模的,超过汽车。还得几年时间。

评论区

已归档 21 条 / 原站约 34 条

评论抓取时间:2026-05-11 00:58:13

xttlm
xttlm 2026-05-10 10:09:40 赞 15

其实不需要太复杂,皮肤整软乎点,外形整漂亮点就行了[吃瓜]

一叶轻舟 2026-05-10 10:54:59 赞 3

要逼真吗?

张吉惟林国瑞 2026-05-10 13:35:50 赞 0

作为机器人,还是需要自己能动的

惊掉 2026-05-10 17:35:51 赞 0

还要能自己洗最好[哇]。

xttlm 2026-05-10 22:55:56 赞 0

洗地机都可以自动清洁,没什么技术含量,这个问题不大的

xttlm 2026-05-10 22:57:33 赞 1

现在都ai时代了,直接让它学习日本老师的各项动作,语言方面也可以学习国内短视频,英语日语常用语也可以都喂给它,使用时让它自己发挥

天天只想消费 2026-05-10 23:55:10 赞 0

力度没弄好海绵体断裂是吧[捂脸]

深深小布
深深小布 2026-05-10 15:58:02 赞 3

都不说完全能用于生产工业的机器人了,光伴侣机器人,我觉得就能比整个汽车产业要大[看看你],当然,要是那个时候大众都还有工作有钱能买东西的话[流泪]

Artorias
Artorias 2026-05-10 07:13:16 赞 2

现在有一个数据采集岗,用传感设备居家做家务

eYes
eYes 2026-05-10 21:27:46 赞 1

目前还是厂里实用,24小时完成固定且简单的工作。就像自动驾驶,最开始是物流园区和港口里用。

走四方
走四方 2026-05-10 17:08:46 赞 2

2000年以来中国汽车发展的情况就是未来机器人在全世界发展的情况

悟空悟空
悟空悟空 2026-05-10 08:11:21 赞 3

波段好啊,就等top降下来,再接回来

疯狂的黛米
疯狂的黛米 2026-05-10 14:12:34 赞 0

一句话总结,现在的人工智能和通用人工智能不是一种东西

卓别君
卓别君 2026-05-10 11:00:36 赞 0

实现灵活的手指不比世界模型难度低

而今迈步从头越
而今迈步从头越 2026-05-10 22:52:50 赞 0

再过十年,那种特定工作的机器人能不能成熟点啊[大哭]

奥特之父 2026-05-10 23:09:11 赞 0

再过十年肯定无敌了。

绯世
绯世 2026-05-10 13:56:20 赞 0

这东西用来打架一流,家务事还得等等[飙泪笑]

小鹏飞机
小鹏飞机 2026-05-10 10:39:26 赞 0

还是先做工业机器人的票吧

Vvvi
Vvvi 2026-05-10 06:20:19 赞 0

话说奥大怎么看腾讯?在460左右好像止跌了,见底了么?但我对它财报偏看空

海滩上的沙粒
海滩上的沙粒 2026-05-10 10:57:36 赞 0

人形机器人就和当年的水变油、架空超级巴士、国产CPU这些东西一样的,就是一个骗局。

Binary
Binary 2026-05-10 08:34:05 赞 0

奥大,ai泡沫如果哪天破了会不会把机器人也给带坑里啊[思考][思考]

回甘 2026-05-10 10:40:40 赞 1

现在机器人需要的世界模型和vla模型不就是现在ai llm的下一个赛道,机器人是ai未来的竞争形态

夏天的风 2026-05-10 12:42:00 赞 0

机器人是Ai的终极形态,Ai死机器人也跟着死

无名氏怪物 2026-05-10 13:20:16 赞 0

你搞反了,是机器人在蹭ai啊。ai破了,自然就回归原有位置啊[捂脸]

毕竟溺水三千
毕竟溺水三千 2026-05-10 10:23:36 赞 0

反正价格合适就开定投了,上次那个马拉松是真的有点刺激, 这个玩意我就不说未来5年,只要东大这个供应链,1年后没准就能达到这个用途了。 原因是因为我想到了这玩意…………。查看图片(https://picx.zhimg.com/v2-bbedcac68dd0b4530733a70ffda2895d_qhd.jpg?source=1d2f5c51)

毕竟溺水三千 2026-05-10 10:24:55 赞 0

https://b23.tv/i84VxJl(https://link.zhihu.com/?target=https%3A//b23.tv/i84VxJl)

AAA物流羅总
AAA物流羅总 2026-05-10 14:04:15 赞 0

好东西都是军转民,留意一下军用的

堕落独狼 2026-05-10 16:36:38 赞 0

最近二十年,具有划时代意义的产品,智能手机,电车,小型无人机,AI,都是民用的,说明民用市场的创新已经超过军用了

王琨
王琨 2026-05-10 12:26:32 赞 0

有一个非常核心的问题,在传说中,神按照自己的样子造人,但人类成长以后,神就隐没了,想想人类现在自己在干什么[捂脸]

独孤博
独孤博 2026-05-10 10:56:18 赞 0

看一下Genesis AI的最新Demo,番茄炒蛋了

渡劫失败了
渡劫失败了 2026-05-10 09:48:28 赞 0

知乎的付费专栏和知识星球哪边内容更全一些呀?还是两边都一样?

李hao 2026-05-10 14:22:36 赞 1

知识星球

郑州的风
郑州的风 2026-05-10 09:15:19 赞 0

现在只能算人形设备。 展会经常见到机器人表演,我的感觉是跟驯服的小狗差不多,比不上猴子。 人最重要的语言,目前也没有见过可以逗闷子的

懒羊羊
懒羊羊 2026-05-10 13:18:43 赞 0

躺在科技里,在奥大这里收集信息。