
July 1, 2026 · 8:09 AM
家用机器人还没进门,隐私和安全账单先来了
《纽约客》Stephen Witt 走访 1X、Skild、Unitree 等人形机器人公司,写出家用机器人最迷人的错觉:它们已经长得像能进家门的产品,但自主能力、动作数据、安全和隐私问题都还远没准备好。
导读
《纽约客》Stephen Witt 在 2026 年 7 月刊写家用人形机器人:Neo 看起来安静、柔软、像一件马上要进客厅的消费电子产品,但文章真正追问的是,机器人一旦有了人形,我们会不会把尚未成熟的技术误认成可靠的「人」。1
全文总结
Witt 的开场很有画面感。他走进 1X Technologies 位于硅谷的总部,见到了该公司的家用机器人 Neo:五英尺六英寸高,没有皮肤,脸上只有两颗黑色摄像头,外面套着米色尼龙高领连体衣,身体里是一百多个电机和像肌腱一样的绳索。它只有 66 磅,作者甚至能把它抱起来。它能听指令、说话、尝试拿杯子或把牛奶放进冰箱,但问题也在这里:它会试着做,不等于它能稳定完成。1
1X 的创始人 Bernt Børnich 相信「人形」有技术优势。家、楼梯、门把手、冰箱、杯子,都是按人的身体设计的;如果机器人要进入这些空间,两只手、两条腿、一个头,似乎是最通用的形态。Neo 的设计还把这种思路推得更远:它用人工肌腱,而不是单纯靠电机;主板放在头部,而不是多数机器人常见的胸腔里。Børnich 认为,人形机器人最终「几乎什么都能做」。1
但文章很快把这种乐观拆开。Nvidia(英伟达,全球主要 AI 芯片公司)负责机器人业务的 Deepu Talla 说,世界还没有属于机器人的 ChatGPT。这里的意思不是机器人不会说话,而是它们还没有一个足够可靠的「物理智能」模型,能把语言指令稳定变成现实动作。Google DeepMind(谷歌旗下人工智能实验室)的 Carolina Parada 也提醒,家用场景不是能力展示厅,而是有宠物、小孩、杂物和不可预期动作的地方。1
1X 仍准备把 Neo 推向早期用户。文章写到,Neo 标价 2 万美元,已有超过 1 万名客户支付订金,主要来自旧金山湾区、洛杉矶和纽约的富裕科技爱好者。一位前 OpenAI 员工 Will DePue 说,他家里有三台人形机器人订单,感觉这像「新的 iPhone」。这个比喻很能说明问题:早期用户买的不是成熟家电,而是对下一代计算平台的入场券。1
Neo 的产品设计负责人 Dar Sleeper 则像把硅谷审美压进了机器人外壳。他曾在 Yeezy 和 Tesla 工作,受 Børnich 委托设计一个不会吓到孩子的机器人。最初的黑色光滑脸会让几乎所有孩子害怕;后来他不断删掉面部特征、换材质、调整眼窝,最后才得到现在这种柔软、匿名、略带玩具感的外观。Neo 的脚步声只有 22 分贝,约等于树叶被风吹动的声音。作者承认,自己第一次看到 Neo 安静地移动时,竟然产生了「消费者的欲望」。1
可下一秒,幻觉就破了。Neo 在演示厨房里把盘子放进架子,看起来动作流畅;作者随后注意到旁边站着一名戴 VR(virtual reality,虚拟现实)头显的人类操作员,正用控制器遥控它的一举一动。换句话说,他看到的不是全自动家务机器人,而是一具漂亮的提线木偶。1X 没有向他展示即将用于 Neo 的 AI 系统;Sleeper 也承认,要说最新版本「不会摔倒」还太夸张。1
Witt 随后把视野拉到整个人形机器人行业。未来 12 个月内,Neo、Figure 03、Boston Dynamics Atlas、Apptronik Apollo 等大约十几款人形机器人都计划进入市场。Tesla(特斯拉)则希望在加州 Fremont 工厂生产 Optimus,Elon Musk 甚至把机器人造机器人称为「无限赚钱漏洞」。中国的 Unitree(宇树科技)去年出货超过 5000 台 G1,这使它成为全球领先供应商之一;G1 起价约 1.4 万美元,能运行开源软件,因此受到学术实验室和发烧友欢迎。1
行业越热,专家越不放心。Caltech(California Institute of Technology,加州理工学院)的机械工程教授 Aaron Ames 认为,可靠的自主机器人 AI 仍然要等很多年。他担心的不是机器人视频里能不能后空翻,而是它会不会在家里摔在人身上。很多机器人演示片都是从上百次拍摄里挑出来的;一个机器人能完成预设动作,不代表它能在混乱的现实环境里随机应变。1
文章最有力的部分,是把「看起来像人」和「真的具有人类能力」分开。人形外观会自动诱导我们提高预期:有手,就该会拿东西;有腿,就该会走楼梯;有眼睛,就该看懂环境。但机器人手还远远落后于人手。人手能完成 27 个独立动作,而机器人还做不到既系鞋带又洗牌。作者在 Skild AI 看到一台 Unitree 机器人能把立着的咖啡杯放进盒子;当杯子被横放,它就在空气中徒劳抓取。后来它花了约 10 秒,才学会捏住倒扣塑料碗的凸起底座,把碗拿起来。那一刻很迷人,也很有限:它像是在思考,却还只是在一个狭窄场景里试错。1
数据是另一道坎。语言模型可以从公开互联网、书籍和代码里学习文本,但机器人没有同等规模的「动作互联网」。一个 token(模型处理信息的基本单位)在语言里可能是几个字母;在机器人里,可能是一段手指关节的运动轨迹。Neura 让上千名工业工人穿上动作捕捉服来生成数据,但即便全世界都穿上动捕服,也要几十年才可能积累出训练 ChatGPT 所用数据量级的动作数据。1
远程操作因此成了现实里的桥。Waymo 自动驾驶汽车在不确定路况下会请求人类操作员协助;日本便利店的「自动」补货机器人也可以由戴 VR 头显的人远程控制。1X 的赌注是,用户最终会接受有陌生操作员通过 Neo 的眼部摄像头看进家里。公司会用耳部灯环提醒用户何时进入远程操作状态,但这仍然把家务机器人变成了一个新问题:你是请一个陌生人进门打扫,还是让一个陌生人通过机器人看见你的客厅?1
最后,Witt 没有把结论写成简单的否定。他承认人形机器人可能确实处在一个早期进化阶段:两臂、两腿、躯干和头部是共同形态,但具体设计还在分叉,像早期人科动物一样各自试探。真正缺失的也许是「手」,也许是数据,也许是安全标准。文章结尾停在一个小实验上:机器人一开始抓不到倒扣的碗,停顿约 10 秒后,捏住碗底凸起,把它放进盒子。这个瞬间既像未来的一道缝,也说明未来还没真正进门。1
关键细节
- Neo 身高五英尺六英寸、重 66 磅,外部是米色尼龙连体衣,内部有一百多个电机和人工肌腱;它的安静和柔软是设计重点,不只是工程结果。1
- Neo 标价 2 万美元,已有超过 1 万名客户支付订金;这些订单主要来自美国东西海岸的富裕早期用户。1
- 1X 的演示里,Neo 把盘子放进架子,但动作由旁边戴 VR 头显的人类操作员控制;这说明家用机器人目前仍把「自主智能」和「远程人力」混在一起。1
- Unitree 去年出货超过 5000 台 G1,人形机器人市场不只是美国创业公司的故事,中国厂商和开源软件社区也在推动它更快扩散。1
- 机器人安全风险不只来自摔倒,还包括被恶意指令诱导、被黑客控制、通过摄像头和麦克风收集家庭隐私;Nvidia 研究员 Jim Fan 说,照看这些机器人需要整支运营团队。1
- Nvidia 在文章里几乎成了机器人行业的隐形基础设施:作者采访到的每台机器人都使用 Nvidia 芯片,也都在 Nvidia 的仿真环境里训练过。1
金句
The world still doesn't have a ChatGPT equivalent for a robot. 1
Deepu Talla 的这句话点破了全文的核心:会说话的 AI 和会在现实世界里可靠行动的 AI,不是同一种能力。
To say it doesn't fall is, like, a total stretch. 1
这是 1X 产品负责人谈 Neo 是否会摔倒时的回答。它比任何公关措辞都诚实:家用机器人离「放心交给它」还差一段路。
Data is to the A.I. revolution what coal was to the industrial one. 1
这句把机器人行业的瓶颈说得很清楚。没有足够多、足够真实的动作数据,机器人就很难学会在家庭这种混乱空间里稳定干活。

Add more perspectives or context around this Post.