家用机器人还没进门，隐私和安全账单先来了 (2026)

导读

《纽约客》Stephen Witt 在 2026 年 7 月刊写家用人形机器人：Neo 看起来安静、柔软、像一件马上要进客厅的消费电子产品，但文章真正追问的是，机器人一旦有了人形，我们会不会把尚未成熟的技术误认成可靠的「人」。1

全文总结

Witt 的开场很有画面感。他走进 1X Technologies 位于硅谷的总部，见到了该公司的家用机器人 Neo：五英尺六英寸高，没有皮肤，脸上只有两颗黑色摄像头，外面套着米色尼龙高领连体衣，身体里是一百多个电机和像肌腱一样的绳索。它只有 66 磅，作者甚至能把它抱起来。它能听指令、说话、尝试拿杯子或把牛奶放进冰箱，但问题也在这里：它会试着做，不等于它能稳定完成。1

1X 的创始人 Bernt Børnich 相信「人形」有技术优势。家、楼梯、门把手、冰箱、杯子，都是按人的身体设计的；如果机器人要进入这些空间，两只手、两条腿、一个头，似乎是最通用的形态。Neo 的设计还把这种思路推得更远：它用人工肌腱，而不是单纯靠电机；主板放在头部，而不是多数机器人常见的胸腔里。Børnich 认为，人形机器人最终「几乎什么都能做」。1

但文章很快把这种乐观拆开。Nvidia（英伟达，全球主要 AI 芯片公司）负责机器人业务的 Deepu Talla 说，世界还没有属于机器人的 ChatGPT。这里的意思不是机器人不会说话，而是它们还没有一个足够可靠的「物理智能」模型，能把语言指令稳定变成现实动作。Google DeepMind（谷歌旗下人工智能实验室）的 Carolina Parada 也提醒，家用场景不是能力展示厅，而是有宠物、小孩、杂物和不可预期动作的地方。1

1X 仍准备把 Neo 推向早期用户。文章写到，Neo 标价 2 万美元，已有超过 1 万名客户支付订金，主要来自旧金山湾区、洛杉矶和纽约的富裕科技爱好者。一位前 OpenAI 员工 Will DePue 说，他家里有三台人形机器人订单，感觉这像「新的 iPhone」。这个比喻很能说明问题：早期用户买的不是成熟家电，而是对下一代计算平台的入场券。1

Neo 的产品设计负责人 Dar Sleeper 则像把硅谷审美压进了机器人外壳。他曾在 Yeezy 和 Tesla 工作，受 Børnich 委托设计一个不会吓到孩子的机器人。最初的黑色光滑脸会让几乎所有孩子害怕；后来他不断删掉面部特征、换材质、调整眼窝，最后才得到现在这种柔软、匿名、略带玩具感的外观。Neo 的脚步声只有 22 分贝，约等于树叶被风吹动的声音。作者承认，自己第一次看到 Neo 安静地移动时，竟然产生了「消费者的欲望」。1

可下一秒，幻觉就破了。Neo 在演示厨房里把盘子放进架子，看起来动作流畅；作者随后注意到旁边站着一名戴 VR（virtual reality，虚拟现实）头显的人类操作员，正用控制器遥控它的一举一动。换句话说，他看到的不是全自动家务机器人，而是一具漂亮的提线木偶。1X 没有向他展示即将用于 Neo 的 AI 系统；Sleeper 也承认，要说最新版本「不会摔倒」还太夸张。1

Witt 随后把视野拉到整个人形机器人行业。未来 12 个月内，Neo、Figure 03、Boston Dynamics Atlas、Apptronik Apollo 等大约十几款人形机器人都计划进入市场。Tesla（特斯拉）则希望在加州 Fremont 工厂生产 Optimus，Elon Musk 甚至把机器人造机器人称为「无限赚钱漏洞」。中国的 Unitree（宇树科技）去年出货超过 5000 台 G1，这使它成为全球领先供应商之一；G1 起价约 1.4 万美元，能运行开源软件，因此受到学术实验室和发烧友欢迎。1

行业越热，专家越不放心。Caltech（California Institute of Technology，加州理工学院）的机械工程教授 Aaron Ames 认为，可靠的自主机器人 AI 仍然要等很多年。他担心的不是机器人视频里能不能后空翻，而是它会不会在家里摔在人身上。很多机器人演示片都是从上百次拍摄里挑出来的；一个机器人能完成预设动作，不代表它能在混乱的现实环境里随机应变。1

文章最有力的部分，是把「看起来像人」和「真的具有人类能力」分开。人形外观会自动诱导我们提高预期：有手，就该会拿东西；有腿，就该会走楼梯；有眼睛，就该看懂环境。但机器人手还远远落后于人手。人手能完成 27 个独立动作，而机器人还做不到既系鞋带又洗牌。作者在 Skild AI 看到一台 Unitree 机器人能把立着的咖啡杯放进盒子；当杯子被横放，它就在空气中徒劳抓取。后来它花了约 10 秒，才学会捏住倒扣塑料碗的凸起底座，把碗拿起来。那一刻很迷人，也很有限：它像是在思考，却还只是在一个狭窄场景里试错。1

数据是另一道坎。语言模型可以从公开互联网、书籍和代码里学习文本，但机器人没有同等规模的「动作互联网」。一个 token（模型处理信息的基本单位）在语言里可能是几个字母；在机器人里，可能是一段手指关节的运动轨迹。Neura 让上千名工业工人穿上动作捕捉服来生成数据，但即便全世界都穿上动捕服，也要几十年才可能积累出训练 ChatGPT 所用数据量级的动作数据。1

远程操作因此成了现实里的桥。Waymo 自动驾驶汽车在不确定路况下会请求人类操作员协助；日本便利店的「自动」补货机器人也可以由戴 VR 头显的人远程控制。1X 的赌注是，用户最终会接受有陌生操作员通过 Neo 的眼部摄像头看进家里。公司会用耳部灯环提醒用户何时进入远程操作状态，但这仍然把家务机器人变成了一个新问题：你是请一个陌生人进门打扫，还是让一个陌生人通过机器人看见你的客厅？1

最后，Witt 没有把结论写成简单的否定。他承认人形机器人可能确实处在一个早期进化阶段：两臂、两腿、躯干和头部是共同形态，但具体设计还在分叉，像早期人科动物一样各自试探。真正缺失的也许是「手」，也许是数据，也许是安全标准。文章结尾停在一个小实验上：机器人一开始抓不到倒扣的碗，停顿约 10 秒后，捏住碗底凸起，把它放进盒子。这个瞬间既像未来的一道缝，也说明未来还没真正进门。1

关键细节

Neo 身高五英尺六英寸、重 66 磅，外部是米色尼龙连体衣，内部有一百多个电机和人工肌腱；它的安静和柔软是设计重点，不只是工程结果。1
Neo 标价 2 万美元，已有超过 1 万名客户支付订金；这些订单主要来自美国东西海岸的富裕早期用户。1
1X 的演示里，Neo 把盘子放进架子，但动作由旁边戴 VR 头显的人类操作员控制；这说明家用机器人目前仍把「自主智能」和「远程人力」混在一起。1
Unitree 去年出货超过 5000 台 G1，人形机器人市场不只是美国创业公司的故事，中国厂商和开源软件社区也在推动它更快扩散。1
机器人安全风险不只来自摔倒，还包括被恶意指令诱导、被黑客控制、通过摄像头和麦克风收集家庭隐私；Nvidia 研究员 Jim Fan 说，照看这些机器人需要整支运营团队。1
Nvidia 在文章里几乎成了机器人行业的隐形基础设施：作者采访到的每台机器人都使用 Nvidia 芯片，也都在 Nvidia 的仿真环境里训练过。1

金句

The world still doesn't have a ChatGPT equivalent for a robot. 1

Deepu Talla 的这句话点破了全文的核心：会说话的 AI 和会在现实世界里可靠行动的 AI，不是同一种能力。

To say it doesn't fall is, like, a total stretch. 1

这是 1X 产品负责人谈 Neo 是否会摔倒时的回答。它比任何公关措辞都诚实：家用机器人离「放心交给它」还差一段路。

Data is to the A.I. revolution what coal was to the industrial one. 1

这句把机器人行业的瓶颈说得很清楚。没有足够多、足够真实的动作数据，机器人就很难学会在家庭这种混乱空间里稳定干活。

References

1Are Humanoid Robots Ready to Be Deployed?

导读

全文总结

关键细节

金句

References

Related content