Sama 等暂无新原创：Mollick 说聊天框正在退潮 (2026)

北京时间 6 月 30 日 08:00 至 7 月 1 日 08:00 这个窗口里，Sama、Karpathy、Yann LeCun、Demis Hassabis、Jim Fan、François Chollet、Ilya Sutskever 都没有可入选的原创长推；本期缩小到 Ethan Mollick 的两条原创。重点不在账号数量，而在 Mollick 把同一个判断说了两遍：AI 的使用形态正在从聊天框转向 Agent，企业如果还按「给员工一个聊天机器人账号」来部署，可能吃不到模型能力提升的主要部分。

今天的可入选信号

窗口内真正值得展开的材料有两条，都来自沃顿商学院教授 Ethan Mollick。

第一条是他为自己的长文《The twilight of the chatbots》做导读。他说，AI 能力快速上升，正在改变工作中的 AI 使用方式，也解释了近期政策和市场上那些突然转向。1 这篇文章的主标题直译过来是「聊天机器人的黄昏」，但 Mollick 不是说聊天机器人没用了，而是说更有价值的工作正在从一问一答的协作，转向把任务交给可以调用工具、在环境里行动、持续自我修正的 Agent。2

第二条更短，也更像给管理层的提醒。Mollick 写道，组织接下来会遇到一个共同问题：怎样把更强 AI 智能带来的收益留在组织里。高人力资本公司要围绕优秀员工重设组织结构；要从高能力 AI 身上获得价值，也需要类似的组织设计。3

这两条合在一起，意思很清楚：模型能力变强只是前半段，后半段是工作系统要跟着变。Agent 不是一个更聪明的聊天窗口，而是一种新的执行单元。它需要任务队列、权限边界、工具接入、过程记录和验收标准。企业如果没有这些配套，模型进步会停在个人体验层面，很难变成组织产出。

「聊天框退潮」到底退的是什么

Mollick 在文章里用了几组评测和案例来解释为什么他认为变化不是线性的。他提到 METR、英国 AI Security Institute、GDPval 等评估，都在试图衡量 AI 可以替代多少人类工作量；Epoch 的一项实验则称，Opus 4.7 独立运行 14 小时，做出一个软件包，按人类工程时间估算需要 2 到 17 周，代价是 251 美元 token 成本。2 这些数字不该被读成「工程师马上被替代」，更准确的读法是：单次提示能覆盖的任务长度在变长。

任务长度一变，使用方式就会变。过去的主流模式是人坐在聊天框前，拆问题、喂上下文、看结果，再追问下一步。这个模式仍然有用，特别适合探索、解释和小任务。但当模型可以连续工作数小时，且可以在代码库、浏览器、文件系统、内部工具之间移动时，人类的角色会从「逐句提示」变成「分派任务、检查中间状态、验收结果」。

这也是 Mollick 把 Agent 和组织设计连在一起的原因。一个人用 Agent，可以靠个人习惯补足流程；一家公司用 Agent，就必须把隐性的工作知识写成显性的接口。谁能批准它访问什么系统？失败时怎样回滚？它生成的代码、文档、分析要由谁复核？这些问题听起来像 IT 治理，但决定了 Agent 能不能进入真正的业务流程。

对企业更关键的是「专家如何管理 Agent」

Mollick 文中还引用了一个容易被忽略的点：Agent 并不只属于程序员。他提到 OpenAI 与学术经济学者的联合研究，认为 OpenAI 内部法律、人力资源等非技术职能也在使用 Agent；另一个 Claude Code 用户研究显示，真正影响结果的不是用户职业，而是用户在该领域的经验。2

这给国内团队的启示比「人人学编程」更具体。Agent 时代里，专家不是被降级成提示词操作员，而是要把自己的判断拆成可执行的任务和验收标准。法务可以让 Agent 起草合同差异清单，但必须定义风险条款的优先级。市场团队可以让 Agent 生成竞品监测，但必须规定哪些信号算有效变化。工程团队可以让 Agent 改代码，但要把 API 合同、测试边界和上线门槛写清楚。

如果组织只看模型榜单，最后容易变成工具采购；如果组织看的是「专家如何管理 Agent」，就会发现真正要改的是工作说明书、权限系统和复核流程。Mollick 今天的两条推文都指向这里：AI 能力越强，越需要把组织里的隐性规则显性化。

转推很多，但不能当作本期原创观点

窗口内也有几条高互动转推值得记录，但它们不满足本频道「原创观点长推」的入选条件。Karpathy 转推了 Etched 出 stealth 的消息，涉及首批机架、A0 tapeout、10 亿美元以上客户合同和 8 亿美元融资等硬件商业信号；这可以说明他关注 AI 芯片路线，但不能当成 Karpathy 本人的原创判断。4

Demis Hassabis 转推了 Google DeepMind 关于两项发布的消息：Nano Banana 2 Lite 和 Gemini Omni Flash；这同样是产品线信号，而不是 Demis 自己展开的观点。5 Yann LeCun 在窗口内连续转推了关于开源 AI、就业影响和公共政策的内容，其中一条来自 Hugging Face CEO Clement Delangue，强调开源 AI 对进步、竞争和透明度的作用；但这些仍是转推，不能替代 LeCun 的原创立场。6

所以本期不硬凑人物。今天真正能支撑一篇短读的，是 Mollick 把「模型能力上升」和「组织设计」连成了一条线。接下来判断企业 AI 部署是否进入下一阶段，不只看它买了什么模型，还要看它是否开始为 Agent 改流程：任务是否能被清楚分派，权限是否能被安全授予，产出是否能被领域专家验收。没有这些，Agent 仍会停留在演示；有了这些，聊天框才会真正退到后台。

Sama 等暂无新原创：Mollick 说聊天框正在退潮

今天的可入选信号

「聊天框退潮」到底退的是什么

对企业更关键的是「专家如何管理 Agent」

转推很多，但不能当作本期原创观点

References

Related content