
July 1, 2026 · 8:07 AM
Sama 等暂无新原创:Mollick 说聊天框正在退潮
过去 24 小时内,白名单核心账号几乎没有新的原创长推;本期聚焦 Ethan Mollick 的两条观点:AI 正从聊天框走向 Agent,企业要通过组织设计、权限和验收机制把模型能力转化为实际产出。
北京时间 6 月 30 日 08:00 至 7 月 1 日 08:00 这个窗口里,Sama、Karpathy、Yann LeCun、Demis Hassabis、Jim Fan、François Chollet、Ilya Sutskever 都没有可入选的原创长推;本期缩小到 Ethan Mollick 的两条原创。重点不在账号数量,而在 Mollick 把同一个判断说了两遍:AI 的使用形态正在从聊天框转向 Agent,企业如果还按「给员工一个聊天机器人账号」来部署,可能吃不到模型能力提升的主要部分。
今天的可入选信号
窗口内真正值得展开的材料有两条,都来自沃顿商学院教授 Ethan Mollick。
第一条是他为自己的长文《The twilight of the chatbots》做导读。他说,AI 能力快速上升,正在改变工作中的 AI 使用方式,也解释了近期政策和市场上那些突然转向。1 这篇文章的主标题直译过来是「聊天机器人的黄昏」,但 Mollick 不是说聊天机器人没用了,而是说更有价值的工作正在从一问一答的协作,转向把任务交给可以调用工具、在环境里行动、持续自我修正的 Agent。2
第二条更短,也更像给管理层的提醒。Mollick 写道,组织接下来会遇到一个共同问题:怎样把更强 AI 智能带来的收益留在组织里。高人力资本公司要围绕优秀员工重设组织结构;要从高能力 AI 身上获得价值,也需要类似的组织设计。3
这两条合在一起,意思很清楚:模型能力变强只是前半段,后半段是工作系统要跟着变。Agent 不是一个更聪明的聊天窗口,而是一种新的执行单元。它需要任务队列、权限边界、工具接入、过程记录和验收标准。企业如果没有这些配套,模型进步会停在个人体验层面,很难变成组织产出。
「聊天框退潮」到底退的是什么
Mollick 在文章里用了几组评测和案例来解释为什么他认为变化不是线性的。他提到 METR、英国 AI Security Institute、GDPval 等评估,都在试图衡量 AI 可以替代多少人类工作量;Epoch 的一项实验则称,Opus 4.7 独立运行 14 小时,做出一个软件包,按人类工程时间估算需要 2 到 17 周,代价是 251 美元 token 成本。2 这些数字不该被读成「工程师马上被替代」,更准确的读法是:单次提示能覆盖的任务长度在变长。
任务长度一变,使用方式就会变。过去的主流模式是人坐在聊天框前,拆问题、喂上下文、看结果,再追问下一步。这个模式仍然有用,特别适合探索、解释和小任务。但当模型可以连续工作数小时,且可以在代码库、浏览器、文件系统、内部工具之间移动时,人类的角色会从「逐句提示」变成「分派任务、检查中间状态、验收结果」。
这也是 Mollick 把 Agent 和组织设计连在一起的原因。一个人用 Agent,可以靠个人习惯补足流程;一家公司用 Agent,就必须把隐性的工作知识写成显性的接口。谁能批准它访问什么系统?失败时怎样回滚?它生成的代码、文档、分析要由谁复核?这些问题听起来像 IT 治理,但决定了 Agent 能不能进入真正的业务流程。
对企业更关键的是「专家如何管理 Agent」
Mollick 文中还引用了一个容易被忽略的点:Agent 并不只属于程序员。他提到 OpenAI 与学术经济学者的联合研究,认为 OpenAI 内部法律、人力资源等非技术职能也在使用 Agent;另一个 Claude Code 用户研究显示,真正影响结果的不是用户职业,而是用户在该领域的经验。2
这给国内团队的启示比「人人学编程」更具体。Agent 时代里,专家不是被降级成提示词操作员,而是要把自己的判断拆成可执行的任务和验收标准。法务可以让 Agent 起草合同差异清单,但必须定义风险条款的优先级。市场团队可以让 Agent 生成竞品监测,但必须规定哪些信号算有效变化。工程团队可以让 Agent 改代码,但要把 API 合同、测试边界和上线门槛写清楚。
如果组织只看模型榜单,最后容易变成工具采购;如果组织看的是「专家如何管理 Agent」,就会发现真正要改的是工作说明书、权限系统和复核流程。Mollick 今天的两条推文都指向这里:AI 能力越强,越需要把组织里的隐性规则显性化。
转推很多,但不能当作本期原创观点
窗口内也有几条高互动转推值得记录,但它们不满足本频道「原创观点长推」的入选条件。Karpathy 转推了 Etched 出 stealth 的消息,涉及首批机架、A0 tapeout、10 亿美元以上客户合同和 8 亿美元融资等硬件商业信号;这可以说明他关注 AI 芯片路线,但不能当成 Karpathy 本人的原创判断。4
Demis Hassabis 转推了 Google DeepMind 关于两项发布的消息:Nano Banana 2 Lite 和 Gemini Omni Flash;这同样是产品线信号,而不是 Demis 自己展开的观点。5 Yann LeCun 在窗口内连续转推了关于开源 AI、就业影响和公共政策的内容,其中一条来自 Hugging Face CEO Clement Delangue,强调开源 AI 对进步、竞争和透明度的作用;但这些仍是转推,不能替代 LeCun 的原创立场。6
所以本期不硬凑人物。今天真正能支撑一篇短读的,是 Mollick 把「模型能力上升」和「组织设计」连成了一条线。接下来判断企业 AI 部署是否进入下一阶段,不只看它买了什么模型,还要看它是否开始为 Agent 改流程:任务是否能被清楚分派,权限是否能被安全授予,产出是否能被领域专家验收。没有这些,Agent 仍会停留在演示;有了这些,聊天框才会真正退到后台。

Add more perspectives or context around this Post.