DeepMind高管揭秘,模型为何能吃掉你的工具

24小时AI快讯6小时前发布 changgong
185 00

每日AI新闻

当大部分AI团队还在忙着给模型加规则引擎、加流程编排、加Agent框架时,Google DeepMind内部却在讨论一个让产品经理冒冷汗的判断。

你精心搭建的外部壳层,正在被模型一口口吃掉。

这话来自Sequoia Capital对DeepMind高管Logan Kilpatrick的深度访谈。Logan提出了一个叫「the model eats the harness」的概念,翻译过来就是「模型吃掉工具约束」。

一、什么是「护栏」,为什么模型要吃掉它

Logan所说的harness,泛指我们人为加在模型外部的所有约束。这东西在AI产品圈有个更通俗的名字——护栏。比如你写的prompt模板、你搭的RAG管道、你设计的Agent工作流、你画的产品UI,本质上都是一种护栏。

传统理解里,这些东西是为了控制模型,让它更安全、更听话。但Logan的判断是反过来的:随着模型能力提升,这些外部结构会被不断内化。

你今天用三段prompt、五个workflow步骤、一个两层Agent框架才能完成的事情,明天可能只需要一句自然语言。真相是模型自己学会了这些套路。

这背后藏着一个很残酷的推论:如果你的产品价值主要来自外部壳层,而不是模型能力或独占场景,那你正在和时间赛跑。模型进化一周,可能抹掉你半年的工程投入。

二、Agent增长,从堆功能到攒能力

对谈里还有一个容易被忽略但极其重要的概念:agent growth。它听起来像用户增长,但完全不是一回事。

传统增长关注DAU、留存、转化,这些指标衡量的是有多少人在用你的产品。但agent growth关注的是Agent自身能力的增长路径:它能不能在真实任务中吸收上下文?会不会学习工具使用经验?能不能从用户反馈中自我改进?

DeepMind内部更关心的是Agent能不能跨任务迁移,而不是单点benchmark上多了0.1分。这个视角直接改变了产品决策的底层逻辑。

你是在为人设计功能,还是在为Agent设计学习环境?前者追求「看起来很强」,后者追求「每用一次就强一分」。

DeepMind反复强调内部dogfooding,根本目的就是让Agent在复杂真实环境里暴露失败模式。

两者的区别,基本就是「搭积木」和「养小孩」的区别。

三、入口之争的真正问题

当聊到Google到底该有一个、两个、还是三个核心AI产品入口时,讨论直接跳出了产品经理的舒适区。

Logan的答案很克制:入口数量不是目标,关键在于每个入口是否对应清晰的使用情境和模型能力边界。搜索、办公、开发者工具,看似是不同的产品线,实际上是在喂养模型不同分布的数据和任务结构。

这里的潜台词,可能是整场访谈对产品决策者最有冲击力的那个点:如果你过早强行用一个入口统吃所有场景,你反而限制了模型的学习空间。对大模型公司来说,产品不只是终点,更是数据和反馈的采集器。每个入口都在喂养模型一种不同的能力。

本质上是一个公司级的数据战略问题,远不止UI层面的选择。你放几个入口,就是在决定让模型学什么、不学什么。

四、编码是意外,但编码揭示了一个规律

在所有应用场景里,编码被反复提及,但原因很可能和你猜的不一样。

编码之所以成了AI最好的试验场,它的价值在于提供了AI训练中最稀缺的资源——极其清晰的反馈信号。代码要么能跑,要么不能跑。Diff、测试报错、编译失败,全都是高质量的训练数据,一分钱人工标注都不需要。

Logan在访谈中提到,很多能力提升并不来自模型结构的大改,而是post-training阶段的精细调校。这个信号对行业有直接意义:当基础模型趋同,真正拉开产品差距的,是你有没有足够多真实、复杂、带反馈的使用数据。

这也是为什么AI Studio、内部开发工具被各大模型公司争相投入,它们表面上是开发者福利,本质上是模型进化的基础设施。每有一个开发者在上面写代码,就等于在帮模型积累一条带反馈的训练样本。

那么问题来了:如果你的产品不在编码领域,你能不能在自己的业务场景里,设计出类似「能跑vs不能跑」这样清晰的反馈信号?

五、一年后,你的产品还剩几层

对谈最后一个被点到但说得很隐晦的东西,是DeepMind的组织文化逻辑。

Logan提到一个贯穿DeepMind始终的隐性假设:模型能力会持续、快速地提升。这个假设决定了一切——架构要不要留余地、产品要不要过度设计、流程是否足够灵活。在这种文化中,很多「看起来合理」的长期规划都会被重新审视:如果半年后模型能直接做这件事,那我们今天这一层值不值得做?

与其说是技术判断,不如说是一种组织心智。

大多数AI公司的实际情况恰恰相反,他们假设模型能力会停滞,所以拼命在外部壳层上加码。谁的方向更对,时间会给出答案。

最后你可以带走一个问题:如果你的模型在一年内能力翻倍,你现在设计的这套产品,有多少会被「吃掉」,又有多少会变得更重要?

© 版权声明

相关文章

暂无笔记

您必须登录才能记录笔记!
立即登录
none
暂无笔记...