DeepMind高管揭秘，模型为何能吃掉你的工具

24小时AI快讯2个月前发布 changgong

2.9K 00

文章目录

一、什么是「护栏」，为什么模型要吃掉它
二、Agent增长，从堆功能到攒能力
三、入口之争的真正问题
四、编码是意外，但编码揭示了一个规律
五、一年后，你的产品还剩几层

每日AI新闻

当大部分AI团队还在忙着给模型加规则引擎、加流程编排、加Agent框架时，Google DeepMind内部却在讨论一个让产品经理冒冷汗的判断。

你精心搭建的外部壳层，正在被模型一口口吃掉。

这话来自Sequoia Capital对DeepMind高管Logan Kilpatrick的深度访谈。Logan提出了一个叫「the model eats the harness」的概念，翻译过来就是「模型吃掉工具约束」。

一、什么是「护栏」，为什么模型要吃掉它

Logan所说的harness，泛指我们人为加在模型外部的所有约束。这东西在AI产品圈有个更通俗的名字——护栏。比如你写的prompt模板、你搭的RAG管道、你设计的Agent工作流、你画的产品UI，本质上都是一种护栏。

传统理解里，这些东西是为了控制模型，让它更安全、更听话。但Logan的判断是反过来的：随着模型能力提升，这些外部结构会被不断内化。

你今天用三段prompt、五个workflow步骤、一个两层Agent框架才能完成的事情，明天可能只需要一句自然语言。真相是模型自己学会了这些套路。

这背后藏着一个很残酷的推论：如果你的产品价值主要来自外部壳层，而不是模型能力或独占场景，那你正在和时间赛跑。模型进化一周，可能抹掉你半年的工程投入。

二、Agent增长，从堆功能到攒能力

对谈里还有一个容易被忽略但极其重要的概念：agent growth。它听起来像用户增长，但完全不是一回事。

传统增长关注DAU、留存、转化，这些指标衡量的是有多少人在用你的产品。但agent growth关注的是Agent自身能力的增长路径：它能不能在真实任务中吸收上下文？会不会学习工具使用经验？能不能从用户反馈中自我改进？

DeepMind内部更关心的是Agent能不能跨任务迁移，而不是单点benchmark上多了0.1分。这个视角直接改变了产品决策的底层逻辑。

你是在为人设计功能，还是在为Agent设计学习环境？前者追求「看起来很强」，后者追求「每用一次就强一分」。

DeepMind反复强调内部dogfooding，根本目的就是让Agent在复杂真实环境里暴露失败模式。

两者的区别，基本就是「搭积木」和「养小孩」的区别。

三、入口之争的真正问题

当聊到Google到底该有一个、两个、还是三个核心AI产品入口时，讨论直接跳出了产品经理的舒适区。

Logan的答案很克制：入口数量不是目标，关键在于每个入口是否对应清晰的使用情境和模型能力边界。搜索、办公、开发者工具，看似是不同的产品线，实际上是在喂养模型不同分布的数据和任务结构。

这里的潜台词，可能是整场访谈对产品决策者最有冲击力的那个点：如果你过早强行用一个入口统吃所有场景，你反而限制了模型的学习空间。对大模型公司来说，产品不只是终点，更是数据和反馈的采集器。每个入口都在喂养模型一种不同的能力。

本质上是一个公司级的数据战略问题，远不止UI层面的选择。你放几个入口，就是在决定让模型学什么、不学什么。

四、编码是意外，但编码揭示了一个规律

在所有应用场景里，编码被反复提及，但原因很可能和你猜的不一样。

编码之所以成了AI最好的试验场，它的价值在于提供了AI训练中最稀缺的资源——极其清晰的反馈信号。代码要么能跑，要么不能跑。Diff、测试报错、编译失败，全都是高质量的训练数据，一分钱人工标注都不需要。

Logan在访谈中提到，很多能力提升并不来自模型结构的大改，而是post-training阶段的精细调校。这个信号对行业有直接意义：当基础模型趋同，真正拉开产品差距的，是你有没有足够多真实、复杂、带反馈的使用数据。

这也是为什么AI Studio、内部开发工具被各大模型公司争相投入，它们表面上是开发者福利，本质上是模型进化的基础设施。每有一个开发者在上面写代码，就等于在帮模型积累一条带反馈的训练样本。

那么问题来了：如果你的产品不在编码领域，你能不能在自己的业务场景里，设计出类似「能跑vs不能跑」这样清晰的反馈信号？

五、一年后，你的产品还剩几层

对谈最后一个被点到但说得很隐晦的东西，是DeepMind的组织文化逻辑。

Logan提到一个贯穿DeepMind始终的隐性假设：模型能力会持续、快速地提升。这个假设决定了一切——架构要不要留余地、产品要不要过度设计、流程是否足够灵活。在这种文化中，很多「看起来合理」的长期规划都会被重新审视：如果半年后模型能直接做这件事，那我们今天这一层值不值得做？

与其说是技术判断，不如说是一种组织心智。

大多数AI公司的实际情况恰恰相反，他们假设模型能力会停滞，所以拼命在外部壳层上加码。谁的方向更对，时间会给出答案。

最后你可以带走一个问题：如果你的模型在一年内能力翻倍，你现在设计的这套产品，有多少会被「吃掉」，又有多少会变得更重要？

若无特殊声明，本站所有文章版权均归「PMKG AI知识库」原创和所有，未经许可，任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容，或在非我站所属的服务器上建立镜像。否则，我站将依法保留追究相关法律责任的权利。

ChatGPT Ads，OpenAI正式上线广告主平台！

24小时AI快讯 # ChatGPT Ads # OpenAI

2个月前

05.4K0

每分钟1美元！Claude新模型正在逼死订阅制

24小时AI快讯 # AI定价 # AI资讯 # Anthropic

2个月前

02.3K0

16亿台PC，一夜之间全都成了OpenClaw可以寄宿的「肉身」

24小时AI快讯 # AI Agent # AI资讯 # OpenClaw

2个月前

02.6K0

大模型交卷时刻！MiniMax领跑商业闭环成新标准

24小时AI快讯 # AI资讯 # DeepSeek # MiniMax

2个月前

02.6K0

暂无笔记

您必须登录才能记录笔记！

立即登录

暂无笔记...

DeepMind高管揭秘，模型为何能吃掉你的工具

一、什么是「护栏」，为什么模型要吃掉它

二、Agent增长，从堆功能到攒能力

三、入口之争的真正问题

四、编码是意外，但编码揭示了一个规律

五、一年后，你的产品还剩几层

OpenAI锁下10GW，AI算力的尽头是电厂

别怪功能不好用，你的AI产品可能"不耐用"

相关文章

ChatGPT Ads，OpenAI正式上线广告主平台！

每分钟1美元！Claude新模型正在逼死订阅制

16亿台PC，一夜之间全都成了OpenClaw可以寄宿的「肉身」

大模型交卷时刻！MiniMax领跑商业闭环成新标准

暂无笔记

DeepMind高管揭秘，模型为何能吃掉你的工具

一、什么是「护栏」，为什么模型要吃掉它

二、Agent增长，从堆功能到攒能力

三、入口之争的真正问题

四、编码是意外，但编码揭示了一个规律

五、一年后，你的产品还剩几层

OpenAI锁下10GW，AI算力的尽头是电厂

别怪功能不好用，你的AI产品可能"不耐用"

相关文章

ChatGPT Ads，OpenAI正式上线广告主平台！

每分钟1美元！Claude新模型正在逼死订阅制

16亿台PC，一夜之间全都成了OpenClaw可以寄宿的「肉身」

大模型交卷时刻！MiniMax领跑商业闭环成新标准

暂无笔记

欢迎来到「PMKG AI知识库」

欢迎来到 PMKG AI知识库