CursorAgent引入动态上下文发现，令牌消耗降低近半

2026-01-07 14:37

113

Cursor刚发表了篇文章，讲述了他们上下文管理的秘密。

之前Manus的Peak在访谈里面说：

所以Peak说当他们读到一些模型公司发布的研究博客时，心情是“既开心又无奈”。开心是因为这些博客验证了他们的方向，无奈是因为博客里写的东西，基本都是他们早就在做的。

Cursor这篇文章又曾侧面印证了这个观点，不过也不能说Cursor是在抄袭Manus的技术，只能说AI Agent的最佳实践，就是怎么管理好上下文，而管理好上下文，就离不开文件系统。

言归正传，Cursor这篇文章讲的是“动态上下文发现”，核心就是上下文管理。

给AI的上下文，不是越多越好，很多人用AI，生怕AI不知道，怕AI记不住，恨不得把整个项目的文档、历史记录、工具说明一股脑全塞进去。

但随着模型变得越来越聪明，预先塞太多信息反而帮倒忙。一来浪费token（上下文窗口是有限的），二来信息太杂可能干扰模型判断。就像你给一个能干的下属布置任务，不需要把公司所有制度文件都打印出来放他桌上，他需要什么，自己会去查。

这就是Cursor提出的"动态上下文发现"（Dynamic Context Discovery）模式：别急着把信息塞给模型，而是让模型在需要的时候自己去找。

【1】让AI自己找需要的信息

听起来简单，但具体怎么做呢？Cursor分享了五个他们实际在用的优化手段，每个都挺巧妙。

问题是什么？当AI调用外部工具（比如运行一个shell命令或者调用MCP服务），返回的结果可能很长——一大串日志、一整个网页的内容。常见做法是截断，只保留一部分。但截掉的那部分，说不定正好是后面要用的关键信息。

Cursor的做法是：把长输出写成文件，然后给AI一个读文件的能力。AI可以先用tail命令看看结尾，觉得需要再往前读。这样既不会塞满上下文，也不会丢信息。

当对话太长，超过上下文窗口限制时，Cursor会触发一个"总结"步骤，把之前的内容压缩成摘要，给AI一个"新的起点"。

但压缩是有损的。重要细节可能在总结过程中丢失，导致AI"失忆"。Cursor的办法是把完整的聊天记录存成文件。AI拿到的是摘要，但如果它意识到"这里好像漏了什么"，可以自己去翻原始记录找回来。

这就像是你给员工发了一份会议纪要，但完整的会议录音也存着——有疑问随时可以回溯。

Cursor支持一种叫"Agent Skills"的扩展机制，本质上是告诉AI怎么处理特定领域任务的说明书。这些说明书可以有很多，但没必要每次都全部加载。

Cursor的做法是只在系统提示里放一个"目录"——技能的名字和简短描述。AI真正需要某个技能时，再用搜索工具把完整说明拉进来。就像你不会把整个图书馆背在身上，只带个索引卡片就够了。

这个场景数据最有说服力。MCP是一种让AI连接外部服务的标准协议，现在很火。问题是，有些MCP服务器提供几十个工具，每个工具的描述都很长，全塞进上下文窗口很占地方。更尴尬的是，大部分工具在一次任务中根本用不到。

Cursor的优化方式是：只在提示词里放工具的名字，完整描述同步到一个文件夹。AI需要用某个工具时，再去查具体怎么用。

效果怎么样？他们做了A/B测试，在调用MCP工具的场景下，这个策略减少了46.9%的Token消耗。接近一半的成本省下来了。

还有个附带好处：如果某个MCP服务需要重新认证，以前AI就会"忘记"这些工具的存在，用户一头雾水。现在AI能主动提醒用户"喂，你的XX服务需要重新登录了"。

关于MCP工具的优化，Anthropic官方有一篇文章《Code execution with MCP:Building more efficient agents》，思路也是类似的，推荐看看。

用过AI编程工具的人都知道，有时候你想问"我刚才那个命令为什么失败了"，但AI根本不知道你运行过什么命令。你得手动把终端输出复制粘贴给它。

Cursor现在把集成终端的输出自动同步到本地文件系统。AI可以直接"看到"你的终端历史，需要的话还能用grep搜索特定内容。对于那些跑了很久的服务日志，这个功能特别实用。

你可能注意到了，Cursor这五个优化有个共同点：都是把东西变成文件。

为什么是文件而不是别的抽象？

Cursor的说法是：

我们不确定未来LLM工具的最佳接口是什么，但文件是一个简单、强大的基础单元，比发明一套新抽象要安全得多。

这个思路和Manus的理念不谋而合。Peak在他们的技术博客《AI智能体的上下文工程：构建Manus的经验教训》里专门讲过：他们把文件系统当作"终极上下文"——容量无限、天然持久、而且AI自己就能操作。

Peak举的例子很形象：一个网页的内容可以从上下文里删掉，只要URL还在，AI随时能把内容找回来。一个文档的全文可以省略，只要文件路径在，需要时再读取就行。这种"可恢复的压缩"，比简单的截断或删除聪明多了。

一个启示是：上下文工程的核心可能不是"怎么塞更多信息"，而是"怎么让模型高效获取需要的信息"。随着模型能力提升，把主动权交给模型是一个趋势。

另一个启示是简单抽象的力量。在技术领域，我们经常迷恋复杂精巧的设计。但文件这个例子提醒我们：那些经过时间检验的简单抽象，往往比看起来高级的新发明更耐用。

模型够聪明的时候，少塞点东西、让它自己找，可能比硬塞一堆效果更好。

好文章，需要你的鼓励