5月15日消息,Moonshot AI正式发布Kimi Web Bridge浏览器扩展,让AI Agent能够像人类一样在网页上搜索、滚动、点击、输入并完成任务。该扩展现已上线Chrome Web Store和官方设置页kimi.com/features/webbridge,兼容Kimi Code CLI、Claude Code、Cursor、Codex、Hermes等主流编码与通用Agent。与市面上多数云端浏览器Agent方案不同,Kimi Web Bridge采用本地优先架构——浏览器登录态、页面内容和操作全过程都不离开用户设备,把"Browser Use"从单一厂商的封闭功能转变为跨Agent的公共基础设施。 本地优先:CDP直连,登录态不出本机
Kimi Web Bridge的技术架构由两部分组成:一个本地后台服务(通过Kimi Desktop App的Kimi Claw Desktop部署)与一个浏览器扩展。Agent向本地服务发送指令,本地服务再通过Chrome DevTools Protocol(CDP,即开发者调试用的底层接口)直接驱动用户现有的Chrome或Edge浏览器执行导航、点击、截图、读取页面,再把结果回传给Agent。整条链路上Moonshot的服务器既不接触登录Cookie,也不接触页面内容。
这一设计回应了云端浏览器Agent的最大顾虑:当Agent需要登录银行账户、企业内部工具、邮箱、或操作含PII数据的SaaS时,传统云端方案要把会话凭证或屏幕画面通过第三方基础设施转一道,对企业合规和个人隐私都是硬伤。CDP方案的另一个隐性收益是不依赖目标网站的API,反爬虫与登录墙限制大幅放宽,复杂表单填写、多步骤工作流(如"用聊天的方式让Agent帮你建一份Google Form问卷")能直接在用户原始浏览器会话里完成。
Agent无关性:把"Browser Use"做成公共底座
Kimi Web Bridge最值得注意的产品姿态不是技术架构,而是开放接入。官方设置页明确提供了Claude Code、Cursor、Codex等第三方Agent的连接命令,用户只需把命令粘贴到对应Agent中,即可自动接入Web Bridge服务。这意味着Moonshot主动放弃了把浏览器Agent能力锁在自家Kimi产品内部的做法,转而把它定位为跨Agent的标准化基础设施。
这一选择背后是清晰的生态战略。Anthropic的Computer Use、OpenAI的Operator与ChatGPT Atlas、Perplexity的Comet Browser、Google DeepMind的Agent实验,本质上都是"模型+浏览器能力"的垂直一体化方案,用户必须接受厂商绑定。而Hermes、Browser Use等开源框架虽然兼容多模型,但需要开发者自行搭建运行环境。Kimi Web Bridge走的是第三条路——Moonshot出基础设施和分发渠道(Chrome Web Store),其他Agent厂商只需做接入,最终把Kimi Web Bridge变成开发者工具链里的"默认浏览器层"。考虑到Kimi K2.6在SWE-Bench Pro上以58.6%超越GPT-5.4(57.7%)和Claude Opus 4.6(53.4%),Moonshot有底气押注"自家模型仍在排行榜顶部"的前提下做开放生态。
竞品坐标:与Operator、Computer Use的差异化分工
把Kimi Web Bridge放进浏览器Agent赛道的全局图谱看,差异化点逐渐清晰。OpenAI Operator/ChatGPT Atlas走的是云端托管浏览器路线,开箱即用但隐私让步明显;Anthropic Computer Use覆盖整个桌面而非仅浏览器,灵活但需要GUI层视觉理解,token成本和延迟更高;Perplexity Comet是面向消费场景的浏览器替换品,定位接近"AI浏览器"而非"Agent控制层"。
Kimi Web Bridge的位置在云端方案与全桌面方案之间——只控制浏览器、但全程本地、且与现有浏览器实例共存。对开发者侧用户尤为契合:用Claude Code调试代码时让它顺便去GitHub Issues里抓上下文,用Cursor写自动化脚本时让它在浏览器中验证流程,用Codex生成测试用例时让它实际驱动前端页面验证。Kimi Web Bridge把这些场景的成本从"自己写Puppeteer/Playwright脚本"降到"一行连接命令"。这也解释了为什么本次发布的英文媒体覆盖密度异常高——它直接命中了海外Claude Code、Cursor、Codex的存量用户群。
局限与下一步
Kimi Web Bridge目前的边界也清晰可见。浏览器侧仅支持Chrome和Edge,Firefox和Safari用户暂时无缘;架构上需要安装Kimi Desktop App以提供本地后台服务,对完全不用Kimi自家产品的用户有一定门槛;CDP虽然回避了反爬虫的多数场景,但面对Cloudflare Turnstile等高阶人机验证仍可能受阻;与正在标准化的MCP Browser等协议尚未形成对齐,跨工具能力描述、权限隔离、操作审计的标准化空间仍未填补。
从行业节奏看,Kimi Web Bridge与同日发布的OpenAI Codex Hooks、xAI Grok Build CLI形成同一组信号——Agent厂商的差异化战线正从模型能力扩展到执行环境覆盖度。OpenAI押注移动端和企业合规、xAI押注CLI生态、Moonshot押注浏览器层公共基础设施,三条路线交叉点是同一个问题:当模型差距收窄到几个百分点,谁能控制Agent"在哪里干活",谁就握有下一阶段开发者心智的入口。Moonshot这次的回答是——让所有Agent都从你的浏览器干活,但浏览器是用户自己的。