Kimi Web Bridge发布：本地优先浏览器Agent，兼容Claude Code与Codex

2026-05-15 10:24

295

5月15日消息，Moonshot AI正式发布Kimi Web Bridge浏览器扩展，让AI Agent能够像人类一样在网页上搜索、滚动、点击、输入并完成任务。该扩展现已上线Chrome Web Store和官方设置页kimi.com/features/webbridge，兼容Kimi Code CLI、Claude Code、Cursor、Codex、Hermes等主流编码与通用Agent。与市面上多数云端浏览器Agent方案不同，Kimi Web Bridge采用本地优先架构——浏览器登录态、页面内容和操作全过程都不离开用户设备，把"Browser Use"从单一厂商的封闭功能转变为跨Agent的公共基础设施。

Kimi Web Bridge发布：本地优先浏览器Agent，兼容Claude Code与Codex

本地优先：CDP直连，登录态不出本机

Kimi Web Bridge的技术架构由两部分组成：一个本地后台服务（通过Kimi Desktop App的Kimi Claw Desktop部署）与一个浏览器扩展。Agent向本地服务发送指令，本地服务再通过Chrome DevTools Protocol（CDP，即开发者调试用的底层接口）直接驱动用户现有的Chrome或Edge浏览器执行导航、点击、截图、读取页面，再把结果回传给Agent。整条链路上Moonshot的服务器既不接触登录Cookie，也不接触页面内容。

这一设计回应了云端浏览器Agent的最大顾虑：当Agent需要登录银行账户、企业内部工具、邮箱、或操作含PII数据的SaaS时，传统云端方案要把会话凭证或屏幕画面通过第三方基础设施转一道，对企业合规和个人隐私都是硬伤。CDP方案的另一个隐性收益是不依赖目标网站的API，反爬虫与登录墙限制大幅放宽，复杂表单填写、多步骤工作流（如"用聊天的方式让Agent帮你建一份Google Form问卷"）能直接在用户原始浏览器会话里完成。

Agent无关性：把"Browser Use"做成公共底座

Kimi Web Bridge最值得注意的产品姿态不是技术架构，而是开放接入。官方设置页明确提供了Claude Code、Cursor、Codex等第三方Agent的连接命令，用户只需把命令粘贴到对应Agent中，即可自动接入Web Bridge服务。这意味着Moonshot主动放弃了把浏览器Agent能力锁在自家Kimi产品内部的做法，转而把它定位为跨Agent的标准化基础设施。

这一选择背后是清晰的生态战略。Anthropic的Computer Use、OpenAI的Operator与ChatGPT Atlas、Perplexity的Comet Browser、Google DeepMind的Agent实验，本质上都是"模型+浏览器能力"的垂直一体化方案，用户必须接受厂商绑定。而Hermes、Browser Use等开源框架虽然兼容多模型，但需要开发者自行搭建运行环境。Kimi Web Bridge走的是第三条路——Moonshot出基础设施和分发渠道（Chrome Web Store），其他Agent厂商只需做接入，最终把Kimi Web Bridge变成开发者工具链里的"默认浏览器层"。考虑到Kimi K2.6在SWE-Bench Pro上以58.6%超越GPT-5.4（57.7%）和Claude Opus 4.6（53.4%），Moonshot有底气押注"自家模型仍在排行榜顶部"的前提下做开放生态。

竞品坐标：与Operator、Computer Use的差异化分工

把Kimi Web Bridge放进浏览器Agent赛道的全局图谱看，差异化点逐渐清晰。OpenAI Operator/ChatGPT Atlas走的是云端托管浏览器路线，开箱即用但隐私让步明显；Anthropic Computer Use覆盖整个桌面而非仅浏览器，灵活但需要GUI层视觉理解，token成本和延迟更高；Perplexity Comet是面向消费场景的浏览器替换品，定位接近"AI浏览器"而非"Agent控制层"。

Kimi Web Bridge的位置在云端方案与全桌面方案之间——只控制浏览器、但全程本地、且与现有浏览器实例共存。对开发者侧用户尤为契合：用Claude Code调试代码时让它顺便去GitHub Issues里抓上下文，用Cursor写自动化脚本时让它在浏览器中验证流程，用Codex生成测试用例时让它实际驱动前端页面验证。Kimi Web Bridge把这些场景的成本从"自己写Puppeteer/Playwright脚本"降到"一行连接命令"。这也解释了为什么本次发布的英文媒体覆盖密度异常高——它直接命中了海外Claude Code、Cursor、Codex的存量用户群。

局限与下一步

Kimi Web Bridge目前的边界也清晰可见。浏览器侧仅支持Chrome和Edge，Firefox和Safari用户暂时无缘；架构上需要安装Kimi Desktop App以提供本地后台服务，对完全不用Kimi自家产品的用户有一定门槛；CDP虽然回避了反爬虫的多数场景，但面对Cloudflare Turnstile等高阶人机验证仍可能受阻；与正在标准化的MCP Browser等协议尚未形成对齐，跨工具能力描述、权限隔离、操作审计的标准化空间仍未填补。

从行业节奏看，Kimi Web Bridge与同日发布的OpenAI Codex Hooks、xAI Grok Build CLI形成同一组信号——Agent厂商的差异化战线正从模型能力扩展到执行环境覆盖度。OpenAI押注移动端和企业合规、xAI押注CLI生态、Moonshot押注浏览器层公共基础设施，三条路线交叉点是同一个问题：当模型差距收窄到几个百分点，谁能控制Agent"在哪里干活"，谁就握有下一阶段开发者心智的入口。Moonshot这次的回答是——让所有Agent都从你的浏览器干活，但浏览器是用户自己的。

好文章，需要你的鼓励