2026 年 Agent 时代全面到来,Token 消耗量指数级增长,高昂的算力成本成为中小开发者与创业团队的核心门槛。
6 月 1 日,位列全球模型榜单前十的 AI Lab——Agnes AI 宣布,面向全球开发者无限期免费开放旗下全模态模型 API,彻底引爆行业需求。上线第二周全模态总周调用量便突破 3.12 万亿 Token,验证了免费政策对 AI 生产力的巨大释放效应。
一、免费政策引爆需求,周调用量跻身全球第一梯队
在全行业普遍按 Token 计费、多模态调用成本居高不下的背景下,Agnes AI 的免费政策直接打破了行业惯例。
本次开放的模型矩阵覆盖三大核心品类:Agnes-2.0-Flash 文本模型、Agnes-Image-2.1-Flash 图像模型、Agnes-Video-2.0 视频模型,且并非限时体验,而是长期无限免费。
政策上线后市场需求快速爆发,第二周全模态总 Token 周调用量飙升至 3.12 万亿,其中文本模型贡献 1.9 万亿,图像与视频模型合计贡献 1.2 万亿。
这一调用规模已超越 Claude Opus 4.7 在 OpenRouter 的周调用量,跻身全球前五梯队。此前视觉类 API 一直是行业 “奢侈品”,免费政策直接解放了被成本压抑的创意生产需求,大量批量测试、内容量产场景得以落地。
二、免费不降质:核心能力同步升级,1M 上下文 + 4K 生图全解锁
不同于行业常见的 “免费即低配” 套路,Agnes AI 在免费的同时持续迭代模型能力,本周更是推出两项重磅升级,且全部纳入免费权益范围。
其一,Agnes-2.0-Flash 灰度上线 1M 原生超长上下文,目前已覆盖 50% 用户。
开发者无需修改代码,只要请求内容量在 1M Token 范围内即可直接使用,彻底抹平了文档切片、分段传递带来的信息断层与开发成本。该能力直接让项目级代码理解、整本书级长文档通读、Agent 超长周期对话记忆等高端场景成为免费标配,开发者可一次性传入整个中大型项目源码、几十万字技术手册,实现全局分析与推理。
其二,Agnes-Image-2.1-Flash 全量解锁 4K 超高清生图能力,最高支持 4096×4096 分辨率,覆盖 1:1、3:4、16:9 等所有主流宽高比。开发者仅需将请求参数中的 size 从 “1K” 改为 “4K” 即可调用,且 4K 生成与 1K 生成成本完全一致 —— 均为免费。该能力对电商主图、广告海报、影视概念设计等场景形成直接生产力升级,无需额外超分步骤即可获得高质量成品。
此外,Agnes AI 还预告将于 6 月 19 日左右灰度上线 TTS 语音合成能力,首版提供 20 种高品质音色,支持中英文双语。这也意味着 Agnes 将完成文本、图像、视频、语音的全模态能力闭环,开发者可在同一平台内完成从剧本创作到音视频成品的全流程生产。
三、开源生态快速爆发,全链路工具无缝适配
免费政策上线后,全球开源社区快速响应,短时间内涌现出大量第三方适配项目,让 Agnes 深度融入主流开发者工具链。
在自动编程领域,开发者已为 Claude Code、Codex、OpenClaw 等主流 Agent 平台编写了适配器,配合 1M 长上下文能力,可实现本地项目级的自动化开发。 在工作流与创意工具领域,Hermes、WorkBuddy 等自动化工作流平台,以及各类 MCP 服务均已完成社区适配,衍生出大量多模态 Skill;ComfyUI 节点社区也上线了专属的 4K 生图与视频生成工作流节点。丰富的生态工具让开发者无需重构现有工作流,即可无缝替换底层模型,将 Agnes 作为日常生产力工具,而非单纯的体验产品。 四、推动技术平权,重构 AI 应用成本格局
作为全球前十的全模态 AI Lab,Agnes AI 的免费政策本质是一场 AI 技术平权。
在此之前,百万级 Token 调用、4K 生图、视频生成都属于高成本能力,只有大厂与融资充足的团队才能负担;而免费之后,独立开发者、小型创业团队也能零成本使用世界级 AI 能力,将竞争核心从算力预算拉回到创意与产品本身。当顶级 AI 能力不再有成本门槛,大量此前因成本无法落地的创意应用、批量生产场景将快速涌现,推动整个 AI 应用行业加速创新。
对于普通开发者而言,这也是难得的行业红利期:无需为算力成本焦虑,即可放手探索全模态 AI 的落地可能。