6月15日消息,月之暗面正式上线 Kimi K2.7 Code 高速版(模型 ID:kimi-k2.7-code-highspeed),企业和开发者现可通过 Kimi API 开放平台调用。
高速版与普通版为同一模型,核心差异在输出速度——常规编程场景(取输入长度中位数)约 180 Token/s,短上下文场景可达 260 Token/s,约为普通版的 5-6 倍。定价方面,高速版为普通版的 2 倍。按普通版已知定价推算(输入 $0.95 / 输出 $4.00 每百万 Token),高速版的输出成本约为 $8.00/MTok。
K2.7 Code 做了什么
Kimi K2.7 Code 于 6 月 12 日发布并开源,基于 K2.6 迭代,定位为月之暗面当前最强编程模型。架构延续 MoE(混合专家),总参数 1 万亿、每 Token 激活 32B,支持 256K 上下文窗口、文本/图片/视频多模态输入,强制开启思考模式。
相比 K2.6,K2.7 Code 的核心改进集中在三个层面:
一是编程基准提升显著。官方内部评测显示,Kimi Code Bench v2 提升 21.8%,Program-Bench 提升 11%,MLS Bench Lite 提升 31.5%。在 Rust、Go、Python、前端、DevOps 等多语言多场景下均有泛化提升。
二是推理 Token 消耗降低约 30%。长程编程任务中,K2.6 的过度思考倾向是开发者反馈的痛点之一,K2.7 Code 在这一维度做了针对性优化,Agent 多轮调用场景下的成本控制更友好。
三是 Agent 自主执行能力增强。在 Kimi Claw 24/7 Bench、MCP Atlas 和 MCP Mark Verified 等 Agent 基准测试中,性能提升约 10%。模型权重以 Modified MIT 协议开源,已上线 Hugging Face(moonshotai/Kimi-K2.7-Code)和 OpenRouter。
高速版的定位逻辑
高速版并非模型层面的变化,而是推理部署层面的优化——用更多推理资源换取更快的输出速度。月之暗面计划逐步增加高速版的推理资源供给,6 月底前开发者可通过 Kimi Code Plan 抢先体验计划(kimi.com/code/beta)在 Kimi Code 中体验高速版,预计 7 月起向 Allegretto 及以上会员开放。在 Kimi Code Plan 中,高速版的用量消耗为普通版的 3 倍。
对 API 开发者而言,核心决策点在于速度与成本的取舍:高速版适合交互式编程、实时代码补全等对延迟敏感的场景;普通版更适合后台批处理、长程 Agent 任务等对吞吐成本敏感的场景。
背景与竞争格局
Kimi K2.7 Code 的发布处于一个密集的模型竞争窗口。编程模型赛道上,Anthropic 的 Claude Opus 4.8 配合 Claude Code 构建了较强的端到端编程体验,OpenAI 的 GPT-5.5 在 Codex 中以 xhigh 模式运行,国内 DeepSeek、阿里 Qwen Coder 系列也在持续迭代。 月之暗面的差异化打法是开源 + 低成本。K2.7 Code 的 API 定价约为 Claude Opus 的五分之一,开源权重允许开发者自行部署,进一步压缩成本。不过 Hacker News 上的开发者讨论也指出,切换到低成本模型后可能需要额外时间修复代码质量问题,Claude 在复杂工程任务中的稳定性仍是付费溢价的来源。
月之暗面官方强调,K2.7 Code 专注编程场景,非编程任务仍推荐使用能力更全面的 K2.6。
局限与注意事项
K2.7 Code 目前尚未提交 SWE-bench、GPQA 等独立基准评测,上述性能数据均来自官方内部评测,开发者在做模型选型时需留意这一点。此外,编程 Agent 的多轮调用和自动重试会导致 Token 消耗快速增长,官方建议在运行长程任务前设置项目日消费预算。数据隐私方面,部分海外企业因合规限制无法将代码数据发送至中国服务器,这是 Kimi 系列模型拓展国际市场的已知障碍。