5月12日消息,xAI向SuperGrok付费用户小范围推送Skills功能,在Anthropic于2025年10月发布Claude Skills整整7个月后,Grok终于补上可重用技能这一基础设施。多个测试用户在X平台晒出的演示视频显示,Grok Skills界面已包含color、docx、finance、pdf、pptx、skill-creator六款预置技能,支持通过.zip、.skill、.md三种格式导入外部技能文件,运行于隔离沙盒环境中并可调用Connectors体系访问Gmail、GitHub、Notion等外部服务。这次rollout把Grok从一次性聊天工具升级为可持久化的工作空间产品。 功能拆解:三字段创建 + 六款预置 + 自然语言调用
Grok Skills的创建界面采用业界已经标准化的三字段结构:Name(技能名)、Description(描述)、Instruction(指令模板),用户填写后保存即可在任意会话中通过"use the [skill name] skill and do..."这一自然语言指令调用。除了手动创建,系统还提供"使用Grok创建技能"入口,内置的skill-creator技能可以根据用户的自然语言需求自动生成完整的SKILL.md文件——演示视频中,有用户用skill-creator现场生成了一个控制Windows PC的技能(支持截屏、鼠标键盘操作)和一个基于ffmpeg的视频编辑技能。
六款Bundled Skills的命名值得重点关注。docx、pdf、pptx三款与Anthropic开源skills仓库中提供的核心文档处理技能命名完全一致,Anthropic在其GitHub仓库中明确把这四款技能(docx、pdf、pptx、xlsx)定义为驱动Claude生产级文档能力的核心实现,以source-available许可对外发布。Grok采用相同的命名体系,意味着xAI很可能直接兼容Anthropic的SKILL.md格式标准,这也是为什么Grok能够接受.md文件直接导入的技术前提。Color(色彩处理)和Finance(金融分析)是Grok在Anthropic六款之外补充的差异化方向,前者可能服务于Grok Imagine的图像生成场景,后者契合xAI Heavy层级用户中较大占比的量化交易和研究团队。
技能运行在沙盒环境中,可以编辑文件、调用Connectors、执行代码,这套架构与Claude Code、Claude.ai的Skills执行环境基本对位。沙盒边界的存在意味着用户技能在调用Gmail或GitHub这类敏感Connector时,xAI需要给出与Anthropic的Computer Use同等级别的权限治理方案,这部分官方文档目前仍未公开。 对位Claude Skills和ChatGPT Skills:7个月时间差与格式兼容
Anthropic在2025年10月发布Claude Skills,定义了SKILL.md+YAML frontmatter+脚本资源+bundled assets的完整目录结构标准,并开源了大部分skill实现。OpenAI在Codex体系中跟进Skills+Plugins架构,Cursor、Gemini CLI、Codex等agent编码工具陆续接入。第三方开放市场如mdskills.ai已经覆盖27个以上的AI agent平台,Claude Skills的目录结构事实上成为行业格式。 Grok作为最晚跟进的主流玩家,选择的策略是格式兼容而非另起标准。这一选择对ChooseAI类内容生产场景的用户有直接价值:已经为Claude Code或OpenClaw写过的skills.md文件可以无缝迁移到Grok环境,无需重新调整目录结构或frontmatter字段。已经积累过新闻整理、SEO写作、价值筛选这类工作流skill的运营团队,可以把同一套SKILL.md分发到Claude、Codex、Grok三个执行环境验证差异,这是过去半年agent skill生态走向标准化的最直接收益。
差异化主要体现在两点。第一是上下文窗口:Grok 4.20 Beta提供2M token context(Heavy层级),Grok 4.3的API版本提供1M context,远超Claude Sonnet 4.6的1M beta和GPT-5.5的标准256K上下文。对于需要在单次会话中处理大量参考资料的研究型技能(完整代码库分析、长报告生成、多文档交叉对比),Grok Skills在原生上下文承载能力上有结构性优势。第二是与X平台的实时数据集成:Grok独有的X实时帖子和DeepSearch能力可以被skill直接调用,这是新闻类、舆情类、社交监测类技能的天然主场。
ChatGPT Skills的优势在生态完整度——OpenAI Developers插件、Computer Use、Statsig集成、企业级治理在5月12日同步推出;Claude Skills的优势在文档严谨度和skill-creator自进化机制的成熟度,Anthropic在公开仓库中详细记录了iteration评估、baseline对比、并行test case等skill迭代方法论。Grok目前在这两个维度都偏弱,官方文档仍未发布是最直接的短板。
在Grok产品矩阵中的定位:Custom Agents粗粒度+Skills细粒度+Connectors
Grok Skills不是xAI在工作流自动化方向上的第一步。2026年3月4日,Grok推出Custom Agents,允许用户配置完整的agent人格、工具组合和指令集;5月6日,Connectors功能上线,深度集成Google Workspace、Notion、GitHub等常用工具,可直接操作邮件、幻灯片、代码仓库;5月7日意外短暂曝光的Grok Computer展示了完整的桌面自动化能力。Skills在这套矩阵中扮演的角色是更细粒度的可分享指令块——Custom Agents是完整的agent配置,Skills是单一任务的可复用模板,二者在使用场景上有清晰分工。
更具体地看,Skills+Connectors+2M context window的组合解锁了一些Grok独有的产品形态。用户可以创建一个"每日AI新闻整理"技能,在沙盒中调用X实时数据接口拉取头部账号最新帖子,经过价值筛选后写入Notion,最后输出到Gmail——这一整套流程过去需要分散在多个工具中手工拼接,现在可以由单一SKILL.md文件描述并自动化执行。
局限:feature flag未全开、文档缺位、订阅门槛
Grok Skills目前的官方状态仍处于灰度阶段,xAI官网和grok.com均未发布正式公告,SKILL.md的官方格式规范、目录结构标准、与Custom Agents的边界定义都还未公开。早期测试用户主要是SuperGrok($30/月)和SuperGrok Heavy($300/月)层级,免费用户和X Premium($8/月)用户暂时无法使用。沙盒环境的安全边界、Connectors权限粒度、用户技能在外部服务调用上的责任划分,xAI都尚未给出官方说明。考虑到Grok过往多次"先泄露后回应"的发布模式(Grok Computer 5月7日的意外曝光、Grok Build的小范围分发),Skills从灰度到全量推送预计还需要数周时间。这次rollout更像是xAI在Google I/O 2026 keynote前抢一个时间窗口的卡位动作,而非完整意义上的GA。。