6月3日消息,微软在Build 2026上发布Surface RTX Spark Dev Box,一台搭载NVIDIA RTX Spark超级芯片的紧凑型台式机,面向AI开发者。核心规格:NVIDIA Blackwell架构RTX GPU + Grace ARM CPU组合,128GB统一内存,最高1 petaflop AI算力,100W热设计功耗,可在本地运行1200亿参数以上模型并支持100万token上下文,无需任何云端API调用。
微软Windows与设备执行副总裁Pavan Davuluri在发布前吹风会上表示,这类设备预计可运行约1000亿参数级别的模型。定价未公布,参考同芯片的NVIDIA DGX Spark($3,999起,因内存供应紧张已涨至$4,699)和AMD Ryzen AI Halo PC($3,999),行业分析师预估Surface RTX Spark Dev Box售价在$3,000-$3,500区间。年内通过微软在线商店发售,目前仅确认美国市场。
硬件规格:Blackwell GPU + Grace ARM CPU,开发者开箱即用
RTX Spark超级芯片采用ARM架构,将NVIDIA Blackwell RTX GPU与Grace CPU集成在单一封装中。20个ARM CPU核心,6,144个Blackwell CUDA核心,128GB统一内存池——GPU和CPU共享同一内存空间,无需在显存和系统内存之间搬运数据。这是本地运行大参数模型的关键:传统独立显卡方案中24GB显存无法装入1200亿参数模型,必须将权重卸载到更慢的系统内存。
机身为铝合金3D打印外壳,顶部1000个方形散热孔(对应1000 teraflops算力),设计风格接近Xbox Series X。接口包括两个USB-C、USB-A、HDMI、以太网和耳机孔。100W持续功耗设计意味着可承受长时间训练任务、Agent流水线和本地模型微调,这是同芯片笔记本版(45-80W)做不到的。
预装软件栈面向开发者优化:Windows 11 Pro开发者配置、Visual Studio Code、GitHub Copilot、WSL2(原生GPU直通+完整CUDA支持)、PowerShell 7、Git、Python、Node.js、AI Toolkit for VS Code、Windows ML、Windows Copilot Runtime。开箱即可开始AI开发,无需手动配置环境。
安全方面为Secured-core PC架构,支持BitLocker、Microsoft Defender、Entra ID和Intune,面向处理敏感数据和专有模型的企业开发团队。
为什么微软要造这台机器:本地算力改变AI开发的成本方程
微软官方博客的核心论点是:AI模型越来越大,Agent工作流需要持续计算,每次迭代都会产生云端成本——即便很多工作根本不需要前沿模型。Surface RTX Spark Dev Box改变的是这个成本方程:开发者可以把前沿模型调用留给真正需要前沿能力的问题,其余工作在本地完成。
这与Build 2026的整体叙事高度一致。微软同时发布了MXC安全容器(本地Agent隔离)、Aion本地模型(14B参数随Windows出厂)、Scout智能体(基于OpenClaw本地运行),所有这些软件层都需要一个足够强的本地硬件底座。Surface RTX Spark Dev Box就是微软给出的硬件答案。
对于独立开发者和小团队来说,更直接的价值在于:CUDA生态的完整兼容性。在Surface RTX Spark Dev Box上运行的代码、库和工作流,可以不做任何修改直接迁移到云端NVIDIA GPU实例、DGX Station甚至DGX SuperPOD。这种从桌面到数据中心的代码可移植性,是Apple Silicon目前无法完全匹配的——尽管Apple的Metal框架在推理性能和能效比上有自己的优势。
竞品对比:DGX Spark、Mac Studio和AMD Strix Halo
Surface RTX Spark Dev Box进入的是一个已有多个竞品的细分市场。
NVIDIA DGX Spark是最直接的对标。两者使用相同的RTX Spark芯片和128GB统一内存,核心算力规格一致。区别在于:DGX Spark运行定制Ubuntu,Surface RTX Spark Dev Box运行Windows 11 Pro;DGX Spark配备200Gbps NIC(面向集群互联),Surface版本没有;DGX Spark定价$4,699(涨价后),Surface版本预计更低。对于需要Windows生态(VS Code、Copilot、WSL、Intune企业管控)的开发者,Surface版本是更自然的选择。
Apple Mac Studio M4 Ultra($4,400起)提供更高的内存带宽和静音运行,在推理吞吐量和创意工作负载上有优势。但CUDA生态兼容性是Mac Studio的短板——绝大多数AI训练和推理框架优先针对CUDA开发和测试。
AMD Ryzen AI Halo PC($3,999)走ROCm路线,价格更低但软件生态成熟度不及CUDA。
微软此前有过类似尝试——2022年发布的Windows Dev Kit 2023(基于Snapdragon)生命周期很短。Surface RTX Spark Dev Box能否避免同样命运,取决于NVIDIA RTX Spark芯片在开发者社区的实际采纳度。
需要注意的局限
定价和具体上市时间均未公布,产品页面标注"Pre-release product, features are subject to change prior to launch"且尚未通过FCC认证。128GB统一内存虽然是同价位最大容量,但内存带宽(DGX Spark的273 GB/s已被批评偏低)可能成为token生成速度的瓶颈——多个评测者记录DGX Spark在持续负载20-30分钟后出现性能下降。全球内存供应紧张(LPDDR5x短缺已导致DGX Spark涨价18%、多款Mac型号缺货),Surface RTX Spark Dev Box的供货稳定性存在不确定性。此外,ARM架构上的Windows软件兼容性虽然持续改善,但部分开发工具和AI框架可能仍存在适配问题。