商汤SenseNova-SI模型空间智能碾压GPT-5？国产AI更进一步！

2025-11-11 14:33

2025年11月10日，商汤正式发布并开源SenseNovaSI系列空间智能大模型，涵盖2B与8B两个版本。

该系列模型在多个空间智能基准测试中均表现突出，其中SenseNovaSI8B模型在VSIBench、MMSIBench、MindCubeTiny与ViewSpatial四个核心任务上获得60.99的平均成绩，不仅大幅领先Qwen3VL8B（40.16）、BAGEL7B（35.01）等同级别开源通用模型，以及SpatialMLLM（35.05）、ViLaSR7B（36.41）等专注空间理解的模型。

值得注意的是，在保持8B参数规模的前提下，该模型的平均成绩已领先GPT5（49.68）与Gemini2.5Pro（48.81）。

此次性能跃升，得益于商汤在训练机制上的系统性设计，其研究团队构建了“空间能力分类体系”，并扩充空间理解数据规模，首次在该领域验证了“尺度效应”的存在。

这一技术突破也回应了当前多模态大模型面临的核心挑战之一：空间智能短板仍未补齐。尽管当前大模型在语言、代码、逻辑推理等任务上已展现出较强性能，但在需要空间理解能力的场景中，仍容易“栽跟头”。

例如，GPT5可以正确解出复杂图形逻辑题，但面对判断立方体俯视图这类空间题时，却出现了明显错误。这类题对人类儿童来说往往是直觉判断，却仍难住了顶级模型。

SenseNovaSI的构建与训练聚焦空间理解，其开源也为大模型在空间智能方向上的能力优化，提供了新的样本。

GitHub：

https://github.com/OpenSenseNova/SenseNovaSI

Hugging Face：

https://huggingface.co/collections/sensenova/sensenovasi

好文章，需要你的鼓励