商汤SenseNova-SI模型空间智能碾压GPT-5?国产AI更进一步!

2025-11-11 14:33
阅读27

2025年11月10日,商汤正式发布并开源SenseNovaSI系列空间智能大模型,涵盖2B与8B两个版本。

该系列模型在多个空间智能基准测试中均表现突出,其中SenseNovaSI8B模型在VSIBench、MMSIBench、MindCubeTiny与ViewSpatial四个核心任务上获得60.99的平均成绩,不仅大幅领先Qwen3VL8B(40.16)、BAGEL7B(35.01)等同级别开源通用模型,以及SpatialMLLM(35.05)、ViLaSR7B(36.41)等专注空间理解的模型。

值得注意的是,在保持8B参数规模的前提下,该模型的平均成绩已领先GPT5(49.68)与Gemini2.5Pro(48.81)。

image.png

此次性能跃升,得益于商汤在训练机制上的系统性设计,其研究团队构建了“空间能力分类体系”,并扩充空间理解数据规模,首次在该领域验证了“尺度效应”的存在。

这一技术突破也回应了当前多模态大模型面临的核心挑战之一:空间智能短板仍未补齐。尽管当前大模型在语言、代码、逻辑推理等任务上已展现出较强性能,但在需要空间理解能力的场景中,仍容易“栽跟头”。

例如,GPT5可以正确解出复杂图形逻辑题,但面对判断立方体俯视图这类空间题时,却出现了明显错误。这类题对人类儿童来说往往是直觉判断,却仍难住了顶级模型。

image.png

SenseNovaSI的构建与训练聚焦空间理解,其开源也为大模型在空间智能方向上的能力优化,提供了新的样本。

GitHub:

https://github.com/OpenSenseNova/SenseNovaSI

Hugging Face:

https://huggingface.co/collections/sensenova/sensenovasi

0
好文章,需要你的鼓励