谷歌发布更有效率Gemini 3 Flash，多项基准创新高

2025-12-18 11:59

191

Alphabet旗下谷歌最强人工智能模型Gemini 3 Pro发布才过去一个月，乘势进一步向OpenAI发起挑战，推出更具效率、更经济的人工智能模型。美东时间12月17日，谷歌官宣推出Gemini3家族的新成员Gemini3Flash。这款主打快速高效的新模型发布当天即取代Gemini2.5Flash成为Gemini App的默认模型，并同步成为谷歌搜索AI模式的默认驱动系统。

据介绍，Gemini3Flash在多项基准测试中展现出接近甚至超越更大型模型的表现。

在SWE-bench Verified基准测试中，Gemini3Flash的解决率达到78%，仅次于GPT-5.2的80%，不仅超越Gemini2.5系列，甚至优于同门的Gemini3Pro，Pro的准确率为76.2%。另外，3Flash拥有前沿的智能技术，速度更快，价格却远低于同类产品。

3Flash基于3Pro强大的多模态、编码和智能体功能，在价格不到3Pro四分之一的情况下，提供了更强大的性能和更高的速率限制。新款3Flash在多项基准测试中超越了2.5Pro，速度更快。模型还配备了我们最先进的视觉和空间推理功能，并新增了代码执行功能，可用于缩放、计数和编辑视觉输入。

在Gemini API和Vertex AI中，Gemini3Flash的定价为每百万个输入令牌0.50美元，每百万个输出令牌3美元(音频输入仍为每百万个输入令牌1美元)。它标配上下文缓存，在令牌重复使用超过特定阈值的情况下，可节省90%的成本。同样，3Flash目前也适用于Batch API，可节省50%的成本，并大幅提高异步处理的速率限制。对于同步和近实时用例，付费API客户还可以使用生产就绪的速率限制。

谷歌DeepMind的Gemini产品管理高级总监Tulsee Doshi称，谷歌将Flash定位为老黄牛式的模型。该模型保持了接近Gemini3Pro的推理能力，同时运行速度达到Gemini2.5Pro的三倍，成本仅为Gemini3Pro的四分之一。

在博士级推理和知识基准GPQA Diamond上，Gemini3Flash的得分为90.4%。虽然低于GPT-5.2的92.4%和Gemini3Pro的91.9%，但其他对手得分还都不到90%。

在保持智能的同时，3Flash实现了极高的效率，突破了性能与效率的帕累托极限。它的性能超越了2.5Pro，速度提升了3倍(基于人工智能分析基准测试)，而成本却远低于后者。即使在最低的智能水平下，3Flash的性能也常常优于之前版本在高智能水平下的表现。

好文章，需要你的鼓励