谷歌发布更有效率Gemini 3 Flash,多项基准创新高

2025-12-18 11:59
191
Alphabet旗下谷歌最强人工智能模型Gemini 3 Pro发布才过去一个月,乘势进一步向OpenAI发起挑战,推出更具效率、更经济的人工智能模型。 美东时间12月17日,谷歌官宣推出Gemini3家族的新成员Gemini3Flash。这款主打快速高效的新模型发布当天即取代Gemini2.5Flash成为Gemini App的默认模型,并同步成为谷歌搜索AI模式的默认驱动系统。

据介绍,Gemini3Flash在多项基准测试中展现出接近甚至超越更大型模型的表现。
在SWE-bench Verified基准测试中,Gemini3Flash的解决率达到78%,仅次于GPT-5.2的80%,不仅超越Gemini2.5系列,甚至优于同门的Gemini3Pro,Pro的准确率为76.2%。 另外,3Flash拥有前沿的智能技术,速度更快,价格却远低于同类产品。
3Flash基于3Pro强大的多模态、编码和智能体功能,在价格不到3Pro四分之一的情况下,提供了更强大的性能和更高的速率限制。新款3Flash在多项基准测试中超越了2.5Pro,速度更快。模型还配备了我们最先进的视觉和空间推理功能,并新增了代码执行功能,可用于缩放、计数和编辑视觉输入。
在Gemini API和Vertex AI中,Gemini3Flash的定价为每百万个输入令牌0.50美元,每百万个输出令牌3美元(音频输入仍为每百万个输入令牌1美元)。它标配上下文缓存,在令牌重复使用超过特定阈值的情况下,可节省90%的成本。同样,3Flash目前也适用于Batch API,可节省50%的成本,并大幅提高异步处理的速率限制。对于同步和近实时用例,付费API客户还可以使用生产就绪的速率限制。
谷歌DeepMind的Gemini产品管理高级总监Tulsee Doshi称,谷歌将Flash定位为老黄牛式的模型。该模型保持了接近Gemini3Pro的推理能力,同时运行速度达到Gemini2.5Pro的三倍,成本仅为Gemini3Pro的四分之一。
在博士级推理和知识基准GPQA Diamond上,Gemini3Flash的得分为90.4%。虽然低于GPT-5.2的92.4%和Gemini3Pro的91.9%,但其他对手得分还都不到90%。
在保持智能的同时,3Flash实现了极高的效率,突破了性能与效率的帕累托极限。它的性能超越了2.5Pro,速度提升了3倍(基于人工智能分析基准测试),而成本却远低于后者。即使在最低的智能水平下,3Flash的性能也常常优于之前版本在高智能水平下的表现。
0
好文章,需要你的鼓励