谷歌的ai和openai哪个强？谷歌新宠Gemini 3 Flash：速度与性能的双重碾压

2025-12-19 12:05

161

12月18日，谷歌昨天在没有任何预热的情况下，直接把Gemini3 Flash端上桌了，这次升级距离Gemini3 Pro发布才过去一个月，离2.5Pro Flash推出也就半年时间。

Gemini还放出话来，这是他们迄今为止最大的升级。

自从Gemini2.5Pro推出后，江江日常状态，就已经变成了：GG一下，你就知道。

Gemini3发布后，咱也是肉眼可见地，享受到了模型升级的红利。

这次Gemini 3 Flash，Google宣称它的智力水平并没有下降，而且还有速度和效率的双重增益，已经完爆自己上一代旗舰模型Gemini2.5 Pro。

更夸张的是，这还真不是谷歌的自吹自擂，在一种测试里，它和跟那些规模更大的模型顶流们打得有来有回。

而在MMMU Pro测试，Gemini 3 Flash直接拿下81.2%，已经追平了自家全新的旗舰模型3 Pro，

最逆天的是，真给3 Flash逼急眼了，它狠起来都把Gemini3 Pro也顺手给揍了。

在SWE-bench验证的编码基准测试中，Gemini3 Flash得分78%，仅次于GPT-5.2，超过了3 Pro。

更让其它大模型厂商们坐立难安的是，这么优秀的Gemini 3 Flash，价格老鼻子便宜了。

数据显示，它的Token价格只有输入0.5美元/百万Token，输出3美元/百万Token。

什么水平呢，同一个任务，它的花费能比2.5 Pro少三成，而速度反而还能快三倍。

所以，谷歌的人也放出话来，3 Flash的发布，能帮助许多公司更好地完成批量任务，按我们的理解，应该是给这些公司们减负（省钱省时间嘛）。

虽然听起来有点炸裂，但在我们在简单玩了一天后发现，速度这方面，3 Flash确实碾压了，但如果说真在处理任务的准确性啊啥的，要和3 Pro掰掰手腕，感觉还是有点吹过了。

比如我们让3 Flash写了一个“WebRTC的纯前端投屏”，结果是有页面但无法使用，而且我们反复让3 Flash修改，最终也没能debug好。

可当我们把代码扔给3 Pro，老大哥分分钟就给找出了问题所在。

还顺带手，就搓了一份修改版本的代码。

就目前的状态来看，3 Flash优势就是快、便宜，如果真要处理一些长链条思考、高难度任务的时候，还是老老实实用Pro吧。

但如果放在各家的轻量级模型一起比的话，大家伙应该会对3 Flash说，你还是回大人那桌吧。

当然了，谷歌这个时候掏出3 Flash，肯定不是想靠模型能力取胜，在我们看来，他们是想通过生态上的优势，硬生生碾死其他竞争对手。

比如这次3 Flash直接塞进了谷歌搜索的AI模式里，相比之前略显鸡肋的状态，得到了天阶功法的船新谷歌AI搜索，能够更好地理解问题细节，从全网抓取的信息和链接远远强于此前。

肉眼可见的未来里，什么油管、谷歌邮箱、谷歌地图全家桶里，全都塞进Gemini 3 Flash。

这种场面，你是山姆奥特曼，你能睡得着吗？

有意思的是，Gemini3的发布，就已经让奥特曼在OpenAI内部拉响了红色警报。

而在上周，他刚刚在接受采访时表示，谷歌发布的Gemini 3模型对公司业绩指标的影响，没有最初担心的那么大，哥们还放出狠话，准备在明年1月退出红色警报状态。

现在可倒好，被夹在中间，可别到了1月份，红色警报确实是退出了，结果你反手给升级成了黑色警报。

所以吧，Gemini 3 Flash应该只是个前菜，当谷歌生态里的各种网页、APP，能把AI像水电一样廉价地铺满，单纯比拼模型参数的时代或许就要翻篇了。

毕竟在生态这场仗上，留给OpenAI们的时间，真的不多了。

好文章，需要你的鼓励