谷歌的ai和openai哪个强?谷歌新宠Gemini 3 Flash:速度与性能的双重碾压
2025-12-19 12:05
161
12月18日,谷歌昨天在没有任何预热的情况下,直接把Gemini3 Flash端上桌了,这次升级距离Gemini3 Pro发布才过去一个月,离2.5Pro Flash推出也就半年时间。

Gemini还放出话来,这是他们迄今为止最大的升级。
自从Gemini2.5Pro推出后,江江日常状态,就已经变成了:GG一下,你就知道。
Gemini3发布后,咱也是肉眼可见地,享受到了模型升级的红利。
这次Gemini 3 Flash,Google宣称它的智力水平并没有下降,而且还有速度和效率的双重增益,已经完爆自己上一代旗舰模型Gemini2.5 Pro。
更夸张的是,这还真不是谷歌的自吹自擂,在一种测试里,它和跟那些规模更大的模型顶流们打得有来有回。
而在MMMU Pro测试,Gemini 3 Flash直接拿下81.2%,已经追平了自家全新的旗舰模型3 Pro,
最逆天的是,真给3 Flash逼急眼了,它狠起来都把Gemini3 Pro也顺手给揍了。
在SWE-bench验证的编码基准测试中,Gemini3 Flash得分78%,仅次于GPT-5.2,超过了3 Pro。

更让其它大模型厂商们坐立难安的是,这么优秀的Gemini 3 Flash,价格老鼻子便宜了。
数据显示,它的Token价格只有输入0.5美元/百万Token,输出3美元/百万Token。
什么水平呢,同一个任务,它的花费能比2.5 Pro少三成,而速度反而还能快三倍。

所以,谷歌的人也放出话来,3 Flash的发布,能帮助许多公司更好地完成批量任务,按我们的理解,应该是给这些公司们减负(省钱省时间嘛)。
虽然听起来有点炸裂,但在我们在简单玩了一天后发现,速度这方面,3 Flash确实碾压了,但如果说真在处理任务的准确性啊啥的,要和3 Pro掰掰手腕,感觉还是有点吹过了。
比如我们让3 Flash写了一个“WebRTC的纯前端投屏”,结果是有页面但无法使用,而且我们反复让3 Flash修改,最终也没能debug好。

可当我们把代码扔给3 Pro,老大哥分分钟就给找出了问题所在。

还顺带手,就搓了一份修改版本的代码。

就目前的状态来看,3 Flash优势就是快、便宜,如果真要处理一些长链条思考、高难度任务的时候,还是老老实实用Pro吧。
但如果放在各家的轻量级模型一起比的话,大家伙应该会对3 Flash说,你还是回大人那桌吧。
当然了,谷歌这个时候掏出3 Flash,肯定不是想靠模型能力取胜,在我们看来,他们是想通过生态上的优势,硬生生碾死其他竞争对手。
比如这次3 Flash直接塞进了谷歌搜索的AI模式里,相比之前略显鸡肋的状态,得到了天阶功法的船新谷歌AI搜索,能够更好地理解问题细节,从全网抓取的信息和链接远远强于此前。
肉眼可见的未来里,什么油管、谷歌邮箱、谷歌地图全家桶里,全都塞进Gemini 3 Flash。
这种场面,你是山姆奥特曼,你能睡得着吗?
有意思的是,Gemini3的发布,就已经让奥特曼在OpenAI内部拉响了红色警报。
而在上周,他刚刚在接受采访时表示,谷歌发布的Gemini 3模型对公司业绩指标的影响,没有最初担心的那么大,哥们还放出狠话,准备在明年1月退出红色警报状态。
现在可倒好,被夹在中间,可别到了1月份,红色警报确实是退出了,结果你反手给升级成了黑色警报。
所以吧,Gemini 3 Flash应该只是个前菜,当谷歌生态里的各种网页、APP,能把AI像水电一样廉价地铺满,单纯比拼模型参数的时代或许就要翻篇了。
毕竟在生态这场仗上,留给OpenAI们的时间,真的不多了。
0
好文章,需要你的鼓励
