GPT5.2怎么用?GPT5.2实测

2025-12-16 10:51
90

新鲜出炉的GPT5.2又一次成“最强”了

在AIME 2025(竞赛数学)拿满分,在ARC-AGI-2(视觉推理)上拿到了52.9%(翻了三倍,和Gemini3相当),在SWE-Bench Pro(软件工程)、GPQA Diamond(科学问题)上也抢回第一了,

256K文档的四针测试正确率离谱到100%,知识截止日期也更新到25年8月份了。

怪不得之前有人P图GPT5.2全系第一

image.png

OpenAI想测试模型在真实世界对GDP的贡献,可以说是赚钱能力,

GDPval这数据集就是从银行那调取的信息,选出对美國GDP贡献最大的9个行业中选出的44种职业,1,320个专业任务,每个任务都由平均有14年以上领域经验的专业人士设计,任务本体包含了参考文件和背景信息,预期的输出涵盖文档、ppt、图表、电子表格和多媒体。

857e2867d86a41bebb87321c28b968f2.png

用同一个手柄提示语,用instant,thinking和pro生成的三张图,

SVG code for Xbox controller

image.png

所以我后面干脆改用GPT5.2(无后缀版)抽卡了,

总的来说,模型写出来的代码都挺好看,

但性能没太大进步。

最后,来测试看看GPT5.2的写作能力吧,

既然都囊括了44种职业了,那文案是不是也要拉上来。我基本都是一个固定提示语测试,太短了看不出AI味,太多提示语限制的话看不出最低下限

写一篇千字的中文科技小说篇章

image.png

尽力了,3k字压成图片传上来还是有点糊的。

怎么说呢,GPT5.2的AI味还是重,破折号双引号冒号顿号,固定的不是、而是的句式还是时不时会弹出来,但是这个故事的本身设定我还是很喜欢的,不再完美的AI零七和被算法讨厌的噪音工程师林佑的联手还蛮有看点的。

最后想说,GPT-5.1三个月后也会下线,我们又一次告别了一个GPT开头的模型。

GPT5.2发布当天,OpenAI十周年这周,奥特曼写了一封公开信《Ten Years》。

他说,再过十年,我们几乎肯定能造出超级智能。

实话说,我对OpenAI的感情是复杂的,Gemini 3.0 Pro独一档强,Claude基本不能用的情况下,我真心希望GPT5.2能支棱起来,别真被彻底超过了。

0
好文章,需要你的鼓励