GPT5.2怎么用？GPT5.2实测

2025-12-16 10:51

新鲜出炉的GPT5.2又一次成“最强”了

在AIME 2025（竞赛数学）拿满分，在ARC-AGI-2（视觉推理）上拿到了52.9%（翻了三倍，和Gemini3相当），在SWE-Bench Pro（软件工程）、GPQA Diamond（科学问题）上也抢回第一了，

256K文档的四针测试正确率离谱到100%，知识截止日期也更新到25年8月份了。

怪不得之前有人P图GPT5.2全系第一

OpenAI想测试模型在真实世界对GDP的贡献，可以说是赚钱能力，

GDPval这数据集就是从银行那调取的信息，选出对美國GDP贡献最大的9个行业中选出的44种职业，1,320个专业任务，每个任务都由平均有14年以上领域经验的专业人士设计，任务本体包含了参考文件和背景信息，预期的输出涵盖文档、ppt、图表、电子表格和多媒体。

用同一个手柄提示语，用instant，thinking和pro生成的三张图，

SVG code for Xbox controller

所以我后面干脆改用GPT5.2（无后缀版）抽卡了，

总的来说，模型写出来的代码都挺好看，

但性能没太大进步。

最后，来测试看看GPT5.2的写作能力吧，

既然都囊括了44种职业了，那文案是不是也要拉上来。我基本都是一个固定提示语测试，太短了看不出AI味，太多提示语限制的话看不出最低下限

写一篇千字的中文科技小说篇章

尽力了，3k字压成图片传上来还是有点糊的。

怎么说呢，GPT5.2的AI味还是重，破折号双引号冒号顿号，固定的不是、而是的句式还是时不时会弹出来，但是这个故事的本身设定我还是很喜欢的，不再完美的AI零七和被算法讨厌的噪音工程师林佑的联手还蛮有看点的。

最后想说，GPT-5.1三个月后也会下线，我们又一次告别了一个GPT开头的模型。

GPT5.2发布当天，OpenAI十周年这周，奥特曼写了一封公开信《Ten Years》。

他说，再过十年，我们几乎肯定能造出超级智能。

实话说，我对OpenAI的感情是复杂的，Gemini 3.0 Pro独一档强，Claude基本不能用的情况下，我真心希望GPT5.2能支棱起来，别真被彻底超过了。

好文章，需要你的鼓励