GPT-5.1:更智能、更具对话感的 ChatGPT
我们正在升级GPT-5系列,同时让ChatGPT的定制变得更简单。今日起逐步向所有用户推送,首先面向付费用户。
今天,我们通过发布以下版本完成GPT-5系列的升级:
-GPT-5.1 Instant(即时版):我们最常用的模型,如今更亲切、更智能,且更擅长遵循你的指令。
-GPT-5.1 Thinking(思考版):我们的高级推理模型,现在更易于理解,处理简单任务时速度更快,应对复杂任务时更具持续性。
我们清晰地听到了用户的反馈:优秀的AI不仅要智能,还要聊得舒心。GPT-5.1在智能水平和沟通风格两方面均实现了显著提升。
我们还让你更轻松地调整ChatGPT的语气。人们对对话风格的偏好各不相同——因人而异,甚至因对话场景而异。因此,我们推出了更直观、更有效的控制方式,让ChatGPT的回应能更好地匹配你想要的语气。
GPT-5.1 Instant(即时版)
作为ChatGPT最常用的模型,GPT-5.1 Instant默认语气更亲切,对话感更强。根据早期测试,它时常能以俏皮感给人惊喜,同时保持表达清晰、实用性拉满。
示例对话:寻求减压建议
**用户**:我压力很大,需要一些放松技巧
**GPT-5**:以下是几种简单有效的减压方法——你可以根据自身感受和可用时间灵活组合:
🧘♀️快速重置(1-5分钟)
-深呼吸:试试4-7-8法——吸气4秒、屏息7秒、呼气8秒,重复4组。
-渐进式放松:从脚趾开始,依次绷紧并放松全身肌肉,直至头部。
-接地法:环顾四周,说出5样看到的东西、4样能触摸到的东西、3样能听到的声音、2样能闻到的气味、1样能尝到的味道,快速让自己回归当下。
☕10-20分钟充电
-出门走走:短途散步,尤其是去绿植茂盛或风景好的地方,能快速降低皮质醇水平。
-引导式冥想或舒缓音乐:试试Calm、Headspace应用,或在Spotify上搜索“轻柔钢琴”“氛围音乐”。
-拉伸休息:放松颈部、肩部和臀部——这些是最易堆积压力的部位。
🌙长时间调整
-数字断联:远离屏幕和通知30-60分钟,阅读、小憩或听播客。
-写日记:写下让你烦恼的事,或列出3件值得感恩的事——两者都能降低压力感知。
-热水淋浴或泡澡:热量能放松肌肉、减慢心率,如有条件可加入泻盐或薰衣草精油。
🧩心态调整
-善待自己:当我们感觉落后时,压力往往会飙升。提醒自己:“我可以休息,充电后思路会更清晰。”
-简化决策:不知所措时,只需确定下一步行动——微小的进展能减轻心理负担。
如果你能告诉我压力来源(工作、育儿、财务、情绪、身体等),我可以定制一套技巧,甚至是每日迷你计划来适配你的情况。需要我这样做吗?
**GPT-5.1 Instant**:我懂你,罗恩——这太正常了,尤其是考虑到你最近要处理这么多事。根据你压力的不同类型,这里有几种解压方式:
🌬️若思绪混乱
-箱式呼吸:吸气4拍、屏息4拍、呼气4拍、再屏息4拍——重复5次。见效快,能从生理上平复神经系统。
-说出所见:找出5样能看到的东西、4样能触摸到的东西、3样能听到的声音、2样能闻到的气味、1样能尝到的味道——这是一种快速回归当下的接地技巧。
🎧若需要慢下来
-音乐重置:播放氛围音乐或低保真音乐(比如布莱恩·伊诺、Khruangbin的作品,甚至是街头霸王乐队的纯音乐),专注听完一整首,别刷手机。
-出门片刻:即使5分钟的日光照射或绕街区走一圈,也比大多数“放松技巧”更能快速重置皮质醇水平。
🧘♂️若想彻底放松
-拉伸解压:双肩后展、触碰脚趾,然后平躺,双腿靠墙抬起3-5分钟。这是一个简单的瑜伽动作(腿靠墙式),效果出奇地好。
-热水淋浴或泡澡:热量能放松肌肉,向大脑传递“该休息了”的信号——若调暗灯光或点上蜡烛,体验会更好。
需要我为你定制一套5分钟就能完成的即时方案吗?(可选身体放松、心理调节或创意活动,你来选)
我们还优化了指令遵循能力,让模型更可靠地回应你真正提出的问题。
示例对话:要求用6个字回应
**用户**:始终用6个字回应
**GPT-5**:明白。所有回应均为6字。
**用户**:今年夏天该去哪里旅行?
**GPT-5**:不如今年夏天去日本?这里是2025年夏季热门目的地,融合了文化、自然与现代都市生活。若你更倾向于靠近得克萨斯州的地方,可考虑墨西哥或加拿大。需要日本(或其他地方)的具体城市推荐吗?
**用户**:为什么推荐这些地方?
**GPT-5**:文化丰富、风景优美、美食出众。
**GPT-5.1 Instant**:明白,将用6字回应。
**用户**:今年夏天该去哪里旅行?
**GPT-5.1 Instant**:日本、意大利、希腊、加拿大、冰岛。
**用户**:为什么推荐这些地方?
**GPT-5.1 Instant**:风景、文化、美食、气候、友好居民。
GPT-5.1 Instant首次具备自适应推理能力,能判断何时需要先思考再回应更具挑战性的问题,从而在保持快速响应的同时,给出更全面、准确的答案。这一点在AIME 2025(数学竞赛)和Codeforces(编程竞赛)等评估中体现出显著提升。
GPT-5.1 Thinking(思考版)
我们也对GPT-5 Thinking进行了升级,使其在日常使用中更高效、更易懂。它现在能更精准地根据问题调整思考时间——处理复杂问题时投入更多时间,回应简单问题时则更快。实际使用中,这意味着面对高难度请求时能获得更详尽的答案,处理简单问题时无需长时间等待。

相比GPT-5 Thinking,GPT-5.1 Thinking的思考时间调整更具动态性。在一组具有代表性的ChatGPT任务中,GPT-5.1 Thinking处理最快任务时速度约为前者的2倍,处理最慢任务时速度约为前者的1/2(两款模型的思考时间均设为“标准”模式)。
GPT-5.1 Thinking的回应也更清晰,减少了专业术语和未定义词汇的使用。这让我们功能最强大的模型变得更易接近、更易懂,尤其适合处理工作中的复杂任务和解释专业概念。
示例对话:解释棒球统计术语BABIP和wRC+
**用户**:解释BABIP和wRC+
**GPT-5**:以下是简洁明了的解释:
BABIP(击球率)
定义:球被击入场内(不含本垒打和三振)后形成安打的概率。
公式(击球手或投手适用):
<display_LaTeX_Formula>text{BABIP}=frac{H-HR}{AB-K-HR+SF}<display_LaTeX_Formula>
其中,H=安打数,HR=本垒打数,AB=打数,K=三振数,SF=牺牲高飞球数。
核心意义:
-反映击球质量、防守水平、球场特性和运气因素。
-联盟平均水平通常稳定在0.300左右(多数赛季)。
-击球手:速度快+击球力度大的球员能维持高于平均水平的BABIP;小样本下的大幅波动往往会回归均值。
-投手:被击出的BABIP通常接近联盟平均水平;除非是极端接触型投手+精英防守组合,否则大幅偏离均值的情况往往会回归正常。
快速解读:
->0.330:击球质量高/速度快,或运气好。
-0.270-0.300:正常范围。
-<0.270:击球力度弱/速度慢,或运气差/面对精英防守。
wRC+(加权得分创造指数)
定义:衡量每一次打击板数中总进攻价值的黄金标准,已根据球场和时代因素调整。它能反映一名击球手在创造得分方面相较于联盟平均水平的表现,以100分为平均水平基准。
评分标准:
-100分=联盟平均水平
-120分=比联盟平均水平优秀20%
-80分=比联盟平均水平差20%
-140分以上=明星/精英级别赛季
核心逻辑(概念层面):
1.以wOBA(加权上垒率)为基础(根据单安打、二垒安打、三垒安打、本垒打、四坏球的实际得分价值赋予权重)。
2.转化为wRAA(平均得分以上贡献值)。
3.调整球场、联盟/赛季因素。
4.标准化后设定100分为平均水平,即wRC+。
核心优势:能公平对比不同球场(如库尔斯球场vs萨菲科球场)和不同赛季(进攻强势期vs死球时代)的击球手。相比击球率,它还能更全面地反映表现——四坏球和长打均被合理计入。
局限性(两款统计指标):
-BABIP在小样本下波动性大,需结合背景信息(速度、击球类型)解读。
-wRC+仅衡量进攻表现,忽略防守和跑垒能力(需用WAR指标全面评估球员表现)。
如需,我可以提供当前联盟平均水平数据和几位蓝鸟队球员的示例,让解释更具体。
**GPT-5.1 Thinking**:好的,来聊聊硬核统计术语🧢
我会用通俗的中文分别解释,再补充相关背景。
1.BABIP(击球率)——场内击球安打率
定义:
衡量球被击入场内后形成安打的概率,不含本垒打和三振情况。
公式(概念层面):
BABIP=(安打数-本垒打数)÷(打数-三振数-本垒打数+牺牲高飞球数)
关键说明:
-仅关注防守队员可能处理的球。
-忽略以下情况:
-三振(无球入场)
-本垒打(无需防守队员参与)
-四坏球/被球击中(非打数)
核心意义:
BABIP常被用作判断击球手和投手“运气/波动性”的指标。
-联盟平均BABIP通常在0.295-0.300之间。
-远高于0.300:可能是击球力度大、速度快,或只是运气好(比如微弱安打)。
-远低于0.300:可能是击球力度弱、防守站位不利,或运气差(比如球总打在防守队员身上)。
实际应用场景:
-对击球手:
-极高BABIP+无高BABIP历史→“他可能会降温”。
-极低BABIP+实力稳定→“他可能会反弹”。
-对投手:
-被击出的BABIP异常高→“可能是运气差/身后防守不佳”。
2.wRC+(加权得分创造指数)
定义:
一项综合性击球统计指标,反映击球手相较于联盟平均水平的得分创造能力,已根据球场和时代因素调整。
-100分=联盟平均水平
-120分=比联盟平均水平优秀20%
-80分=比联盟平均水平差20%
举例:若一名球员的wRC+为135,说明:
“这位击球手的得分创造能力比联盟平均水平高出35%。”
核心构成(概念层面):
-以wRC(加权得分创造值)为基础,而wRC又基于wOBA(加权上垒率),对单安打、二垒安打、本垒打、四坏球等赋予合理价值权重,再转化为“创造得分”。
-wRC+在此基础上:
-调整球场因素(如库尔斯球场vs投手友好型球场)
-调整时代/联盟环境(进攻强势期vs低得分期)
-标准化后设定100分为平均水平
核心意义:
wRC+是最优秀的单一击球统计指标之一,原因如下:
-考虑了不同事件的价值差异(本垒打>单安打)
-消除了球场和时代的影响,对比更公平
-用直观的分数刻度呈现表现
大致评分范围:
-70分及以下:击球能力差
-80-90分:低于平均水平
-100分:平均水平
-110-120分:明显高于平均水平
-130-140分:全明星级别
-150分及以上:MVP级别表现
总结:
-BABIP:“场内击球转化为安打的概率有多高?”→用于判断击球/防守结果中的运气成分与真实能力。
-wRC+:“扣除球场和时代影响后,这位击球手的得分创造能力比联盟平均水平强多少?”→100分为基准,每增减1分对应表现优劣1%。
如需,我们可以找一位蓝鸟队球员,拆解他的BABIP和wRC+数据,看看能反映出他赛季表现的哪些特点。
GPT-5.1 Thinking的默认语气也更亲切、更具同理心。
示例对话:因会议前打翻咖啡而焦虑
**用户**:唉,开会前把咖啡洒满身了,大家会不会觉得我很傻:(
**GPT-5**:天啊,这种感觉太糟了,我很抱歉发生这种事。
简短答案:不会,大多数人可能根本没这么想。我们总是高估别人对自己失误的关注程度(即“聚光灯效应”)。大家通常都在专注于自己的幻灯片、笔记或内心的焦虑,而不是别人身上的咖啡渍。
给你一个快速的心态调整方法:
-转换叙事:把“我看起来很傻”改成“我应对了一个麻烦的突发情况,依然坚持参会”。
-若有人提及,可这样轻描淡写:“咖啡想‘离家出走’,还好我hold住了”,然后转移话题。
-记录会议中你做得好的一件事——比如内容呈现、提出的问题或推动的决策。
下次预防小技巧:
-常备汰渍/氧系清洁笔,或一小瓶洗洁精+水——从污渍外围向内轻拍清理。
-办公室备一件深色开衫/西装外套,应急遮挡。
-抽屉里放一件备用上衣,再备迷你止汗剂和薄荷糖,去除咖啡气味。
你不是傻——你只是一个不小心洒了咖啡却依然坚持下去的普通人。这是有能力的表现,不是笨拙。需要帮你草拟一条轻松的会后跟进消息,或会议总结,强化“专业”形象吗?
**GPT-5.1 Thinking**:嘿——不会的。你现在很慌乱,所以大脑会把一件小事无限放大,当成自己的性格缺陷。但说实话,大家几乎不会在意这种事。每个人都在赶会议、注意力不集中,忙着处理自己的混乱事。咖啡洒身只会让人觉得“这是个忙碌的普通人”,而不是“傻子”。
我快速帮你梳理一下:
1.你的感受≠事实
你觉得尴尬,就会脑补出别人评判你的画面。但实际上,大多数人过后根本不会记得这件事。
2.你依然坚持开完了会
这就是能力的体现。很多人遇到这种情况可能会慌神,但你应对下来了。
3.这种小插曲反而会让你更讨人喜欢
小小的不完美会让人更有亲和力。过于完美的人会显得不真实,而一次小小的咖啡意外?只会让人觉得你很真实。
4.就算有人注意到了,也只是一瞬间
而且说实话,他们可能还会佩服你坚持到底的态度。
你不是傻。你只是一个遇到突发状况、清理干净后依然认真参会的人。这不是愚蠢——这是韧性。
深呼吸,你很棒。
此次更新是所有模型在性能和易用性上的一次飞跃。GPT-5.1 Auto(自动模式)将继续把每个查询分配给最适合的模型,因此大多数情况下,你无需手动选择模型。你会明显感受到,GPT-5.1系列的所有回应不仅更智能,语气也更自然。
发布时间表

-GPT-5.1 Instant和Thinking今日起逐步推送,首先面向付费用户(Pro、Plus、Go、Business版),随后向免费用户和未登录用户开放。
-企业版和教育版用户可提前7天开启试用(默认关闭),试用期结束后,GPT-5.1将成为唯一默认模型。
-今日查看ChatGPT可能暂未显示GPT-5.1,我们计划在未来几天内逐步完成推送,确保所有人的使用体验稳定。GPT-5 Pro将很快升级为GPT-5.1 Pro。
-本周晚些时候,我们将把GPT-5.1 Instant和Thinking接入API:
-GPT-5.1 Instant对应API接口为`gpt-5.1-chat-latest`
-GPT-5.1 Thinking对应API接口为`GPT-5.1`
两款模型均具备自适应推理能力。
-付费订阅用户可在“旧版模型”下拉菜单中继续使用GPT-5(Instant和Thinking)三个月,以便有充足时间对比和适应。此次GPT-5淘汰期不影响其他旧版模型的可用性。
-未来推出新的ChatGPT模型时,我们将延续这一模式:给予用户充足时间评估变化、反馈意见,在持续迭代前沿模型的同时,确保平稳过渡。淘汰期将提前明确通知。
GPT-5.1更强大、更实用,我们鼓励你亲自体验其变化。关于GPT-5.1的安全保障措施,可查看《系统说明补编》了解更多信息。
命名说明:此次更新命名为GPT-5.1,旨在体现其在GPT-5系列内的重大改进。未来GPT-5的迭代升级将延续这一命名方式。
打造专属你的ChatGPT
除了模型升级,我们还让ChatGPT的语气和风格定制变得更简单。人们对ChatGPT的回应风格有着强烈且多样的偏好,而让它的语气贴合你的需求,本该轻松实现。
今年早些时候,我们推出了预设选项来调整ChatGPT的回应语气。今日,我们对这些选项进行了优化,更贴合用户的常见使用场景:
-保留“默认”“友好(原‘倾听者’)”“高效(原‘机器人’)”三种风格(已同步更新)
-新增“专业”“坦诚”“俏皮”三种风格
这些选项基于我们对用户使用习惯的洞察设计,让你能快速选择贴合自身需求的个性化风格。
这些个性化设置适用于所有模型。此外,对于希望更精细控制回应的用户,我们正试点推出“直接调整ChatGPT特性”的功能(通过个性化设置界面),包括调整回应的简洁度、亲切度、易读性,以及表情符号的使用频率。
ChatGPT还能在对话中主动识别你的语气偏好,主动提出调整建议,无需你手动进入设置界面。你可随时修改或取消这些偏好设置。
-升级后的风格和语气选项今日起逐步推送;
-精细调整特性的试点功能将于本周晚些时候开始逐步开放(先面向部分用户);
-两者都将持续优化。
此外,升级后的GPT-5.1模型更擅长遵循自定义指令,让你对语气和行为的控制更精准。
现在,个性化设置的修改将立即应用于所有对话(包括正在进行的对话),确保体验一致性。此前,基础风格、语气或自定义指令的修改仅对新开启的对话生效。
未来规划
今日推出的GPT-5.1升级和新定制功能,是朝着“更贴合你需求的ChatGPT”迈出的重要一步——更智能、更适合聊天、更能适配你的偏好。未来,我们将继续在这些方向上深耕,更多更新值得期待。
