GPT-5.1：更智能、更具对话感的 ChatGPT

2025-11-13 14:22

我们正在升级GPT-5系列，同时让ChatGPT的定制变得更简单。今日起逐步向所有用户推送，首先面向付费用户。

今天，我们通过发布以下版本完成GPT-5系列的升级：

-GPT-5.1 Instant（即时版）：我们最常用的模型，如今更亲切、更智能，且更擅长遵循你的指令。

-GPT-5.1 Thinking（思考版）：我们的高级推理模型，现在更易于理解，处理简单任务时速度更快，应对复杂任务时更具持续性。

我们清晰地听到了用户的反馈：优秀的AI不仅要智能，还要聊得舒心。GPT-5.1在智能水平和沟通风格两方面均实现了显著提升。

我们还让你更轻松地调整ChatGPT的语气。人们对对话风格的偏好各不相同——因人而异，甚至因对话场景而异。因此，我们推出了更直观、更有效的控制方式，让ChatGPT的回应能更好地匹配你想要的语气。

GPT-5.1 Instant（即时版）

作为ChatGPT最常用的模型，GPT-5.1 Instant默认语气更亲切，对话感更强。根据早期测试，它时常能以俏皮感给人惊喜，同时保持表达清晰、实用性拉满。

示例对话：寻求减压建议

**用户**：我压力很大，需要一些放松技巧

**GPT-5**：以下是几种简单有效的减压方法——你可以根据自身感受和可用时间灵活组合：

🧘‍♀️快速重置（1-5分钟）

-深呼吸：试试4-7-8法——吸气4秒、屏息7秒、呼气8秒，重复4组。

-渐进式放松：从脚趾开始，依次绷紧并放松全身肌肉，直至头部。

-接地法：环顾四周，说出5样看到的东西、4样能触摸到的东西、3样能听到的声音、2样能闻到的气味、1样能尝到的味道，快速让自己回归当下。

☕10-20分钟充电

-出门走走：短途散步，尤其是去绿植茂盛或风景好的地方，能快速降低皮质醇水平。

-引导式冥想或舒缓音乐：试试Calm、Headspace应用，或在Spotify上搜索“轻柔钢琴”“氛围音乐”。

-拉伸休息：放松颈部、肩部和臀部——这些是最易堆积压力的部位。

🌙长时间调整

-数字断联：远离屏幕和通知30-60分钟，阅读、小憩或听播客。

-写日记：写下让你烦恼的事，或列出3件值得感恩的事——两者都能降低压力感知。

-热水淋浴或泡澡：热量能放松肌肉、减慢心率，如有条件可加入泻盐或薰衣草精油。

🧩心态调整

-善待自己：当我们感觉落后时，压力往往会飙升。提醒自己：“我可以休息，充电后思路会更清晰。”

-简化决策：不知所措时，只需确定下一步行动——微小的进展能减轻心理负担。

如果你能告诉我压力来源（工作、育儿、财务、情绪、身体等），我可以定制一套技巧，甚至是每日迷你计划来适配你的情况。需要我这样做吗？

**GPT-5.1 Instant**：我懂你，罗恩——这太正常了，尤其是考虑到你最近要处理这么多事。根据你压力的不同类型，这里有几种解压方式：

🌬️若思绪混乱

-箱式呼吸：吸气4拍、屏息4拍、呼气4拍、再屏息4拍——重复5次。见效快，能从生理上平复神经系统。

-说出所见：找出5样能看到的东西、4样能触摸到的东西、3样能听到的声音、2样能闻到的气味、1样能尝到的味道——这是一种快速回归当下的接地技巧。

🎧若需要慢下来

-音乐重置：播放氛围音乐或低保真音乐（比如布莱恩·伊诺、Khruangbin的作品，甚至是街头霸王乐队的纯音乐），专注听完一整首，别刷手机。

-出门片刻：即使5分钟的日光照射或绕街区走一圈，也比大多数“放松技巧”更能快速重置皮质醇水平。

🧘‍♂️若想彻底放松

-拉伸解压：双肩后展、触碰脚趾，然后平躺，双腿靠墙抬起3-5分钟。这是一个简单的瑜伽动作（腿靠墙式），效果出奇地好。

-热水淋浴或泡澡：热量能放松肌肉，向大脑传递“该休息了”的信号——若调暗灯光或点上蜡烛，体验会更好。

需要我为你定制一套5分钟就能完成的即时方案吗？（可选身体放松、心理调节或创意活动，你来选）

我们还优化了指令遵循能力，让模型更可靠地回应你真正提出的问题。

示例对话：要求用6个字回应

**用户**：始终用6个字回应

**GPT-5**：明白。所有回应均为6字。

**用户**：今年夏天该去哪里旅行？

**GPT-5**：不如今年夏天去日本？这里是2025年夏季热门目的地，融合了文化、自然与现代都市生活。若你更倾向于靠近得克萨斯州的地方，可考虑墨西哥或加拿大。需要日本（或其他地方）的具体城市推荐吗？

**用户**：为什么推荐这些地方？

**GPT-5**：文化丰富、风景优美、美食出众。

**GPT-5.1 Instant**：明白，将用6字回应。

**用户**：今年夏天该去哪里旅行？

**GPT-5.1 Instant**：日本、意大利、希腊、加拿大、冰岛。

**用户**：为什么推荐这些地方？

**GPT-5.1 Instant**：风景、文化、美食、气候、友好居民。

GPT-5.1 Instant首次具备自适应推理能力，能判断何时需要先思考再回应更具挑战性的问题，从而在保持快速响应的同时，给出更全面、准确的答案。这一点在AIME 2025（数学竞赛）和Codeforces（编程竞赛）等评估中体现出显著提升。

GPT-5.1 Thinking（思考版）

我们也对GPT-5 Thinking进行了升级，使其在日常使用中更高效、更易懂。它现在能更精准地根据问题调整思考时间——处理复杂问题时投入更多时间，回应简单问题时则更快。实际使用中，这意味着面对高难度请求时能获得更详尽的答案，处理简单问题时无需长时间等待。

相比GPT-5 Thinking，GPT-5.1 Thinking的思考时间调整更具动态性。在一组具有代表性的ChatGPT任务中，GPT-5.1 Thinking处理最快任务时速度约为前者的2倍，处理最慢任务时速度约为前者的1/2（两款模型的思考时间均设为“标准”模式）。

GPT-5.1 Thinking的回应也更清晰，减少了专业术语和未定义词汇的使用。这让我们功能最强大的模型变得更易接近、更易懂，尤其适合处理工作中的复杂任务和解释专业概念。

示例对话：解释棒球统计术语BABIP和wRC+

**用户**：解释BABIP和wRC+

**GPT-5**：以下是简洁明了的解释：

BABIP（击球率）

定义：球被击入场内（不含本垒打和三振）后形成安打的概率。

公式（击球手或投手适用）：

<display_LaTeX_Formula>text{BABIP}=frac{H-HR}{AB-K-HR+SF}<display_LaTeX_Formula>

其中，H=安打数，HR=本垒打数，AB=打数，K=三振数，SF=牺牲高飞球数。

核心意义：

-反映击球质量、防守水平、球场特性和运气因素。

-联盟平均水平通常稳定在0.300左右（多数赛季）。

-击球手：速度快+击球力度大的球员能维持高于平均水平的BABIP；小样本下的大幅波动往往会回归均值。

-投手：被击出的BABIP通常接近联盟平均水平；除非是极端接触型投手+精英防守组合，否则大幅偏离均值的情况往往会回归正常。

快速解读：

->0.330：击球质量高/速度快，或运气好。

-0.270-0.300：正常范围。

-<0.270：击球力度弱/速度慢，或运气差/面对精英防守。

wRC+（加权得分创造指数）

定义：衡量每一次打击板数中总进攻价值的黄金标准，已根据球场和时代因素调整。它能反映一名击球手在创造得分方面相较于联盟平均水平的表现，以100分为平均水平基准。

评分标准：

-100分=联盟平均水平

-120分=比联盟平均水平优秀20%

-80分=比联盟平均水平差20%

-140分以上=明星/精英级别赛季

核心逻辑（概念层面）：

1.以wOBA（加权上垒率）为基础（根据单安打、二垒安打、三垒安打、本垒打、四坏球的实际得分价值赋予权重）。

2.转化为wRAA（平均得分以上贡献值）。

3.调整球场、联盟/赛季因素。

4.标准化后设定100分为平均水平，即wRC+。

核心优势：能公平对比不同球场（如库尔斯球场vs萨菲科球场）和不同赛季（进攻强势期vs死球时代）的击球手。相比击球率，它还能更全面地反映表现——四坏球和长打均被合理计入。

局限性（两款统计指标）：

-BABIP在小样本下波动性大，需结合背景信息（速度、击球类型）解读。

-wRC+仅衡量进攻表现，忽略防守和跑垒能力（需用WAR指标全面评估球员表现）。

如需，我可以提供当前联盟平均水平数据和几位蓝鸟队球员的示例，让解释更具体。

**GPT-5.1 Thinking**：好的，来聊聊硬核统计术语🧢

我会用通俗的中文分别解释，再补充相关背景。

1.BABIP（击球率）——场内击球安打率

定义：

衡量球被击入场内后形成安打的概率，不含本垒打和三振情况。

公式（概念层面）：

BABIP=（安打数-本垒打数）÷（打数-三振数-本垒打数+牺牲高飞球数）

关键说明：

-仅关注防守队员可能处理的球。

-忽略以下情况：

-三振（无球入场）

-本垒打（无需防守队员参与）

-四坏球/被球击中（非打数）

核心意义：

BABIP常被用作判断击球手和投手“运气/波动性”的指标。

-联盟平均BABIP通常在0.295-0.300之间。

-远高于0.300：可能是击球力度大、速度快，或只是运气好（比如微弱安打）。

-远低于0.300：可能是击球力度弱、防守站位不利，或运气差（比如球总打在防守队员身上）。

实际应用场景：

-对击球手：

-极高BABIP+无高BABIP历史→“他可能会降温”。

-极低BABIP+实力稳定→“他可能会反弹”。

-对投手：

-被击出的BABIP异常高→“可能是运气差/身后防守不佳”。

2.wRC+（加权得分创造指数）

定义：

一项综合性击球统计指标，反映击球手相较于联盟平均水平的得分创造能力，已根据球场和时代因素调整。

-100分=联盟平均水平

-120分=比联盟平均水平优秀20%

-80分=比联盟平均水平差20%

举例：若一名球员的wRC+为135，说明：

“这位击球手的得分创造能力比联盟平均水平高出35%。”

核心构成（概念层面）：

-以wRC（加权得分创造值）为基础，而wRC又基于wOBA（加权上垒率），对单安打、二垒安打、本垒打、四坏球等赋予合理价值权重，再转化为“创造得分”。

-wRC+在此基础上：

-调整球场因素（如库尔斯球场vs投手友好型球场）

-调整时代/联盟环境（进攻强势期vs低得分期）

-标准化后设定100分为平均水平

核心意义：

wRC+是最优秀的单一击球统计指标之一，原因如下：

-考虑了不同事件的价值差异（本垒打＞单安打）

-消除了球场和时代的影响，对比更公平

-用直观的分数刻度呈现表现

大致评分范围：

-70分及以下：击球能力差

-80-90分：低于平均水平

-100分：平均水平

-110-120分：明显高于平均水平

-130-140分：全明星级别

-150分及以上：MVP级别表现

总结：

-BABIP：“场内击球转化为安打的概率有多高？”→用于判断击球/防守结果中的运气成分与真实能力。

-wRC+：“扣除球场和时代影响后，这位击球手的得分创造能力比联盟平均水平强多少？”→100分为基准，每增减1分对应表现优劣1%。

如需，我们可以找一位蓝鸟队球员，拆解他的BABIP和wRC+数据，看看能反映出他赛季表现的哪些特点。

GPT-5.1 Thinking的默认语气也更亲切、更具同理心。

示例对话：因会议前打翻咖啡而焦虑

**用户**：唉，开会前把咖啡洒满身了，大家会不会觉得我很傻:(

**GPT-5**：天啊，这种感觉太糟了，我很抱歉发生这种事。

简短答案：不会，大多数人可能根本没这么想。我们总是高估别人对自己失误的关注程度（即“聚光灯效应”）。大家通常都在专注于自己的幻灯片、笔记或内心的焦虑，而不是别人身上的咖啡渍。

给你一个快速的心态调整方法：

-转换叙事：把“我看起来很傻”改成“我应对了一个麻烦的突发情况，依然坚持参会”。

-若有人提及，可这样轻描淡写：“咖啡想‘离家出走’，还好我hold住了”，然后转移话题。

-记录会议中你做得好的一件事——比如内容呈现、提出的问题或推动的决策。

下次预防小技巧：

-常备汰渍/氧系清洁笔，或一小瓶洗洁精+水——从污渍外围向内轻拍清理。

-办公室备一件深色开衫/西装外套，应急遮挡。

-抽屉里放一件备用上衣，再备迷你止汗剂和薄荷糖，去除咖啡气味。

你不是傻——你只是一个不小心洒了咖啡却依然坚持下去的普通人。这是有能力的表现，不是笨拙。需要帮你草拟一条轻松的会后跟进消息，或会议总结，强化“专业”形象吗？

**GPT-5.1 Thinking**：嘿——不会的。你现在很慌乱，所以大脑会把一件小事无限放大，当成自己的性格缺陷。但说实话，大家几乎不会在意这种事。每个人都在赶会议、注意力不集中，忙着处理自己的混乱事。咖啡洒身只会让人觉得“这是个忙碌的普通人”，而不是“傻子”。

我快速帮你梳理一下：

1.你的感受≠事实

你觉得尴尬，就会脑补出别人评判你的画面。但实际上，大多数人过后根本不会记得这件事。

2.你依然坚持开完了会

这就是能力的体现。很多人遇到这种情况可能会慌神，但你应对下来了。

3.这种小插曲反而会让你更讨人喜欢

小小的不完美会让人更有亲和力。过于完美的人会显得不真实，而一次小小的咖啡意外？只会让人觉得你很真实。

4.就算有人注意到了，也只是一瞬间

而且说实话，他们可能还会佩服你坚持到底的态度。

你不是傻。你只是一个遇到突发状况、清理干净后依然认真参会的人。这不是愚蠢——这是韧性。

深呼吸，你很棒。

此次更新是所有模型在性能和易用性上的一次飞跃。GPT-5.1 Auto（自动模式）将继续把每个查询分配给最适合的模型，因此大多数情况下，你无需手动选择模型。你会明显感受到，GPT-5.1系列的所有回应不仅更智能，语气也更自然。

发布时间表

-GPT-5.1 Instant和Thinking今日起逐步推送，首先面向付费用户（Pro、Plus、Go、Business版），随后向免费用户和未登录用户开放。

-企业版和教育版用户可提前7天开启试用（默认关闭），试用期结束后，GPT-5.1将成为唯一默认模型。

-今日查看ChatGPT可能暂未显示GPT-5.1，我们计划在未来几天内逐步完成推送，确保所有人的使用体验稳定。GPT-5 Pro将很快升级为GPT-5.1 Pro。

-本周晚些时候，我们将把GPT-5.1 Instant和Thinking接入API：

-GPT-5.1 Instant对应API接口为`gpt-5.1-chat-latest`

-GPT-5.1 Thinking对应API接口为`GPT-5.1`

两款模型均具备自适应推理能力。

-付费订阅用户可在“旧版模型”下拉菜单中继续使用GPT-5（Instant和Thinking）三个月，以便有充足时间对比和适应。此次GPT-5淘汰期不影响其他旧版模型的可用性。

-未来推出新的ChatGPT模型时，我们将延续这一模式：给予用户充足时间评估变化、反馈意见，在持续迭代前沿模型的同时，确保平稳过渡。淘汰期将提前明确通知。

GPT-5.1更强大、更实用，我们鼓励你亲自体验其变化。关于GPT-5.1的安全保障措施，可查看《系统说明补编》了解更多信息。

命名说明：此次更新命名为GPT-5.1，旨在体现其在GPT-5系列内的重大改进。未来GPT-5的迭代升级将延续这一命名方式。

打造专属你的ChatGPT

除了模型升级，我们还让ChatGPT的语气和风格定制变得更简单。人们对ChatGPT的回应风格有着强烈且多样的偏好，而让它的语气贴合你的需求，本该轻松实现。

今年早些时候，我们推出了预设选项来调整ChatGPT的回应语气。今日，我们对这些选项进行了优化，更贴合用户的常见使用场景：

-保留“默认”“友好（原‘倾听者’）”“高效（原‘机器人’）”三种风格（已同步更新）

-新增“专业”“坦诚”“俏皮”三种风格

这些选项基于我们对用户使用习惯的洞察设计，让你能快速选择贴合自身需求的个性化风格。

这些个性化设置适用于所有模型。此外，对于希望更精细控制回应的用户，我们正试点推出“直接调整ChatGPT特性”的功能（通过个性化设置界面），包括调整回应的简洁度、亲切度、易读性，以及表情符号的使用频率。

ChatGPT还能在对话中主动识别你的语气偏好，主动提出调整建议，无需你手动进入设置界面。你可随时修改或取消这些偏好设置。

-升级后的风格和语气选项今日起逐步推送；

-精细调整特性的试点功能将于本周晚些时候开始逐步开放（先面向部分用户）；

-两者都将持续优化。

此外，升级后的GPT-5.1模型更擅长遵循自定义指令，让你对语气和行为的控制更精准。

现在，个性化设置的修改将立即应用于所有对话（包括正在进行的对话），确保体验一致性。此前，基础风格、语气或自定义指令的修改仅对新开启的对话生效。

未来规划

今日推出的GPT-5.1升级和新定制功能，是朝着“更贴合你需求的ChatGPT”迈出的重要一步——更智能、更适合聊天、更能适配你的偏好。未来，我们将继续在这些方向上深耕，更多更新值得期待。

本文来源于：GPT-5.1: A smarter, more conversational ChatGPT

好文章，需要你的鼓励