GPT - 5.1发布:不刷榜了,你来用就知道区别

日期:2025-11-14 16:18:57 / 人气:25



发布背景:回应差评

五个月前,OpenAI推出GPT - 5,然而用户吐槽其跑分虽高,但好用度不如GPT - 4o,语气直男、聊天“冷冰冰”,甚至有用户要求“退钱换回4o”。如今,GPT - 5.1上线,OpenAI不再炫技参数和放榜单,而是强调“更好聊,更好调”,以此回应之前的差评。

基本情况介绍

模型定义与版本

官方将GPT - 5.1定义为GPT - 5家族的“0.1”级升级,有两款核心型号。GPT - 5.1 Instant是ChatGPT常用默认模型,变得更“暖”、健谈且指令遵循更靠谱;GPT - 5.1 Thinking是负责复杂推理、长链任务的高阶模型,在简单问题上响应更快,复杂问题上更“咬得住”,回答也更易懂。

使用方式与覆盖范围

在ChatGPT里,前端默认是GPT - 5.1 Auto自动路由,系统会自动判断使用Instant还是Thinking,常规聊天/改写用Instant,复杂推理/分析用Thinking,用户也可手动切换。9月25日起先向Pro/Plus/Go/Business/企业/教育版推送,随后几天陆续开放给免费用户。API端本周内上线,gpt - 5.1 - chat - latest对应GPT - 5.1 Instant,gpt - 5.1对应GPT - 5.1 Thinking(带自适应推理)。老版GPT - 5会在“旧版模型”里保留三个月,给开发者和重度用户观察期。

核心升级亮点

更“有人味”的Instant

 • 交流方式优化:GPT - 5.1 Instant说话方式被重做,以“我最近压力很大,给点放松建议”为例,GPT - 5给出专业但距离感强的心理健康tips列表,而GPT - 5.1 Instant会先共情,再分场景给出小建议,用词像朋友,还会主动记称呼、用幽默语气、加小吐槽和梗,且不影响信息密度。

 • 指令遵循改进:在指令遵循上,GPT - 5.1 Instant有系统性改进,会先抽象出“规则”再填内容,还获得“自适应推理”能力,碰到棘手问题先思考再答。在相关评测中,其表现明显优于GPT - 5,不再像GPT - 5聊天“像念稿”,更像人在说话。

更聪明省心的Thinking

 • 思考时间分配:GPT - 5.1 Thinking对简单任务思考时间缩短,速度约是GPT - 5 Thinking最快任务的两倍;对复杂任务花更多时间“咀嚼”,给出更完整的解法。

 • 回答更清晰:以棒球统计为例,GPT - 5的解释像wiki条目,GPT - 5.1 Thinking把公式拆成“概念解释 + 使用场景”,增加“这意味着什么”“现实里怎么用”等句子,对非专业读者更友好。在安全测试和对抗越狱测试中表现与GPT - 5大致持平或有所改善,对用户来说,它更像“愿意多想一会儿、但解释更人话”的专家,对做长报告等复杂任务是实用升级。

更好调教:八种人格 + 精细化滑杆

 • 人格选择:ChatGPT的“人格调节台”改版,个性化设置中可选择Default/Professional/Friendly等八种风格,对应不同交流风格。原来受欢迎的“Robot”人格改名为Efficient,行为几乎不变;新增Quirky(古怪)、Cynical(愤世嫉俗)偏娱乐/陪聊,吐槽感更强。

 • 滑杆调节:设置里有隐藏滑杆,可调节输出简洁度、热情度、表情符号使用等,ChatGPT会根据提示主动询问是否一键更新全局语气。这些参数对所有模型即时生效,把“提示工程”部分产品化成UI设置,方便用户控制人设。

网友评价与底层战斗力提升

网友评价

网友对GPT - 5.1评价不一。日常用户普遍觉得它“好聊多了”,能安慰人、接情绪,建议拆分讲解,语气口语化,有耐心、会说人话,记得称呼、能接上下文;但Hacker News等技术社区有人吐槽,认为同样问题GPT - 5信息密度更高,GPT - 5.1显得啰嗦,怀疑其“用话多换停留时间”。目前共识是,想要陪聊共情,5.1提升明显;追求极致效率,需通过人格和风格设置调整。

底层战斗力提升

 • 推理与数学/编程能力:Adaptive reasoning让Instant能“先想再答”,在AIME 2025、Codeforces等评测中显著提升;Thinking版在同等“标准思考时间”下,简单题更快、难题更细。

 • 安全性与敏感场景:在“精神健康”“情感依赖”等敏感对话评估中,5.1总体和5持平或略有改善,尤其是Thinking版本在精神健康场景下有提升;在强越狱(StrongReject)测试里,5.1 Instant对越狱提示的防御能力明显优于早期版本。

 • 上下文和API侧体验:ChatGPT中GPT - 5.1 Instant上下文可达约128k tokens,Thinking在企业/教育计划下可扩展到约196k,上限比现有5系列更宽。

总结与思考

GPT - 5.1的更新是从“刷榜”到注重“好用”的姿态调整,将原本埋在提示工程里的语气、人设等因素搬到明面上,让用户可像调产品一样使用。这带来了新分歧,但用户可通过人格预设和风格滑杆定制想要的AI。跑分能体现其客观强度,但“值不值得长期用”需用户亲自体验,思考希望AI在生活中扮演的角色,才能得出答案。

作者:天富注册登录平台




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 天富注册登录平台 版权所有