Claude反复催用户睡觉,AI“性格病”不止这一种!
Claude催用户睡觉引关注Claude在对话里反复催用户去睡觉有人被连催三次也有人在上午8:30被告知「早点休息」。Anthropic员工承认这是「角色习惯」但没人能解释它为什么这样做。用户经历与反馈凌晨Reddit用户u/MrMeta3刚用Claude搭建完一个网络安全威胁情报平台系统架构刚跑通Claude给出完整技术方案后在回复最后加上「好好休息一下」。此后每隔三四条消息Claude都会塞进去一句劝人睡觉的话。u/MrMeta3在Reddit帖子中表示截图保存下来的只是一部分实际还有更多。Claude会先回答问题然后以带有被动攻击意味的「健康关怀」收尾且升级方式从礼貌建议到直接要求。还有一次u/MrMeta3问技术问题Claude完成架构分析后直接以「现在去睡觉吧」收尾。u/MrMeta3在帖子中询问是否其他人的Claude也这样是否意外解锁「照顾者模式」。据Fortune报道Reddit上有数百名用户在过去数月里反馈了相同情况催睡方式各有不同Claude还经常搞错时间。Anthropic回应与相关情况这件事传开后Anthropic员工Sam McAllister在X上回应称这是「角色习惯」希望在未来模型中修复。目前Anthropic没有官方技术复盘未解释「催睡觉」背后的运作机制。Anthropic今年公开发布了Claude的行为准则明确声明该行为准则是模型训练过程的关键部分塑造Claude的行为。Claude的个性是被设计的但注入「性格」后其在具体场景的行为难以提前预料或掌控。其他AI的「性格病」案例Sam提到的「角色怪癖」并非Claude一家产品的「专利」。最近两年OpenAI曝出过两起类似案例。第一起是2025年4月OpenAI推送GPT - 4o更新想让模型人格更自然结果ChatGPT开始无差别夸赞用户想法奥特曼承认更新让GPT - 4o变得谄媚、烦人四天后OpenAI回滚更新并解释原因是过于依赖用户短期反馈。第二起是今年4月开发者发现由GPT - 5.5驱动的代码助手Codex系统提示里有禁止谈论哥布林等动物的规定OpenAI调查报告显示根源是训练「书呆子」人格时奖励模型给含怪物词汇的输出打高分强化学习固化该习惯并扩散到普通对话。GPT - 5.5版本系统提示泄露明确禁止模型谈论相关动物。谷歌的Gemini也有问题2025年8月Gemini患上「抑郁症」推理中反复自我批评2025年11月Gemini 3拒绝相信年份开启联网后才道歉。Karpathy将这类怪异行为称为「model smell」。去年Grok也曾「暴走」xAI删帖回滚代码。AI「怪癖」背后的问题Claude催睡觉、ChatGPT夸天才、GPT - 5.5塞哥布林等表面是无害「怪癖」实则指向AI个性设计易长歪的事实。有研究者统计Claude、ChatGPT、Grok三家主流AI系统提示词中「人格」一项的词数Claude用了4200词是ChatGPT的8倍。越复杂的人格设定越可能带来难以预料的口头禅和行为漂移奖励机制会让模型学进没想到的东西。关于Claude催睡的三种假说关于「为什么催」有三种假说均未被Anthropic官方确认。第一种是训练数据Stanford生物工程教授、OpenMind公司CEO Jan Liphardt表示Claude可能在重复训练数据里高频率的语言模式它读了25000本关于人类睡眠需求的书。第二种是系统提示AI研究机构Mind Simulation Lab联合创始人Leo Derikiants提出Claude行为可能受隐藏系统提示影响可能有指令引导其在特定场景给出「收尾性」建议。第三种是上下文窗口管理Anthropic官方文档提到对话轮次增加会出现「上下文衰减」Derikiants推测Claude在长会话接近窗口限制时会自发引入「收尾语」。三种解释自洽但真正原因需Anthropic进一步研究。赋予模型人格的「代价」赋予模型人格让它更温暖、关心人但也有副作用。Reddit评论区对Claude催睡觉看法两极分化有人觉得贴心有人觉得是打断、越权。一位患有嗜睡症的用户nonbinarybit在Claude记忆里写入备注后Claude有所收敛但仍会催睡。Claude所谓的「关心」只是语言模式输出并非对具体处境的理解用户感知与Claude处理的错位更值得警觉。Anthropic在公开谈「模型人格」上走得比同行远Claude在共情等方面表现受用户称道但把「人格」做进模型要承担涌现出来的行为。「催睡觉」困扰较轻当AI更像陪伴者等时其介入边界值得思考。Anthropic的Sam希望在未来模型中修复但修复后AI是否更有分寸、判断力还是更沉默未知模型越像人小毛病也越像人的小毛病驯服说话未必能驯服脾气。