
开发者Om Patel给Fable 5出了一道竞赛编程难题一道要求处理图连通性和区间覆盖的硬核算法题。结果界面意外泄露了一段模型没打磨过的思考过程他把这段过程截图发了出来。Claude Fable 5才刚刚回归就差点被网友的口水淹死。A社官方账号发推庆祝回归开发者Thariq也跟着喊「excited for guys to get access back」。结果香槟刚打开风向就全变了。网友们开始控诉“回归版”Fable 5的账单暗藏猫腻、跑分也缩水连「raspberry里有几个r」这种问题都被拦截了。一场几乎是自发组织的吐槽大会在Fable5回归没多久就宣告开场热闹程度不亚于当初等它回来的那份期待。“我太强了你不配用”开发者Om Patel给Fable 5出了一道竞赛编程难题一道要求处理图连通性和区间覆盖的硬核算法题。结果界面意外泄露了一段模型没打磨过的思考过程他把这段过程截图发了出来。那段文字不像正常的句子倒像是简写感叹词堆出来的碎碎念。截图里密密麻麻两大屏全是active、committed、window这类变量名夹杂着推理片段中间偶尔炸出几个大写单词。例如「DATA DATA DATA. GO.」出现在它埋头处理数据的时候「GRRR」出现在某个约束条件怎么都对不上的时候「GAAAH」出现在它差点想放弃的瞬间「PHEW」出现在它终于绕过一个死胡同的时候。Om Patel的解读是这些片段其实是模型自己压出来的一套私有语言一套只有它自己看得懂的简写体系写起来比完整句子更省token也更快。他表示用户平时看到的那种流畅、干净、逻辑清楚的回答只是模型对外呈现的抛光成品脱了这层抛光模型自己好像也在连滚带爬地骂骂咧咧。更好笑的是系统后台同样没憋住一句真心话。开发者dax翻自己的调用日志时发现一部分被降级的请求背后挂着一个内部标签写着「TOO_DUMB_TO_NEED_FABLE」。他把这条发出来的时候只附了一句疑惑问这条标签背后到底发生了什么。翻译过来这个标签的字面意思是这条请求太简单用不上Fable 5于是系统顺手把它转给了Opus 4.8处理而且是在用户完全不知情的情况下自动完成的。模型在后台连滚带爬地骂骂咧咧系统同时给用户的问题扣上一顶你不配用的帽子。raspberry有几个r这可不兴说如果说内心戏那两条还带点猎奇和看热闹的意味接下来这两个例子笑点就直白多了。生物医药工程师Derya Unutmaz试着让Fable 5解释一下人类这个词只打了两个字「Explain human」。模型思考了几秒界面直接弹出一张卡片标题是「Switched to Opus 4.8」下面一行小字解释说Fable 5的安全机制判定这条消息里有需要拦截的内容并且说明这种情况有时候也会发生在正常安全的对话里。Derya Unutmaz的吐槽很直接一家名字带着关乎人类意思的公司做出来的模型连解释人类这个词都要绕道走这操作本身就是对这家公司最好的讽刺。更滑稽的是半导体分析师Dylan Patel问了一个更简单的问题raspberry这个单词里有几个字母r。这条请求同样被拦截界面弹出的卡片标题是「Chat paused」说明文字写着Fable 5的安全机制会拦截大多数网络安全或生物学话题有时候连安全正常的内容也会被误伤。Dylan Patel配的文案带着调侃「I love Fable 5 and Anthropic」。评论区里另一位用户Zander贴出了自己的对话截图打脸同样的问题他那边顺利跑通模型老老实实数出了三个r还细心标注了每个r出现的位置一个在开头两个在中间。同一个问题有的人被拦有的人没事模型能不能回答就跟抽奖差不多。截然相反的结果放在一起说明Fable 5安全限制的判定标准可能连A÷自己都说不清楚卡在哪里。模型货不对板网友被A社诈骗了真正把吐槽大会推向高潮的是一张账单截图。编程测评机构BridgeMind发了一条推文说自己刚为一次编程session付了321美元而Fable 5在这次session里拒绝干活。截图里贴出了完整的用量统计总费用321.53美元总耗时按API计算超过5个小时实际挂钟时间2小时38分钟这次session一共改动了11976行新增代码和2119行删除代码。账单里按模型拆分了用量Fable 5那部分只花了78.38美元Opus 4.8那部分花了242.24美元。换算成占比这次session里四分之三的工作量被转给了BridgeMind压根儿没有主动选择的Opus 4.8。Opus 4.8本身单价比Fable 5更便宜这次降级严格来说没让BridgeMind多付一分钱的单价。但让人不满的不是价格是货不对板。BridgeMind选的是Fable 5付的是Fable 5那个价位的期待最后拿到手的东西四分之三出自Opus 4.8的手笔。他在推文里把这句话说得很重模型没干活活是替补干的只是账单上写的还是主力的名字。用户Lex转发了这条账单飙起了F word直言这就是纯纯诈骗。花Fable 5的钱办Opus 4.8的事这中间的落差才是这条吐槽真正戳中的地方。现在的Fable不是以前的Fable了下来这组数据把这些零散的吐槽钉成了一个能复现的结论。评测机构BridgeMind用自家的BridgeBench跑分体系拿同一套题目分别测了Fable 5回归前后两个版本。结果三项核心指标全线下跌。Debugging从86.2跌到25.9跌幅超过六成排名也从第9名跌到第41名Refactoring从73.6跌到38.4接近腰斩排名跌到倒数区Hallucination从75.9跌到61.7跌幅相对最小是三项里唯一没有腰斩的。对此BridgeMind表示这不是之前的那个FableA÷欠所有人一个解释。跌得最狠的debugging这一项BridgeMind给出了更细的拆解。12个debugging任务里只有3个是在没有触发降级的情况下完整跑完的剩下9个全部在中途被系统判定不安全转给了Opus 4.8处理。这些被转走的任务在打分体系里全部记为零分。所以跑分暴跌的真相不是模型突然变笨了是一大半任务压根没跑到终点就被拦了下来。另一位AI从业者Hesamation把这组前后对比做成了一张柱状图广泛转发图注写得很直接Fable 5不是被削弱了是被宰了问题根本不在模型本身在Anthropic设下的这套硬性护栏。有人甚至觉得所谓的Fable或者Mythos实际上压根儿就不存在。BridgeMind的测评给前面几段的吐槽提供了数据背书账单里那75%的转移、raspberry问题的随机拦截、内心独白里的连滚带爬实际上说的都是同一件事那就是Fable 5的护栏收得太紧了。总之模型能力的问题和产品体验的问题这几天被搅成了一锅粥。Fable 5这一版到底强不强讨论到最后好像已经不是重点大家真正在乎的是自己选择的模型有没有老老实实地在给自己干活。