6月9日,Anthropic 史上最强公开模型 Claude Fable 5 正式亮相。
喜忧各半。喜的是,Fable 5 的实力货真价实。忧的是,它离普通人的钱包越来越远。
硅谷 AI 教父 Karpathy 给出的评价是"代际跃升",Stripe 则用它在一天内跑完了人工需要整整两个月才能完成的代码迁移。

Fable 5 是 Mythos 系列面向公众开放的第一款产品——这个事实本身就值得停下来想一想。
Mythos 是什么来头?两个月前,当 Anthropic 首次公布这个系列时,明确表示不会向公众开放,理由是能力过于强大,网络安全方面的潜在风险难以接受,只对少数经过审核的机构定向投放。
而现在,那个当初被锁起来的 Mythos 级能力,已经以 Fable 5 的形式落到了你手边。
论硬指标:SWE-Bench Pro 上,Fable 5 拿下 80.3% 的得分,比 Opus 4.8 高出约 11.1 个百分点。放到模型评测的语境里,这个差距不小,大概是百米冠军比亚军整整甩出一个身位。
Karpathy 的措辞没有任何保留——不是一点一点往前爬,是和去年 11 月 Claude 4.5 那次升级同一量级的"代际跃升"。开发者社区最早一批反馈,给出的也是同样的定性。
Wix 旗下代码生成平台 Base44 表示,Fable 5"一次性完整生成整个 app 的能力大幅提升"。Claude Code 产品负责人 Boris Cherny 说得更直白:这是他用过的最好的编程模型,"领先幅度相当大"。
真正让 Fable 5 破圈的,是 Stripe 晒出的那个案例:5000 万行 Ruby 代码库,全库迁移,一天完工。换一支工程师团队来干,时间是两个月。
问题来了:Fable 5 这么能打,代价是什么?Stripe 那次迁移,到底烧掉了多少 token?
先看定价。API 端,输入 $10/百万 token,输出 $50/百万 token,是 Opus 4.8 的两倍。Claude 订阅用户目前有一个免费试用窗口,但 6 月 22 日之后若想继续使用,则需要额外购买用量额度。
发布当天,X 上的第一波讨论就炸了锅。
用户 @MaxForAI 直接开炮:"这个 Mythos/Fable 的成本太夸张……我想不出写什么代码能回本,除非是赌场那种诈骗项目。"他附上了一张图——同事刚跑了一个任务,差点把 20 倍额度一次性烧干净。

Reddit 用户 u/Jomuz86 的遭遇同样惨烈:"Max x20 的 5 小时窗口,45 分钟就跑光了。Time to go touch some grass." 白话翻译:钱包先于代码宣告阵亡,不如出门摸草。
还有 u/Maximum-Face9536 反映,在 Claude Code 里只发了一条消息,模型报错返回不可用,但这一次失败的请求,就吃掉了普通 Pro 计划 21% 的额度。
这正是 Fable 5 最扎普通用户心脏的地方。
根源在于,用聊天时代的定价逻辑去理解一个 Agent 时代的产品,本来就对不上。
Fable 5 具备"自主验证"能力,模型不会回答一次就收手——拆解任务、制定计划、调用工具、派发子 Agent、等待执行结果、发现错误、修改方案、重新执行、自我验证……每一个环节都在持续消耗 token,而且在任务启动之前,没有人知道这条链会延伸多长。
社区里已经有人把账算出来了:一次中等复杂度的 Agent 任务,token 消耗轻松达到 50 万至 100 万。按输出端 $50/百万 token 计算,单次任务成本可能落在 25 到 50 美元之间——这还没把输入、缓存、子 Agent 调用的开销算进去。
回到 Stripe 那个案例:5000 万行代码库、一天迁移完毕,但 token 账单从未公开。两个月的工程师人工成本折算下来可能是几万美元,而 token 账单,有没有可能比这个数字更高?没有人知道。
Fable 5 发布时,Mythos 5 也一并公布——这一点同样不该被忽视。
两款模型的本质差异不在名字,而在于权限边界。Anthropic 官方表示,Fable 5 和 Mythos 5 共用同一个底座,区别仅在于 Fable 5 叠加了安全限制。涉及网络安全、生物、化学等敏感领域,Fable 5 会把你的问题悄悄转给 Opus 4.8 处理,全程不发出任何通知——官方将其命名为"静默降级",声称触发比例不超过 5% 的会话。
但 Karpathy 在发布当天就点破了其中的隐患:初期的分类器"调得有些过于敏感",容易误判——正常的生物科研提问、代码安全审计、乃至部分无害的学术讨论,都可能被划进那 5% 里。
同样底座的 Mythos 5 则没有这些阀门,完整能力,单独通道。但它只对 Project Glasswing 中经过审核的组织开放,名单未予公示。从 Anthropic 的描述中大致可以拼出轮廓:网络安全防御机构、关键基础设施企业、少数生命科学研究者,以及此前进入 Mythos Preview 项目的约 200 个组织,其中涵盖美国政府相关项目。
于是,同一个模型,对外呈现出两副面孔。
一副朝向普通开发者和企业用户:装了阀门,按用量计费,遇到敏感问题悄然换模型作答。另一副朝向经审核的特定机构:能力完整,通道独立,不对外公开。
Anthropic 将这套机制称为"可信访问"。
但问题随之浮现:谁是"不可信的"那方?按月付了订阅费的普通用户?交了 API 费用的中小企业开发者?还是那些没有渠道进入 Glasswing 名单的创业公司?
Anthropic 没有点明,但结构分化已经白纸黑字摆在那里。当有资格使用完整模型能力的,恰好是资金最雄厚、政府关系最深、行业话语权最强的那批机构,这件事就不再只是安全治理的技术问题了。
Fable 5 发布之后,普通用户究竟落在这张地图的哪个角落?
过去几年,整个大模型行业一直在高喊"AI 民主化"——最新最强的模型一旦发布,所有人同步体验,每月 $20 就能摸到全球最前沿的 AI 能力。这套叙事极具吸引力,也很像互联网时代的产品逻辑:规模越大,边际成本越低,用的人越多越便宜。
Fable 5 给出了一个截然不同的答案:前沿 AI 不是按这个逻辑运转的,不会无差别开放给所有人。
当用户分层的机制已经落地,普通人在这套结构里的位置,正被温和而坚定地往下压。
如果按照使用门槛和能力粗略划分,如今 Anthropic 的模型矩阵大致是这样排列的:能力越往上,离普通用户越远。
这个趋势有个更直白的名字:高端化。
从商业逻辑看,把最强能力卖给最愿意付账的人,是一个完全合理的商业决策。算力有成本,前沿研发有成本,Anthropic 需要在 IPO 前向市场证明其收入结构的健康度。
但高端化同时意味着,AI 正在完成一次身份切换:它不是 AI 民主化进程里的一步,而恰恰是 AI 分层化走到台面上的一步。
最强的能力进入"可信访问"时代,最贵的账单按任务链条累加,最普通的用户被引导向那个"够用就行"的版本。
$20/月就能触碰前沿 AI 的时代,可能真的翻篇了。