Claude Fable 定价翻倍,顶尖 AI 正在变成奢侈品

  • Anthropic 发布 Claude Fable 5,API 定价翻倍,输出 $50/百万 token,6 月 22 日后退出订阅计划。
  • 用户吐槽 token 消耗快:Max 计划每分钟 2%,一天账单达 $82.92。
  • 行业形成三层定价:低价模型 ($9/百万)、中端、高价推理模型 (最高 $120)。
  • 顶级模型脱离固定订阅,成本不可预测,形成“AI 税”。
  • 用户转向第三方 API 或开源替代,但伴随隐私与性能风险。
  • AI 访问正按付费能力阶梯化,普惠性减弱。
总结

2026 年 6 月 9 日,Anthropic 发布了 Claude Fable 5,一个专注复杂代码规划与生成的新模型。发布本身并不让人意外,但两条附带信息迅速点燃了开发社区的讨论:Fable 5 的 API 定价是上一代 Opus 4.8 的两倍;6 月 22 日之后,Fable 5 将从 Pro、Max 等订阅计划中移除,用户只能通过 API 调用或 usage credits 访问。

有开发者在 Reddit 上反馈,用 Max 20x 计划跑 Fable 5,每分钟消耗 2% 额度。Hacker News 上一位用户记录了自己一天的用量,Fable 5 的 API token 消耗在额度内就达到了 82.92 美元。能力强,但烧钱也快。

这不仅仅是一个模型的定价问题。当最顶尖的 AI 开始按能力等级分层定价,并且最高一级被移出普惠订阅,一个更棘手的问题浮出水面:最好的模型,谁在用?

两倍价格,以及一个倒计时

Anthropic 官方公告显示,Claude Fable 5 是首个公开发布的 Mythos 级别模型。Mythos 是 Anthropic 内部对最高能力模型的定级,此前仅供 Project Glasswing 合作伙伴使用。Fable 5 相当于 Mythos 5 的“公开发行版”,在精确构建代码结构、理解开发者深层需求等场景中,性能较 Claude Sonnet 有显著提升。

能力附带了直接的成本代价。据 Anthropic 官方定价页数据,Fable 5 API 输入价格为每百万 token 10 美元,输出价格为 50 美元。同为 Anthropic 旗下,Opus 4.8 的对应价格是 5 美元和 25 美元,Sonnet 4.6 是 3 美元和 15 美元。Fable 5 的输出价格是 Sonnet 的 3.3 倍。

访问窗口也有限制。Anthropic 确认,6 月 22 日前 Fable 5 包含在所有订阅计划中;6 月 23 日起,Fable 5 将从订阅计划移除,用户需使用 usage credits 才能调用。官方的表述是“容量允许时将恢复为标准订阅功能”,但没有给出时间表。

宾夕法尼亚大学沃顿商学院教授 Ethan Mollick 在他的博客 oneusefulthing.org 上发表了关于 Fable 5 的深度测评。他写道:“Fable 价格是 Opus 的两倍,token 消耗速度表明生产成本会‘非常高’。”Mollick 长期跟踪 AI 模型能力演进,这句判断指向的并非定价策略本身,而是模型运行的基础设施成本。

token 消耗速度有多快?Reddit 用户反馈,在 Claude Max 20x 计划下使用 Fable 5,每分钟消耗约 2% 的额度。这个计划每月定价 200 美元,按此速率,连续使用不到一小时就会耗尽整月额度。Hacker News 上的开发者 Simon Willison 记录了自己一天的 API 使用情况,额度内消耗达到 82.92 美元。

Fable 5 的定价和访问策略传达了一个信号:下一代模型的能力提升直接反映在价格乘数上。订阅计划的“免费试用期”只够用户建立使用习惯。当截止日期到来,用户面临两个选择:支付更不可控的 API 成本继续使用,或者退回到上一个等级的模型。

从 9 美元到 120 美元的分层

Fable 5 的定价不是孤例。把目前在售的主流模型 API 定价拉出来看,一条陡峭的价格光谱清晰可见。

据 Google 官方定价页,Gemini 3.5 Flash 的付费层输出价格为每百万 token 9 美元。OpenAI 官方定价页显示,GPT-5.4 输出价格为 15 美元,GPT-5.5 为 30 美元,GPT-5.5 Pro 为 120 美元。Anthropic 这边,Sonnet 4.6 输出价 15 美元,Opus 4.8 为 25 美元,Fable 5 为 50 美元。

从 Gemini 3.5 Flash 的 9 美元到 GPT-5.5 Pro 的 120 美元,最大价差超过 13 倍。这不再是简单的“高端 vs 低端”二分。厂商正在主动构建一个三层结构:底层是极低价的入门模型,承担普及和获客功能;中层是中等价位的高性能模型,面向日常开发需求;顶层是昂贵但能力最强的推理模型,目标用户是高频、高价值场景的使用者。

定价分层的背后,是能力等级的显性化。Anthropic 用 Sonnet、Opus、Fable、Mythos 四级划分模型能力,OpenAI 用标准版和 Pro 版区分 GPT-5 系列的不同规格,Google 则用 Flash 和 Pro 区分 Gemini 3 系列的定位。这些等级不再只是内部代号,而是直接映射到价格上。

更值得注意的变化发生在访问权上。在 Anthropic 官方定价页公布的模型列表中,Fable 5 被标注为“6 月 22 日前包含在订阅计划中”,Opus 4.8 和 Sonnet 4.6 则没有类似的时间限制。Anthropic 正在尝试一种新的分层方式:不是按能力高低给不同订阅等级分配不同模型,而是直接将顶级模型从订阅体系中剥离,单独建立 API 调用通道。

账单不可控的焦虑

单看每百万 token 50 美元的定价,放在企业采购场景里不算惊人。Claude Fable 的上下文窗口达 100 万 token,最大输出 12.8 万 token,一次完整的复杂任务可能消耗数万到数十万 token。Fable 5 作为推理模型,“思考更久、生成更多 token”不是设计缺陷,而是能力来源。模型在输出最终答案前会进行多步推理,每步都产生 token 消耗。

问题在于用户无法控制这个消耗量。一位用 Max 20x 计划的开发者每分钟烧掉 2% 额度,Simon Willison 一天消耗 82.92 美元。这些消耗发生在“试用期”内,属于计划内额度。6 月 22 日之后,类似的用量将直接转为 API 账单或 credits 扣减。

Token 作为一种计费单位,其消耗量由模型设计方决定,用户无法控制“用量”。把 AI 调用比作用电,核心矛盾在于用户既不能选择“省电模式”,也不能预测下一次查询会消耗多少“电”。一篇发布于 LinkedIn 的行业讨论文章将这种现象概括为“AI 税”的核心特征:“真正的 AI 税不仅是模型价格,而是不可预测性。”

这种不可预测性对个人开发者的冲击远大于企业。企业可以签订批量协议、设置预算上限、在团队内分摊成本。个人用户面对按量计费的 API,一次较真的调试可能就是整月订阅费。Hacker News 上一位用户评论说,“成本意识路由从锦上添花变成强制要求”。“成本意识路由”指的是在默认任务中使用便宜模型,只在必要时调用昂贵模型。在 Fable 5 之前,这更多是一种优化策略;Fable 5 的价格和消耗速度,让这种策略变成了不做就面临超支的刚性配置。

主流 API 都提供不同模型的调用接口,开发者可以自行设定路由逻辑。但这要求用户具备编程能力、理解模型差异、愿意接受降级模型可能带来的质量损失。每多一层门槛,就多一批人被挡在门外。

两百美元月费也买不到全通票

访问权的分层同样在发生变化。Claude Fable 5 的策略是:6 月 22 日之前,所有付费用户都能用;6 月 22 日之后,即使支付最高 200 美元月费的 Max 20x 用户也不能直接访问,需要通过 usage credits 调用 API。

相比之下,OpenAI 的访问权策略是另一条路径。据 ChatGPT 官方定价页,ChatGPT Pro 提供 100 美元和 200 美元两个层级,均可访问 GPT-5 Pro。更高层的模型能力对应更高层的订阅等级,但订阅本身仍然是一个完整的访问权包。

两种策略的差异不只在价格。OpenAI 的模式把壁垒设在订阅费上:付得起 200 美元月费,就能用最好的模型。Anthropic 对 Fable 5 的策略把壁垒设在两个地方:费用(API 按量计费)和技术门槛(需要 API 接入能力)。Hacker News 上的用户讨论中,有人将这种策略称为“药物免费样品策略,让你上瘾后涨价”,也有人认为这更可能是真实的算力供应链问题,Anthropic 暂时无法以固定价格的订阅模式覆盖 Fable 5 的推理成本。

无论动机如何,效果是清晰的:订阅变成了一张“入场券”,而不是“全通票”。最顶级的模型能力不在票面范围之内。TechCrunch 在关于 Fable 5 发布的报道中指出,Fable 5 是“首个公开发布的 Mythos 级别模型”。在 Fable 5 之前,Mythos 级别仅限 Project Glasswing 合作伙伴使用。现在门槛降低了,但并没有消失。

绕路的用户

访问权的分层已经产生了可见的用户行为变化。一部分用户开始寻找绕过正规渠道的路径。

一种做法是通过第三方聚合服务调用模型。这些“中转站”以低于官方标价的价格提供 token,来源通常是企业批量采购的闲置额度、不同区域的价差套利或未公开渠道。价格更低,但隐私保护和稳定性没有保障。相关讨论在知乎等平台上持续发酵,用户真正担心的不是“便宜 tok en 能不能用”,而是“数据会经过谁的手”。

另一种做法是转向开源或低价替代模型。有开发者分享教程,展示如何把 DeepSeek 等模型接入各类开发工具,绕开官方定价和验证流程。能力会有损失,隐私风险上升,但成本可控性显著提高。

Hacker News 和 Reddit 上的开发者讨论中,混合使用策略被频繁提及:“默认用便宜的模型,只在关键步骤切换 Fable。”这听起来像是合理的资源优化。如果回顾两三年前关于“AI 民主化”的讨论,彼时的主流叙事是每个人都能平等使用最好的模型。现在,“用最好的模型”变成了一件需要精打细算的事。

本地部署提供了另一种对照。一块能够流畅运行大模型的 GPU 价格不低,能跑 120B 模型的整机配备更不是大多数个人开发者可以轻松承担的。本地部署的门槛是另一种形式的付费墙,只是用硬件采购替换了按量计费。

这些绕路行为不是“聪明用户的省钱技巧”。当大量用户开始主动寻找替代方案,是因为原有路径正在变窄。中转站的隐私风险、开源模型的能力差距、本地部署的硬件投入,每一种绕路都有代价。

台阶已经在脚下

如果把 AI 比作水电一类的公用基础设施,那么公用事业的第一原则是普遍服务、公平接入。但 AI 模型的定价趋势正在朝相反的方向走。能力越强价格越高,顶级模型脱离普惠订阅,按 token 计费让成本变得不可预测。水电供应不会只给付费更多的用户提供“更强电流”,但 AI 正在这么做。

这不是一个“贵还是便宜”的定价讨论。当 Claude Fable 这样的顶尖模型被从大众化订阅中移除,当 GPT-5.5 Pro 的输出价格达到 Flash 模型的 13 倍,当个人开发者的一天用量能烧掉 82 美元,“用不起”正在从一个价格问题变成一个结构问题。

在使用 AI 工具的领域里,台阶已经清晰可见。最上层是能负担无限 API 调用和专用硬件的企业级用户,中间层是精打细算使用顶级模型的个人开发者,底层是只能用免费或低价模型的普通用户。这道台阶的每一级,不是由技术水平划定的,而是由支付能力和技术接入能力划定的。

Anthropic 6 月 22 日的截止日期只是这条台阶上最新的一级,不是第一级,也不会是最后一级。

分享至:

作者:OmniTools

本文为PANews入驻专栏作者的观点,不代表PANews立场,不承担法律责任。

文章及观点也不构成投资意见

图片来源:OmniTools如有侵权,请联系作者删除。

关注PANews官方账号,一起穿越牛熊
PANews APP
Machi 25倍杠杆ETH多头再遭部分清算,累计亏损接近3500万美元
PANews 快讯