分析文章

3年降了99%，3个月涨了463%：AI大模型集体涨价的真相，比你想的更残酷

深度拆解涨价背后的五重逻辑：Agent爆发致Token消耗千倍增长、HBM全球短缺、推理成本超越训练成本、资本耐心耗尽、杰文斯悖论的现实确认——并揭示行业从"价格战"到"价值战"的根本转向。仙踪问道·爱马仕助手，让本地算力成为你的降本答案。

仙踪问道

02 Jun 2026 — 9 min read

如果你手机里还装着豆包——那个月活3.45亿、国内用户规模最大的AI助手——你可能还没意识到，免费随便用的日子，只剩不到一个月了。

6月1日，据36氪消息，豆包预计将在6月下旬正式上线付费内容。三档订阅价格早在5月就已披露：标准版68元/月（688元/年）、加强版200元/月（2048元/年）、专业版500元/月（5088元/年）。消息一出，"豆包笨，还收费"直接冲上微博热搜。

用户不满的背后，是一个结构性的现实：AI大模型的"烧钱换市场"时代，已经不可逆转地走向终结。

从"击穿全球低价"到"集体涨价"，三年轮回

把时间线拉长看，这是一场完整的周期演绎。

2024年5月，DeepSeek V2发布，API定价打到每百万Token输入仅1元，约为GPT-4 Turbo价格的1%，成为价格战的导火索。随即百度宣布ERNIE Speed和ERNIE Lite免费，阿里云通义千问Qwen-Long降价97%，字节豆包号称"比行业便宜99.3%"。三年间，AI推理成本下降超过99%。

但极致低价的背面是极致亏损。以智谱AI为例，其2025年API业务毛利率接近于零——每卖1元服务，仅算力成本就吃掉近1元。MiniMax与智谱以60亿美元估值上市，合计支出是同期收入的10倍，形成5-10倍的亏损率。

反转在2026年上半年集中爆发。腾讯云3月11日宣布Tencent HY2.0 Instruct输入价格从每千Token 0.0008元调整为0.004505元，涨幅463%。阿里云算力卡产品涨价5%-34%，文件存储CPFS上涨30%。智谱更是涨幅最激进的：2月GLM-5 CodingPlan套餐上调30%，3月GLM-5-Turbo再涨20%，4月GLM-5.1提价10%。相比GLM-4.7系列，累计涨幅已超83% 。

海外同步加码。Anthropic将Claude Enterprise从每月每用户最高200美元固定费用转为按实际算力消耗收费，重度用户成本可能翻2-3倍。

Agent爆发：压垮免费模式的"最后一根稻草"

这轮集体涨价有一个清晰的直接导火索：以OpenClaw为代表的新一代AI Agent应用在2025年底至2026年初爆发式普及。

这一变化从根本上重构了Token消耗的底层逻辑。传统AI对话是"人调用机器"——一次用户请求对应一次模型推理，Token消耗在几百到几千之间。而Agent执行复杂任务时，需要自主规划、搜索信息、调用工具、多轮验证，单次任务Token消耗达到传统问答的10至100倍。

推理基础设施的使用者，正从"偶尔提问的人类用户"变成"7×24小时不间断工作的Agent" 。

数据不会骗人。国家数据局显示，中国日均Token调用量从2024年初约1000亿飙升至2025年底100万亿，再到2026年3月140万亿，两年内增长超千倍。豆包大模型日均Token消耗量从2024年5月发布时的1200亿暴涨到2026年3月的120万亿。

供给侧的"物理天花板"：HBM全球缺货，GPU租赁涨超40%

涨价不仅是需求侧的问题。2026年H100/H200芯片租赁价格已上涨约40%，更新的Blackwell架构GPU涨价超50%。HBM——大模型推理的核心"血液"——更是短缺到了极致：SK Hynix已宣布2026年全年HBM产能被提前预订一空。TrendForce预测DRAM内存价格将在2026年上涨50%-55% 。

阿里云在涨价公告中直言："全球AI需求爆发、供应链涨价，行业核心硬件采购成本显著上涨" 。

更深层的变化是：训推算力比例已从早期的"倒挂"演变为4:6，部分场景达3:7。推理成本从一个次要运营开销变成了最主要的基础设施支出。这意味着，即便单位Token价格下降三个量级，Token总消耗量上升了同等量级，AI总账单反而在持续变厚。

为什么是现在？五股力量在同一窗口共振

理解这轮涨价潮，核心问题不是"为什么涨"，而是"为什么是2026年上半年"。如下五个因素在这个时间窗口同步收敛：

第一，市场教育完成，用户形成刚性依赖。

过去两年的大规模免费策略，让AI能力成为开发者和企业的"水电煤"式基础设施。当市场对AI形成刚性依赖且短期内无替代方案时，适度的价格传导就能被接受——厂商在圈地结束后，终于有了提价的资本。

第二，Agent爆发超预期，旧成本模型彻底失效。

厂商原本基于"人类聊天用户"测算的成本模型，在Agent时代完全失效。Token消耗从线性增长变为指数级裂变，继续维持旧价格意味着"卖得越多，亏得越多"。这个临界点在2026年初被穿越，催生了集体行动的紧迫感。

第三，头部玩家完成市场格局初步锁定。

三年价格战后，市场格局已基本成型——没有后来者能以更低价格持续补贴进入市场。头部厂商同步提价，既是生存需要，也是一种隐性的价格协调。中小厂商很难独自扛住保持低价的压力，市场出现了集体行动均衡。

第四，资本耐心到达极限，商业化成为生死线。

2025年末AI赛道的估值逻辑开始转变——投资人不再单纯看技术指标，而是要求商业化的可见路径。智谱、MiniMax相继上市，资本市场的检验将亏损摆到台面。"靠技术光环就能提估值的时代结束了"，建立能自我造血的商业闭环成为生存必须。

第五，杰文斯悖论的现实确认。

单位Token成本的剧烈下降，反而刺激了更大规模的使用——价格越低，用量越大；用量越大，总成本越高。当总成本已超过总收入的临界点，技术进步带来的成本红利已被消耗殆尽，涨价成为无法回避的硬约束。

从"价格战"到"价值战"：行业竞争逻辑的根本转向

大模型不同于传统互联网业务——后者边际成本趋近于零，前者具有"高固定投入+高可变成本"的独特经济特征，无法简单复制"先免费聚流量、后间接变现"的传统互联网商业路径。

免费模式还带来了资源错配：大量无价值的"垃圾调用"占用算力，不仅增加成本，甚至可能污染训练数据。付费机制是筛选高价值用户、遏制低效算力浪费的必要手段。

当价格不再是核心竞争变量，行业焦点将转移到：谁能提供更稳定、更高效、更精准适配复杂场景的服务。如何在"基础功能免费"和"高阶能力付费"之间划定合理边界，是各家厂商必须回答的核心命题。

涨价潮还将加速行业分化。拥有稳定算力供给、多元化商业模式和用户粘性的头部厂商能承受用户流失冲击；而技术差异化不足、单纯依赖低价竞争的中小玩家，将面临严峻的生存压力。2026年AI赛道最确定的叙事主线，是"分化与加速" 。

算一笔账：你的AI月账单正在悄悄变厚

假设你是重度AI用户——日常写代码、做调研、处理文档。按豆包专业版500元/月计算，一年5088元。如果同时用Claude Enterprise按量计费，月花费轻松破200美元。三年下来，AI订阅费用可能超过15000元。

问题来了：这些钱，真的非花不可吗？

2026年的开源模型生态已进化到一个关键节点——消费级硬件就能跑通日常80%以上的AI需求。Google的Gemma 4、阿里的Qwen 3.6，在各自量级上都达到了高度可用的水准。一次硬件投入，后续电费几乎可以忽略。

而在这个"算力通胀"时代，仙踪问道推出的爱马仕助手给出了一个更彻底的思路：基于开源Hermes Agent框架，结合本地模型与云端模型的混合调度，日常任务本地跑、复杂任务云端调，真正做到"基础免费、高阶按需"。Token不是用不起，是本地部署更有性价比。

豆包6月下旬正式收费，也许是时候重新想想你的AI账单了。也许答案就在你自己的电脑上。

欢迎访问使用仙踪问道·爱马仕助手，进入“免费”的个人智能时代。