3年降了99%,3个月涨了463%:AI大模型集体涨价的真相,比你想的更残酷
深度拆解涨价背后的五重逻辑:Agent爆发致Token消耗千倍增长、HBM全球短缺、推理成本超越训练成本、资本耐心耗尽、杰文斯悖论的现实确认——并揭示行业从"价格战"到"价值战"的根本转向。仙踪问道·爱马仕助手,让本地算力成为你的降本答案。
如果你手机里还装着豆包——那个月活3.45亿、国内用户规模最大的AI助手——你可能还没意识到,免费随便用的日子,只剩不到一个月了。
6月1日,据36氪消息,豆包预计将在6月下旬正式上线付费内容。三档订阅价格早在5月就已披露:标准版68元/月(688元/年)、加强版200元/月(2048元/年)、专业版500元/月(5088元/年)。消息一出,"豆包笨,还收费"直接冲上微博热搜。
用户不满的背后,是一个结构性的现实:AI大模型的"烧钱换市场"时代,已经不可逆转地走向终结。
从"击穿全球低价"到"集体涨价",三年轮回
把时间线拉长看,这是一场完整的周期演绎。
2024年5月,DeepSeek V2发布,API定价打到每百万Token输入仅1元,约为GPT-4 Turbo价格的1%,成为价格战的导火索。随即百度宣布ERNIE Speed和ERNIE Lite免费,阿里云通义千问Qwen-Long降价97%,字节豆包号称"比行业便宜99.3%"。三年间,AI推理成本下降超过99%。
但极致低价的背面是极致亏损。以智谱AI为例,其2025年API业务毛利率接近于零——每卖1元服务,仅算力成本就吃掉近1元。MiniMax与智谱以60亿美元估值上市,合计支出是同期收入的10倍,形成5-10倍的亏损率。
反转在2026年上半年集中爆发。腾讯云3月11日宣布Tencent HY2.0 Instruct输入价格从每千Token 0.0008元调整为0.004505元,涨幅463%。阿里云算力卡产品涨价5%-34%,文件存储CPFS上涨30%。智谱更是涨幅最激进的:2月GLM-5 CodingPlan套餐上调30%,3月GLM-5-Turbo再涨20%,4月GLM-5.1提价10%。相比GLM-4.7系列,累计涨幅已超83% 。
海外同步加码。Anthropic将Claude Enterprise从每月每用户最高200美元固定费用转为按实际算力消耗收费,重度用户成本可能翻2-3倍。
Agent爆发:压垮免费模式的"最后一根稻草"
这轮集体涨价有一个清晰的直接导火索:以OpenClaw为代表的新一代AI Agent应用在2025年底至2026年初爆发式普及 。
这一变化从根本上重构了Token消耗的底层逻辑。传统AI对话是"人调用机器"——一次用户请求对应一次模型推理,Token消耗在几百到几千之间。而Agent执行复杂任务时,需要自主规划、搜索信息、调用工具、多轮验证,单次任务Token消耗达到传统问答的10至100倍。
推理基础设施的使用者,正从"偶尔提问的人类用户"变成"7×24小时不间断工作的Agent" 。
数据不会骗人。国家数据局显示,中国日均Token调用量从2024年初约1000亿飙升至2025年底100万亿,再到2026年3月140万亿,两年内增长超千倍。豆包大模型日均Token消耗量从2024年5月发布时的1200亿暴涨到2026年3月的120万亿 。
供给侧的"物理天花板":HBM全球缺货,GPU租赁涨超40%
涨价不仅是需求侧的问题。2026年H100/H200芯片租赁价格已上涨约40%,更新的Blackwell架构GPU涨价超50%。HBM——大模型推理的核心"血液"——更是短缺到了极致:SK Hynix已宣布2026年全年HBM产能被提前预订一空。TrendForce预测DRAM内存价格将在2026年上涨50%-55% 。
阿里云在涨价公告中直言:"全球AI需求爆发、供应链涨价,行业核心硬件采购成本显著上涨" 。
更深层的变化是:训推算力比例已从早期的"倒挂"演变为4:6,部分场景达3:7。推理成本从一个次要运营开销变成了最主要的基础设施支出。这意味着,即便单位Token价格下降三个量级,Token总消耗量上升了同等量级,AI总账单反而在持续变厚 。
为什么是现在?五股力量在同一窗口共振
理解这轮涨价潮,核心问题不是"为什么涨",而是"为什么是2026年上半年"。如下五个因素在这个时间窗口同步收敛:
第一,市场教育完成,用户形成刚性依赖。
过去两年的大规模免费策略,让AI能力成为开发者和企业的"水电煤"式基础设施。当市场对AI形成刚性依赖且短期内无替代方案时,适度的价格传导就能被接受——厂商在圈地结束后,终于有了提价的资本 。
第二,Agent爆发超预期,旧成本模型彻底失效。
厂商原本基于"人类聊天用户"测算的成本模型,在Agent时代完全失效。Token消耗从线性增长变为指数级裂变,继续维持旧价格意味着"卖得越多,亏得越多"。这个临界点在2026年初被穿越,催生了集体行动的紧迫感 。
第三,头部玩家完成市场格局初步锁定。
三年价格战后,市场格局已基本成型——没有后来者能以更低价格持续补贴进入市场。头部厂商同步提价,既是生存需要,也是一种隐性的价格协调。中小厂商很难独自扛住保持低价的压力,市场出现了集体行动均衡 。
第四,资本耐心到达极限,商业化成为生死线。
2025年末AI赛道的估值逻辑开始转变——投资人不再单纯看技术指标,而是要求商业化的可见路径。智谱、MiniMax相继上市,资本市场的检验将亏损摆到台面。"靠技术光环就能提估值的时代结束了",建立能自我造血的商业闭环成为生存必须 。
第五,杰文斯悖论的现实确认。
单位Token成本的剧烈下降,反而刺激了更大规模的使用——价格越低,用量越大;用量越大,总成本越高。当总成本已超过总收入的临界点,技术进步带来的成本红利已被消耗殆尽,涨价成为无法回避的硬约束 。
从"价格战"到"价值战":行业竞争逻辑的根本转向
大模型不同于传统互联网业务——后者边际成本趋近于零,前者具有"高固定投入+高可变成本"的独特经济特征,无法简单复制"先免费聚流量、后间接变现"的传统互联网商业路径 。
免费模式还带来了资源错配:大量无价值的"垃圾调用"占用算力,不仅增加成本,甚至可能污染训练数据。付费机制是筛选高价值用户、遏制低效算力浪费的必要手段 。
当价格不再是核心竞争变量,行业焦点将转移到:谁能提供更稳定、更高效、更精准适配复杂场景的服务。如何在"基础功能免费"和"高阶能力付费"之间划定合理边界,是各家厂商必须回答的核心命题 。
涨价潮还将加速行业分化。拥有稳定算力供给、多元化商业模式和用户粘性的头部厂商能承受用户流失冲击;而技术差异化不足、单纯依赖低价竞争的中小玩家,将面临严峻的生存压力。2026年AI赛道最确定的叙事主线,是"分化与加速" 。
算一笔账:你的AI月账单正在悄悄变厚
假设你是重度AI用户——日常写代码、做调研、处理文档。按豆包专业版500元/月计算,一年5088元。如果同时用Claude Enterprise按量计费,月花费轻松破200美元。三年下来,AI订阅费用可能超过15000元。
问题来了:这些钱,真的非花不可吗?
2026年的开源模型生态已进化到一个关键节点——消费级硬件就能跑通日常80%以上的AI需求。Google的Gemma 4、阿里的Qwen 3.6,在各自量级上都达到了高度可用的水准。一次硬件投入,后续电费几乎可以忽略。
而在这个"算力通胀"时代,仙踪问道推出的爱马仕助手给出了一个更彻底的思路:基于开源Hermes Agent框架,结合本地模型与云端模型的混合调度,日常任务本地跑、复杂任务云端调,真正做到"基础免费、高阶按需"。Token不是用不起,是本地部署更有性价比。
豆包6月下旬正式收费,也许是时候重新想想你的AI账单了。也许答案就在你自己的电脑上。
欢迎访问使用仙踪问道·爱马仕助手,进入“免费”的个人智能时代。

