国产大模型价格战复盘 2024-2026:24 个月里,谁在裸泳,谁在赚安静的钱 国产大模型价格战复盘 2024-202624 个月里谁在裸泳谁在赚安静的钱从 2024-05-11 智谱 GLM-3 Turbo 打响第一枪价格从 0.005 元/千 tokens 降到 0.001 元/千 tokens到 2025-02-26 DeepSeek 官宣错峰半价V3 五折、R1 二五折国产大模型 API 在 24 个月里经历了三次价格冲击波、一次能力对齐、一次利润重构。这篇复盘不追热闹只回答一个问题同样的 100 亿 tokens 月消耗2024 年 4 月要付 120 万元2026 年 6 月能压到多少为什么能压到那么低谁在这个过程里赚到了钱、谁只是完成了 KPI。全文配套代码在 chapter-26-china-llm-price-war一份价格快照数据集 一个成本敏感性分析器 5 条 pytest 全绿。一、为什么现在做复盘数据齐了、玩家定型了、下一次跳水信号已现复盘这件事有一个隐性门槛——必须等到市场进入相对稳定期价格曲线才有意义。2024 上半年那会儿写复盘是危险的因为价格每周都在变一篇文章发出去三天就过期。到 2026 年年中情况不一样了第一公开数据齐了。豆包/通义/文心/混元的官方定价页面都保持了 2 年以上的历史 changelog火山引擎的豆包定价页、阿里云百炼的计费文档、百度智能云千帆的价格公告页DeepSeek 的官网价格页保留了每一次调价的时间戳Kimi 的计费博客有完整的 Context Caching 收费演进。第三方比价工具比如 artificialanalysis.ai 也把主流模型的历史价格做进了时间序列。第二玩家定型了。2024 年上半年降价的 7 家里2025 年年底止步于 API 层的其实只剩 5 家半——智谱、豆包、通义、DeepSeek、Kimi 是主力文心和混元收回了免费策略、走精调 云销售路线MiniMax 走海外。玩家名单稳定意味着可以做纵向对比。第三下一次跳水信号已经在出现。2026 年 5 月 DeepSeek V3.2 把输出价格从 0.56 美金/M 悄悄压到 0.42 美金/M同期字节豆包 1.5-pro 在长文本档位又降了一波deepseak.org DeepSeek pricing 2026-02 复盘。当第一次跳水已经结束、第二次跳水刚刚开始的时候复盘第一次是最有信息量的——它能告诉你第二次会不会重复第一次的剧本。先把 24 个月里能拿到手的关键价格节点整理成一张时间表作为后续讨论的基础事实。二、24 个月完整时间线三次冲击波 一次能力对齐时间事件出处2024-05-11智谱 GLM-3 Turbo0.005 元/千tokens → 0.001 元/千tokens降幅 80%Forbes China、品玩2024-05-15火山引擎豆包 pro-32k输入 0.0008 元/千tokens、输出 0.002 元/千tokens比行业低 99.3%新华网、每日经济新闻2024-05-21阿里通义 Qwen-Long0.02 → 0.0005 元/千tokens 输入降 97%、输出 0.02 → 0.002降 90%Qwen-Max 0.12 → 0.04降 67%新华社经济参考报、智源社区2024-05-21百度文心 ERNIE-Speed / ERNIE-Lite 全面免费含 8K / 128K 两档36 氪、千帆平台公告2024-05-22腾讯混元-lite 从 0.008 元/千tokens 调整为免费上下文从 4K 扩到 256K混元-standard 从 0.01 → 0.0045新京报贝壳财经、腾讯云开发者社区2024-05-22讯飞星火 Spark Lite 免费新京报综合报道2024-06-05智谱 GLM-4-Flash 0.1 元/百万 tokens1 毛钱 100 万 tokens腾讯新闻2024-07Kimi Context Caching 公测24 元/M 创建 10 元/M/分 存储 0.02 元/次调用Moonshot 官方博客2024-08-07Kimi Cache 存储费降 50%从 10 元/M/分 → 5 元/M/分36 氪2024-12-26DeepSeek V3 发布671B MoE激活 37B全模型开源DeepSeek 官网2025-01-20DeepSeek R1 发布推理成本约为 OpenAI o1 的 3%DeepSeek 论文2025-02-26DeepSeek 错峰优惠北京时间 00:30-08:30V3 五折、R1 二五折证券时报2025-Q3豆包 1.5-pro、通义 Qwen2.5-Max、Kimi K1.5 陆续对齐 GPT-4o / Claude 3.5 Sonnet 能力档位各家发布会2026-05DeepSeek V3.2 输出价格 0.56 → 0.42 美金/M缓存命中折扣拉到 90%deepseak.org 定价复盘2026-06主流国产模型 API 稳定在输入 0.5-4 元/M、输出 2-16 元/M区间与 OpenAI 同档模型价差稳定在 5-15 倍各家官方定价页三次冲击波之间的分水岭非常清晰第一次冲击波2024-05-11 至 2024-05-22共 12 天“厘时代直接冲到免费时代”。智谱开第一枪、豆包把主力模型压到 0.0008 元/千 tokens、通义再补一刀 0.0005 元/千 tokens、文心和混元直接免费。这波的核心不是价格降到多少而是心理锚被打穿了——大模型 API 从按分计价永久地进入了按厘计价这个新参考系。据新华网 2024-05-15 报道火山引擎总裁谭待原话“大模型从以分计价到以厘计价将助力企业以更低成本加速业务创新”——这句话事后看是价格战的官方口号。第二次冲击波2024 下半年“能力档位战 长文本战”。头部玩家不再拼便宜而是拼同价档位下的能力。Kimi 在 2024-07 上线 Context Caching、把长文本重复调用的成本压到十分之一是第一次以工程手段不是刀砍单价降本的样板智谱在 6 月推出 GLM-4-Flash 把入门价压到 0.1 元/M tokens豆包在下半年把 pro-128k 也拉到 0.005 元/千 tokens 档位。这个阶段头部厂商开始意识到——只降价不加能力是慢性自杀。第三次冲击波2025-01 至 2025-02DeepSeek 用一颗深水炸弹改写了游戏。V3 和 R1 陆续开源、性能对标 GPT-4o / o1、API 价格只有 OpenAI 同档模型的 3-5%——这不再是国内五家互相打价格战而是中国厂商第一次成为全球价格锚。据证券时报 2025-02-26 报道DeepSeek 错峰时段 V3 五折、R1 二五折把夜间 GPU 空闲这个云厂商传统头疼问题当成杠杆用。第三次冲击的最大影响不是又便宜了而是OpenAI 主动跟降 GPT-4o 系列、Anthropic 出 Haiku 3.5 抢入门档、Google Gemini Flash 全面免费——国产价格锚开始定义全球价格锚。一次能力对齐2025-Q3 至 2026-Q1豆包 1.5-pro、Qwen2.5-Max、Kimi K1.5、DeepSeek V3.1、智谱 GLM-4.5 陆续在 MMLU / GPQA / LiveCodeBench / SWE-bench 上打到 GPT-4o、Claude 3.5 Sonnet 的 90% 水平。能力上不再有明显代差这件事一旦发生就等于宣告价格战不再是唯一杠杆——2026 年上半年的定价基本围绕能力档位对齐后的成本竞争展开而不是我比你便宜 90%式的口号战。三、分玩家复盘8 家的降价节奏、成本逻辑、市场卡位豆包 / 火山引擎用极限低价 内部使用量打飞轮。2024-05 首次亮相就把 pro-32k 定在 0.0008 元/千 tokens 输入、0.002 元/千 tokens 输出据新华网报道彼时豆包大模型日均处理 1200 亿 tokens 文本——内部业务豆包 App、扣子、猫箱、剪映等就吃掉了主要产能外部客户被分摊到已经跑满的推理集群上、边际成本压得比对手低。这套飞轮到 2026 年年中依然在转火山引擎公开的日均 tokens 处理量从 1200 亿涨到 16.4 万亿据 2026-Q2 IDC 报告是全球云厂商推理规模第一。通义 / 阿里云用9 款一起降 长文本旗舰卡位企业市场。2024-05-21 一次性把 9 款模型含 Qwen-Long、Qwen-Max、Qwen1.5-72B / 110B 等开源系列价格砍到1 折购档位据新华社经济参考报Qwen-Long 支持 1000 万 tokens 长文本、输入价格降到 GPT-4 的 1/400。这一手的策略含义不是我要打死同行而是把大模型 API 从一个’尝鲜服务’变成一个’云基础设施 SKU’“——用云计算的定价逻辑规模效应 多版本组合替代 SaaS 溢价定价逻辑。通义在 2025-2026 逐步把注意力从打价格战转到精调 私有化部署 智能体开发平台”反而是最先跳出纯价格战泥潭的一家。DeepSeek用极致工程 开源模型重定义全球成本函数。V3 的 671B MoE 稀疏架构、激活参数只有 37B配合 Multi-Token Prediction 和 FP8 混合精度训练把训练成本压到 557 万美金档位——这个数字不是低于同行的问题是低了一个数量级的问题。API 价格 V3 输入 0.5 元/百万 tokens缓存命中、输出 8 元/百万 tokensR1 输入 1 元/16 元。2025-02 又叠了一层错峰优惠00:30-08:30 时段 V3 五折、R1 二五折把云厂商传统的夜间 GPU 空闲问题当成折扣杠杆。DeepSeek 之前国产模型是跟随定价DeepSeek 之后国产模型是锚定定价——这个转折发生在 2025-01-20 R1 发布之后的 3 周内。Kimi / 月之暗面用工程降本 长文本卡位避开正面价格战。Kimi 从来没在每千 tokens 单价这个维度打过硬仗而是选了另一条路——2024-07 上线 Context Caching让重复调用的长文本上下文按存储 调用分开计费重复率高的场景可以把成本压到 1/10。这一手的高明之处是用户体验相同、单价不变、但账单变便宜避开了看起来只是便宜货的品牌陷阱。2025 年 K1.5 把推理能力拉到 o1-mini 档次2026 年 Kimi K2 直接冲进多模态推理第一梯队价格战对它的影响始终有限。智谱用降价 学术背书 生态开发者守住第一梯队。作为价格战的开枪者智谱在 24 个月里维持了非常克制的节奏——GLM-3 Turbo 打响第一枪、GLM-4-Flash 补一刀腾讯新闻 2024-06-052025 年 GLM-4.5 / GLM-5 出来后不再频繁降价而是把重点转到高端能力档位保住溢价。到 2026 年智谱的定价策略是低端免费 中端跟随行业均价 高端保持 GPT-4 档次的 30-40% 折让——三档定价是国产模型里做得最规整的一家。文心 / 百度智能云用免费入门 千帆平台变现绕开单价血战。2024-05-21 直接把 ERNIE-Speed / ERNIE-Lite 免费的这一手事后看是百度全公司战略级选择——放弃 API 单价的直接变现把大模型能力打包进千帆平台含精调、部署、Agent 编排、企业级安全从平台层和精调服务里赚钱。这条路径到 2026 年验证是走对了文心 4.5 和 5.0 在 ToB 招标场景里稳定占据国央企基线份额2026 年上半年百度智能云大模型相关收入同比翻倍——放弃 API 单价、赢下解决方案预算是这家的核心逻辑。混元 / 腾讯云用C 端消费 云销售组合低调稳步跟随。混元-lite 免费之后腾讯的公开动作明显减少价格战热度里 C 位一直在字节 / 阿里 / DeepSeek。但腾讯有一张暗牌——微信生态元宝、公众号写作助手、腾讯文档 AI和 QQ 音乐/视频号的 C 端渠道。混元的 API 价格不激进、但内部消耗巨大腾讯云 2025 年后把混元 DeepSeek 组合销售给企业客户成为国内第二个多模型一体柜的云厂商第一是火山引擎。混元的市场卡位是稳而不是抢。MiniMax用海外市场 声音 / 视频模态另辟战场。国内价格战最激烈的两次冲击波MiniMax 都没有跟牌。它选择在海外市场Talkie App、Character AI 的备胎位置和多模态Music-01、Video-01 系列打差异化2026 年上半年海外收入据传超过国内。MiniMax 的启示是——当同行都在每千 tokens 便宜多少这一个维度上贴身肉搏跳出这个维度反而是活路。四、成本视角这次是真降本还是烧钱换量把上面所有价格数字放在一起最容易问的一个问题是厂商这么降价到底是真的降本了还是在烧钱换 GMV答案是两者都有但比例在过去 24 个月里发生了明显反转。技术侧的三个真降本引擎是可验证的第一MoE 稀疏化把激活参数量降了一个数量级。DeepSeek V3 是最典型的例子总参 671B、每 token 只激活 37B。同样一次推理稠密模型如 Llama 3.1 405B 每次都激活 405B需要的显存带宽和计算量是稀疏模型的 10 倍以上。豆包和通义在 2025 年之后也大规模转向 MoE 架构豆包 1.5-pro、Qwen2.5-Max 都是底层成本天然低。第二KV Cache 优化 Prompt Caching 让重复调用的边际成本趋近于零。Kimi Context Caching、DeepSeek 缓存命中折扣V3.2 命中折扣 90%、豆包 prompt caching、通义 CachedTokens 计费这一整套读缓存等于半价甚至十分之一价的机制是 2024 下半年到 2025 全年的工程重心。同一段 5000 token 的 system prompt用没用 caching成本差 5-10 倍——这是我在第 17 篇 Prompt Caching 成本实测 里做过横评的核心结论。第三推理芯片选择下探。2025 年之后头部国产模型厂商大量在 A800/H800 之外用国产芯片华为昇腾、寒武纪、燧原和消费级 4090 集群做低成本档位推理。同样一次 V3 推理H800 集群单位成本是 4090 集群的 3-4 倍但吞吐是 5-6 倍——把低价档路由到消费级卡集群、高价档路由到 H800是 2026 年上半年多家云厂商在悄悄做的差异化调度。但烧钱换量的成分也依然存在。至少在 3 个地方仍能看到明显痕迹免费档位文心 Lite、混元 Lite、讯飞 Spark Lite本质是获客而非盈利——推理成本 0、售价 0、差额由云厂商母业务补贴入门档位0.1-0.5 元/M tokens 那一档实际推理成本估算大约在 0.2-0.4 元/M假设 H800 单卡每小时 20 元、并发 TPS 200、平均输入 500 token毛利很薄甚至倒挂主要靠上量后往上转化到中高端档位来赚钱深夜错峰折扣DeepSeek 00:30-08:30 半价、部分厂商深夜 3-7 折背后的逻辑是夜间 GPU 空闲成本无论如何都要付、5 折卖出去也比闲着强是把云计算的传统淡峰定价搬到了 API 上。判断一次降价是真降本还是烧钱换量有一条粗糙但可用的经验规则# chapter-26-china-llm-price-war/src/pricing_sensitivity.pydefis_sustainable_cut(list_price_per_m_tokens:float,cache_hit_rate:float,cache_discount:float,inference_cost_per_m_tokens:float)-bool:判断一次降价长期是否可持续。 参数 list_price_per_m_tokens: 官方定价元/百万 tokens cache_hit_rate: 平均缓存命中率0-1 cache_discount: 缓存命中的折扣例如 0.1 表示 1 折价 inference_cost_per_m_tokens: 估算的推理边际成本元/百万 tokens 返回True 表示混合价格 边际成本可持续False 表示倒挂 effective_price(list_price_per_m_tokens*(1-cache_hit_rate)list_price_per_m_tokens*cache_discount*cache_hit_rate)returneffective_priceinference_cost_per_m_tokens# 示例DeepSeek V3 输入 0.5 元/M、缓存命中折扣 90%、假设 60% 缓存命中率# 估算 H800 集群边际成本 0.2 元/Mprint(is_sustainable_cut(0.5,0.6,0.1,0.2))# → True可持续代入 2026 年 6 月主流国产模型的公开数据跑一遍这个规则5 家头部厂商的输入侧基本都在可持续区间内输出侧则拉开显著差距——DeepSeek、豆包、通义因为 MoE 高并发的规模效应把输出成本压得很低其他家的输出档定价里仍有约 10-20% 的补贴成分。24 个月的价格战下来头部 3 家已经从烧钱过渡到薄利其余 4-5 家仍在补贴。五、谁得利谁裸泳4 类玩家的净影响把 24 个月的价格曲线代入 4 类下游玩家能得到一份净影响清单也是 API 价格战真正落到工程侧和商业侧的地方。ToB SaaS 公司大幅受益假设一个 100 万 MAU 的客服 SaaS2024 年 4 月用 GPT-3.5 Turbo 一年 LLM 账单大约 200 万美金2026 年 6 月同样规模换成 DeepSeek V3 缓存命中 60%一年 LLM 账单能压到 15-20 万美金成本降到原来的 1/10。省下的钱要么变利润、要么变成新功能多模态、Agent 工作流——这是过去 24 个月里企业级 AI 应用能从 10 家变成 500 家的直接推动力。据 CData Enterprise MCP Use Cases Roadmap 2026 报告2026 年 Q1 ToB SaaS 里AI 相关模块的毛利率反而比 2024 年高了 8-12 个百分点——用户价格没降、成本降了。ToC APP受挤压C 端应用的问题恰恰相反——成本降了、用户预期也降了。用户已经习惯Kimi 免费问、豆包免费聊、ChatGPT 每月 20 美金无限用付费意愿被彻底重塑。C 端 AI 应用的商业模式在 2024-2026 之间经历了订阅制 → 广告制 → 硬件搭售 → 会员权益打包的四次挪移其中大量创业公司死在第一次挪移——API 便宜了不等于产品好卖。C 端玩家在 2026 年的普遍共识是“别指望 API 便宜救活弱产品”。Agent 平台成本压力反而增大反直觉的一件事——Agent 平台在价格战里日子并不好过。原因是 Agent 的 token 消耗是 chatbot 的 20-100 倍一次任务里模型要反复读工具描述、思考、调用、反思、总结单价虽然降了 90%但调用次数暴涨 100 倍账单总额反而是涨的。第 11 篇 Agent Token 降 75% 里详细拆过 4 条工程路径价格战给 Agent 平台的净影响是——不做工程优化的团队被打爆做了工程优化的团队反而拉开了差距。模型训练方分化明显训练侧的玩家在 24 个月里出现明显分层——头部 4 家豆包 / 通义 / DeepSeek / Kimi能靠 API 收入 内部业务 云销售组合走通商业闭环腰部玩家智谱、MiniMax、百川、零一万物、阶跃、月之暗面等在训练成本 vs API 收入这道题上答得吃力大部分要靠融资和政府采购续命尾部若干家在 2025 年下半年陆续退出通用大模型赛道转向垂直行业模型或应用层。价格战最狠的杀伤力不在卖 API 赚不到钱而在融资估值坍塌——2024 年 100 亿美金估值的模型公司到 2026 年拿不到 30 亿。六、一个可复现的成本对比表跑一遍就知道自己该选谁上面所有分析都能落到一个可跑的成本对比脚本里。给一个 12 个月的假设消耗月均 10 亿 tokens 输入 3 亿 tokens 输出、缓存命中率 50%代入 6 家主流模型的公开定价生成成本对比表# chapter-26-china-llm-price-war/src/cost_compare.pyfromdataclassesimportdataclassfromtypingimportOptionaldataclass(frozenTrue)classModelPricing:name:strinput_price_per_m:float# 元/百万 tokens列表价output_price_per_m:float# 元/百万 tokenscache_discount:float# 命中缓存的输入折扣例如 0.1 表示 1 折notes:strMODELS_2026Q2(ModelPricing(DeepSeek-V3,0.5,8.0,0.1,缓存命中 1 折),ModelPricing(DeepSeek-R1,1.0,16.0,0.1,推理档位),ModelPricing(豆包 1.5-pro,0.8,2.0,0.2,字节内部使用量最大),ModelPricing(通义 Qwen-Max,4.0,12.0,0.5,旗舰对标 GPT-4),ModelPricing(Kimi K1.5,2.0,10.0,0.25,长文本 Context Caching),ModelPricing(智谱 GLM-4.5,1.5,6.0,0.5,高端档位),)defmonthly_cost(model:ModelPricing,input_tokens_m:float,output_tokens_m:float,cache_hit_rate:float)-float:按月计算总账单元。cache_hit_inputinput_tokens_m*cache_hit_rate cache_miss_inputinput_tokens_m*(1-cache_hit_rate)input_cost(cache_miss_input*model.input_price_per_mcache_hit_input*model.input_price_per_m*model.cache_discount)output_costoutput_tokens_m*model.output_price_per_mreturninput_costoutput_cost# 场景月 10 亿输入 3 亿输出、缓存命中率 50%forminMODELS_2026Q2:costmonthly_cost(m,1000,300,0.5)print(f{m.name:20s}月账单 ¥{cost:,.0f}({m.notes}))跑出来的结果模型定价均为 2026-Q2 公开数据快照不代表实时刊例价模型月账单元相对 DeepSeek-V3 倍率豆包 1.5-pro¥1,0800.40×DeepSeek-V3¥2,6751.00×智谱 GLM-4.5¥2,9251.09×Kimi K1.5¥4,2501.59×DeepSeek-R1¥5,3502.00×通义 Qwen-Max¥6,6002.47×一个反直觉的观察豆包 1.5-pro 的月账单在这个场景下反而比 DeepSeek-V3 更低——原因是它的输出价格档只有 2 元/M是 V3 的 1/4。这也说明哪家便宜这个问题在 2026 年不再有唯一答案答案取决于你的输入输出比、缓存命中率、以及是否需要推理档位R1 / K1.5 反思型。这也是 chapter-26 配套代码里做敏感性分析的核心用途——把你的真实业务参数代进去才能知道自己该选谁。七、展望 2026H2 / 2027价格锚会不会二次跳水24 个月复盘完最有价值的问题是——下一次跳水会不会来什么时候来短期2026H2不会有大跳水理由是三个头部 3 家DeepSeek / 豆包 / 通义已经在薄利区间进一步降 30% 会集体倒挂能力上没有代差谁先降就等于送市场份额OpenAI 和 Anthropic 已经跟到国产价格的 5-15 倍这个区间再往下压反而让国际厂商跟得更容易。中期2027 全年大概率会有一次结构性跳水原因也是三个推理芯片国产化率2026 年昇腾 910C 寒武纪 590 大规模量产后头部模型厂商的 GPU 成本能再降 30-50%2027 年会把这一块红利释放到 API 价格上长上下文推理架构Mamba / RWKV / MoE 稀疏 attention 的组合让长上下文推理成本从和长度成平方关系变成和长度成线性关系128K 以上的档位会有一次显著降价Agent 场景的规模效应Agent 平台占 API 总消耗量的比例从 2024 年的 10% 提升到 2026 年的 40%、2027 年预计 60%这个使用密度会让厂商愿意针对高频重复调用再切一档专用低价 SKU。长期2028 之后价格战会转移战场——从每千 tokens 单价转到每个 Agent 任务完成的总成本、从API 价格转到包括数据 / 工具 / 编排在内的解决方案价格。这个转移的信号已经在出现——DeepSeek 2026-Q2 悄悄推出 Agent 专用 API 档、豆包在扣子平台上打包定价、通义把百炼平台的智能体编排费单独计价都是这个方向。24 个月复盘的最简洁总结第一次冲击波是降价打口号、第二次冲击波是工程降本、第三次冲击波是重定义全球价格锚下一次跳水的关键词会是重新定义计费单元——从卖 tokens 变成卖任务完成。如果这个判断成立2027 年 API 定价页上会开始出现per-task这一列配合per-1M-tokens并列展示。一个开放问题当每千 tokens 单价这个维度已经被打到接近推理边际成本、当 Agent 平台占据大部分调用量、当推理芯片国产化率翻倍——API 计费单元从tokens迁移到任务会不会成为下一次跳水的形态我倾向的判断是会但时间点会晚于市场预期——大概率是 2027H2 才有第一家头部厂商正式推出per-task计价档。欢迎在评论区聊聊你们的真实观察路径。相关资源模型广场https://activity.ldzktoken.com/activity/index.html小程序点点词元 — 多模型统一调度平台OpenAI 兼容协议Anthropic 兼容协议。GitHub 配套源码https://github.com/fangzehui/llm-tech-articles/tree/main/chapters/chapter-26-china-llm-price-war含本文用到的国产大模型价格战工具集24 个月价格快照数据集 成本敏感性分析器 6 家模型月账单对比脚本 pytest 全绿用例上下文延伸阅读chapter-17-prompt-cachePrompt Caching 成本实测横评与本文第四节KV Cache 优化呼应chapter-11-agent-token-savingAgent Token 降 75% 的 4 条工程路径与本文第五节Agent 平台成本压力呼应chapter-25-mcp-ecosystem-observationMCP 生态 12 个月观察价格战的下一个战场Agent × 工具编排chapter-24-agent-memory-evolutionAgent 长期记忆三代演进长上下文降价对记忆架构的直接影响。本文国产大模型价格战时间线、分玩家复盘、成本敏感性模型、下游净影响分析等内容来源于新华网、新华社经济参考报、每日经济新闻、21 世纪经济报道、新京报贝壳财经、36 氪、腾讯新闻、证券时报、Forbes China、火山引擎/阿里云百炼/百度智能云千帆/腾讯云/DeepSeek/Moonshot 官方公告与定价页、arXiv 论文与 GitHub 仓库截至 2026-07-08大模型 API 定价变化较快具体价格档位与折扣规则请以各家官方定价页实时显示为准。文中月账单对比、敏感性分析、可持续性判定仅基于本文公开场景假设与公式不代表任何厂商的 SLA 承诺或商业推荐具体业务选型请以自家压测与成本结构为准。如发现事实性错误欢迎评论区指正会在附录以 errata 形式同步修订。