数据日期:2026 年 6 月 2 日
计价单位:元(人民币)/ 百万 tokens
汇率:海外模型按 1 USD = 7.20 RMB 换算
图例:✅ 官网直接核实 | 🔢 由官方美元价格换算 | 🆕 近期新发布/降价
| 模型 | 类型 | 输入 ¥/百万 tokens | 输出 ¥/百万 tokens | 缓存命中输入 | 备注 |
|---|---|---|---|---|---|
| DeepSeek V4-Flash | 通用 | 1.00 | 2.00 | 0.02 | ✅ 官方 API 定价页;5月22日永久降价 |
| DeepSeek V4-Pro 🆕 | 旗舰 | 3.00 | 6.00 | 0.025 | ✅ 官方 API 定价页;5月22日永久降价(原 12元/24元) |
| 模型 | 类型 | 输入 ¥/百万 tokens | 输出 ¥/百万 tokens | 缓存命中输入 | 备注 |
|---|---|---|---|---|---|
| GLM-5.1 🆕 | 旗舰 | 6.00 | 24.00 | ≈ 3.42($0.475) | 🔢 多方报道确认;GLM-5 系列 2026 年已多次涨价 |
| GLM-4-Plus / GLM-4.6 | 上代旗舰 | 5.00 | 5.00 | — | 🔢 4月降价 90%(原 50元)后定价 |
| GLM-4-FlashX | 轻量 | 0.10 | 0.10 | — | ✅ 官方定价页(每亿 tokens 10 元) |
| GLM-4-Flash / GLM-Z1-Flash | 永久免费 | 0 | 0 | 0 | ✅ 官方定价页;有并发限制 |
| 模型 | 类型 | 输入 ¥/百万 tokens | 输出 ¥/百万 tokens | 缓存命中输入 | 备注 |
|---|---|---|---|---|---|
| Doubao-Seed-2.0-Pro | 旗舰 | 3.20 | 16.00 | — | ✅ 火山引擎方舟平台官方定价 |
| Doubao-Seed-2.0-Lite | 轻量 | 0.60 | 3.60 | — | ✅ 火山引擎方舟平台官方定价 |
| Doubao-Pro-32k | 通用 | 0.80 | 2.00 | — | ✅ 火山引擎方舟平台官方定价 |
| 模型 | 类型 | 输入 ¥/百万 tokens | 输出 ¥/百万 tokens | 缓存命中输入 | 备注 |
|---|---|---|---|---|---|
| Qwen3-Max | 旗舰 | 2.50 | 10.00 | — | ✅ 阿里云百炼官方定价;32K 上下文以内 |
| Qwen3.5-Plus | 主力 | 0.80 | 4.80 | — | ✅ 阿里云百炼官方定价;128K 上下文以内 |
| Qwen-Turbo | 轻量 | 0.30 | 0.60 | — | ✅ 阿里云百炼官方定价 |
| Qwen-Long | 长文本 | 0.50 | 2.00 | — | ✅ 阿里云百炼官方定价;支持 1M 超长上下文 |
| 模型 | 类型 | 输入 ¥/百万 tokens | 输出 ¥/百万 tokens | 缓存命中输入 | 备注 |
|---|---|---|---|---|---|
| Kimi K2.5 | 主力 | 4.00 | 16.00 | 1.10 | 🔢 官方人民币 API 定价(2.50) |
| Kimi K2.6 🆕 | 旗舰 | ≈ 9.50 | ≈ 25.40 | — | 🔢 基于 K2.5 涨价 58% 估算;2026.4.20 发布 |
| 模型 | 类型 | 输入 ¥/百万 tokens | 输出 ¥/百万 tokens | 缓存命中输入 | 备注 |
|---|---|---|---|---|---|
| MiniMax-M2 🆕 | 旗舰 | 2.10 | 8.40 | 0.21 | ✅ MiniMax 官方博客原文(人民币直接标价,1.20) |
| MiniMax-M2.5 | 新款轻量 | 1.08 | — | — | 🔢 $0.15/M 换算;最新经济型款 |
| 模型 | 类型 | 输入 ¥/百万 tokens | 输出 ¥/百万 tokens | 缓存命中输入 | 备注 |
|---|---|---|---|---|---|
| MiMo-V2.5-Pro 🆕 | 旗舰 | 1.00 | 6.00 | 0.025 | ✅ MiMo 开放平台官方公告;5月27日永久降价(原输入 ≈7元) |
| MiMo-V2.5 🆕 | 基础 | 1.00 | 2.00 | 0.020 | ✅ MiMo 开放平台官方公告;5月27日永久降价 |
| 模型 | 类型 | 输入 ¥/百万 tokens | 输出 ¥/百万 tokens | 缓存命中输入 | 原始美元价 | 备注 |
|---|---|---|---|---|---|---|
| GPT-5.5 | 旗舰 | 36.00 | 216.00 | 3.60 | 30.00 | ✅ openai.com/api/pricing |
| GPT-5.4 | 次旗舰 | 18.00 | 108.00 | 1.80 | 15.00 | ✅ openai.com/api/pricing;2026.3 发布 |
| GPT-5.4 Mini | 中档 | 5.40 | 21.60 | — | 3.00 | 🔢 官方定价换算 |
| GPT-5.4 Nano | 轻量 | 1.44 | 9.00 | — | 1.25 | ✅ openai.com/api/pricing;极低价高吞吐 |
| GPT-4o | 稳定通用 | 18.00 | 72.00 | 1.80 | 10.00 | ✅ openai.com/api/pricing |
| 模型 | 类型 | 输入 ¥/百万 tokens | 输出 ¥/百万 tokens | 缓存写入 | 缓存读取 | 原始美元价 | 备注 |
|---|---|---|---|---|---|---|---|
| Claude Opus 4.8 🆕 | 旗舰 | 36.00 | 180.00 | 45.00 | 3.60 | 25.00 | ✅ claude.com/pricing 官网直取;2026.5.28 发布 |
| Claude Sonnet 4.6 | 主力 | 21.60 | 108.00 | 27.00 | 2.16 | 15.00 | ✅ claude.com/pricing 官网直取 |
| Claude Haiku 4.5 | 轻量 | 7.20 | 36.00 | 9.00 | 0.72 | 5.00 | ✅ claude.com/pricing 官网直取 |
Claude 缓存价格说明(来自官网): 缓存写入(Cache Write)= 输入价 × 1.25;缓存读取(Cache Read)= 输入价 × 0.10 Fast Mode(Opus 4.8)= 标准价 × 2,即 50 输出
| 模型 | 类型 | 输入 ¥/百万 tokens | 输出 ¥/百万 tokens | 缓存命中输入 | 原始美元价 | 备注 |
|---|---|---|---|---|---|---|
| Gemini 3.5 Flash 🆕 | 旗舰 Flash | 10.80 | 64.80 | 1.08 | 9.00 | ✅ Google I/O 2026 发布;2026.5.19 上线 |
| Gemini 3.1 Pro | 旗舰 Pro | 14.40 | 86.40 | 1.44 | 12.00 | ✅ ai.google.dev/pricing;200K 以内;2026.2.19 发布 |
| Gemini 2.5 Pro | 上代 Pro | 9.00 | 72.00 | 0.90 | 10.00 | ✅ ai.google.dev/pricing;200K 以内 |
| Gemini 2.5 Flash | 轻量 | 2.16 | 18.00 | 0.22 | 2.50 | ✅ ai.google.dev/pricing |
| Gemini 2.5 Flash-Lite | 极轻 | 0.72 | 2.88 | 0.07 | 0.40 | ✅ ai.google.dev/pricing;全系最低价 |
| 排名 | 厂商 / 模型 | 输入价 ¥/百万 tokens | 输出价 ¥/百万 tokens |
|---|---|---|---|
| 🥇 1 | DeepSeek V4-Pro(缓存命中) | 0.025 | 6.00 |
| 🥇 2 | MiMo-V2.5-Pro(缓存命中) | 0.025 | 6.00 |
| 3 | DeepSeek V4-Flash | 1.00 | 2.00 |
| 4 | MiMo-V2.5-Pro | 1.00 | 6.00 |
| 5 | MiniMax-M2 | 2.10 | 8.40 |
| 6 | Qwen3-Max | 2.50 | 10.00 |
| 7 | Doubao-Seed-2.0-Pro | 3.20 | 16.00 |
| 8 | GLM-4-Plus / GLM-4.6 | 5.00 | 5.00 |
| 9 | GLM-5.1 | 6.00 | 24.00 |
| 10 | Gemini 3.5 Flash | 10.80 | 64.80 |
| 11 | Gemini 3.1 Pro | 14.40 | 86.40 |
| 12 | Claude Sonnet 4.6 | 21.60 | 108.00 |
| 13 | GPT-5.5 | 36.00 | 216.00 |
| 14 | Claude Opus 4.8 | 36.00 | 180.00 |
💡 结论:国内旗舰模型(DeepSeek V4-Pro、MiMo-V2.5-Pro)的缓存命中价格仅为 Claude Opus 4.8 的 1/1440,即便是标准输入价格也相差约 36 倍。
claude.com/pricing 官网直取)、OpenAI(openai.com/api/pricing)、Google(ai.google.dev/pricing)均直接核实;国内厂商部分来自官方定价公告及多方报道交叉确认。