模型定价
了解 Verdent 积分与服务商 token 定价的关系,以及如何查看当前模型费率
本页内容同时适用于 Verdent Desktop 和 Verdent for VS Code。
概述
Verdent 集成了全球顶尖 AI 实验室的前沿大语言模型,包括 Anthropic(Claude)、OpenAI(GPT)、Google(Gemini)、Moonshot(Kimi)、智谱 AI(GLM)和 MiniMax。为帮助用户了解每次 AI 交互背后的成本,本文完整披露了所有可用模型的服务商定价。
所有价格均为各模型服务商的官方公开价格,以美元($)计,单位为每百万 token(1M tokens)。
核心概念
Token
Token 是大语言模型处理文本的基本单位。1 个 token 约等于 4 个英文字符或 1-2 个中文字符。模型定价基于消耗的输入和输出 token 数量,分别计费。
计费模式
Verdent 上的所有模型目前均采用按 token 计费模式,即根据每次交互实际消耗的输入和输出 token 数量收费。
价格组成
每个模型的定价包含以下维度:
- 输入价格: 发送给模型的提示词(用户消息和上下文)的每 token 费用。
- 输出价格: 模型生成回复的每 token 费用,通常高于输入价格。
- 缓存写入价格: 部分模型支持提示词缓存。首次创建缓存条目时的每 token 费用。
- 缓存读取价格: 命中已有缓存条目时的每 token 费用,通常远低于标准输入价格,可有效降低重复上下文的成本。
模型定价详情
以下为 Verdent 当前所有可用模型的服务商价格,按服务商分组列出。所有价格单位为美元/1M tokens。
Anthropic(Claude 系列)
| 模型 | 输入($/1M) | 输出($/1M) | 缓存写入($/1M) | 缓存读取($/1M) |
|---|---|---|---|---|
| Claude Opus 4.7 | $5.00 | $25.00 | $6.25 | $0.50 |
| Claude Opus 4.6 | $5.00 | $25.00 | $6.25 | $0.50 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | $3.75 | $0.30 |
| Claude Haiku 4.5 | $1.00 | $5.00 | $1.25 | $0.10 |
Claude Opus 4.7(claude-opus-4-7) Verdent 上最新的 Opus 模型,专为最苛刻的推理、架构设计和深度分析任务而设计,服务商定价结构与 Opus 4.6 相同。
Claude Opus 4.6(claude-opus-4-6) 旗舰级 Opus 模型,适用于复杂代码架构、深度分析及高难度问题求解任务。
Claude Sonnet 4.6(claude-sonnet-4-6) 性能均衡、定价具有竞争力的模型,推荐用于日常开发工作。
Claude Haiku 4.5(claude-haiku-4-5@20251001) 快速轻量模型,响应速度最快。适合简单对话、快速查询和低延迟场景。
OpenAI(GPT 系列)
| 模型 | 输入($/1M) | 输出($/1M) | 缓存写入($/1M) | 缓存读取($/1M) |
|---|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | 免费 | $0.50 |
| GPT-5.4 | $2.50 | $15.00 | 免费 | $0.25 |
| GPT-5.3 Codex | $1.75 | $14.00 | 免费 | $0.17 |
GPT-5.5(gpt-5.5) Verdent 上最新的 GPT 模型,适用于前沿推理、代码生成和多步骤分析任务。
GPT-5.4(gpt-5.4) 旗舰 GPT 模型,具备强大的推理能力和代码生成质量。
GPT-5.3 Codex(gpt-5.3-codex) 面向编程任务优化的代码专用模型,适合大规模代码生成和重构。
Google(Gemini 系列)
| 模型 | 输入($/1M) | 输出($/1M) | 缓存写入($/1M) | 缓存读取($/1M) |
|---|---|---|---|---|
| Gemini 3.1 Pro | $2.00 | $12.00 | - | $0.20 |
| Gemini 3 Flash | $0.50 | $3.00 | - | $0.050 |
Gemini 3.1 Pro(gemini-3.1-pro-preview) 专业级模型,推理能力强,适用于复杂分析和深度思考任务。
Gemini 3 Flash(gemini-3-flash-preview) 超快速模型,成本效益出色,适合高吞吐量批量处理场景。
Moonshot(Kimi 系列)
| 模型 | 输入($/1M) | 输出($/1M) | 缓存写入($/1M) | 缓存读取($/1M) |
|---|---|---|---|---|
| Kimi K2.6 | $0.95 | $4.00 | - | $0.16 |
| Kimi K2.5 | $0.60 | $3.00 | - | $0.10 |
Kimi K2.6(kimi-k2.6) Verdent 上最新的 Kimi 模型,推理能力和双语编程表现均优于上一代 K2.5。
Kimi K2.5(kimi-k2.5) 高效的 Kimi 模型,具备强大的双语能力,日常开发任务定价具有竞争力。
智谱 AI(GLM 系列)
| 模型 | 输入($/1M) | 输出($/1M) | 缓存写入($/1M) | 缓存读取($/1M) |
|---|---|---|---|---|
| GLM-5.1 | $1.40 | $4.40 | - | $0.26 |
GLM-5.1(glm-5.1) Verdent 上最新的 GLM 模型,通用推理能力升级,中文表现出色。
MiniMax
| 模型 | 输入($/1M) | 输出($/1M) | 缓存写入($/1M) | 缓存读取($/1M) |
|---|---|---|---|---|
| MiniMax M2.7 | $0.30 | $1.20 | $0.38 | $0.060 |
| MiniMax M2.5 | $0.30 | $1.20 | $0.38 | $0.030 |
MiniMax M2.7(MiniMax-M2.7) 最新版本,综合性能全面提升,定价依然极具竞争力。
MiniMax M2.5(MiniMax-M2.5) 高性价比模型,适合对成本敏感的高吞吐量处理场景。
定价总览
下表汇总了所有模型的核心定价,按输出价格从高到低排序,便于对比:
| 模型 | 服务商 | 输入($/1M) | 输出($/1M) | 缓存写入($/1M) | 缓存读取($/1M) |
|---|---|---|---|---|---|
| GPT-5.5 | OpenAI | $5.00 | $30.00 | - | $0.50 |
| Opus 4.7 | Anthropic | $5.00 | $25.00 | $6.25 | $0.50 |
| Opus 4.6 | Anthropic | $5.00 | $25.00 | $6.25 | $0.50 |
| GPT-5.4 | OpenAI | $2.50 | $15.00 | - | $0.25 |
| Sonnet 4.6 | Anthropic | $3.00 | $15.00 | $3.75 | $0.30 |
| GPT-5.3-Codex | OpenAI | $1.75 | $14.00 | - | $0.17 |
| Gemini 3.1 Pro | $2.00 | $12.00 | - | $0.20 | |
| Haiku 4.5 | Anthropic | $1.00 | $5.00 | $1.25 | $0.10 |
| GLM-5.1 | 智谱 AI | $1.40 | $4.40 | - | $0.26 |
| Kimi K2.6 | Moonshot | $0.95 | $4.00 | - | $0.16 |
| Gemini 3 Flash | $0.50 | $3.00 | - | $0.050 | |
| Kimi K2.5 | Moonshot | $0.60 | $3.00 | - | $0.10 |
| MiniMax M2.5 | MiniMax | $0.30 | $1.20 | $0.38 | $0.030 |
| MiniMax M2.7 | MiniMax | $0.30 | $1.20 | $0.38 | $0.060 |