模型与渠道选择
模型一览
中转端当前可用的 6 个 Claude 模型:
| 模型 ID | 显示名 | 类型 | 上下文 | 输出 | 推理 |
|---|---|---|---|---|---|
claude-opus-4-7 | Opus 4.7(最新) | 最强 | 200K | 32K | ⚡⚡⚡⚡⚡ |
claude-opus-4-6 | Opus 4.6 | 上一代 | 200K | 32K | ⚡⚡⚡⚡⚡ |
claude-opus-4-5-20251101 | Opus 4.5(11/01 快照) | 历史版本 | 200K | 32K | ⚡⚡⚡⚡⚡ |
claude-sonnet-4-6 | Sonnet 4.6(推荐默认) | 平衡 | 200K | 64K | ⚡⚡⚡⚡ |
claude-sonnet-4-5-20250929 | Sonnet 4.5(09/29 快照) | 历史版本 | 200K | 64K | ⚡⚡⚡⚡ |
claude-haiku-4-5-20251001 | Haiku 4.5(10/01 快照) | 轻量 | 200K | 16K | ⚡⚡⚡ |
claude-opus-4-5-20251101)是 快照版本,行为永久锁定,不会因 Anthropic 后续小更新而变化。生产环境推荐用快照 ID 以保证可复现性。怎么选
默认选 Sonnet 4.6
日常 80% 任务都该用它。速度快、效果好、性价比最高
难题升 Opus 4.7
架构设计、复杂调试、跨模块重构等硬问题,等久点值得
高频任务用 Haiku
Tab 补全、commit message、单文件摘要,速度优先
生产环境锁版本
CI / 线上接入用带日期的快照版本(如 claude-sonnet-4-5-20250929)保证可复现
别名 vs 快照版本
| ID 形式 | 例子 | 行为 | 适合 |
|---|---|---|---|
| 不带日期 | claude-opus-4-7 / claude-sonnet-4-6 | 指向该大版本的最新点 | 日常开发,自动跟进 |
| 带日期快照 | claude-opus-4-5-20251101 | 锁死那天的行为 | 生产、CI、对照实验 |
claude-haiku-4-5-20251001,没有不带日期的别名。在配置文件里要用完整 ID。推理模式(thinking)
Claude 4 系列支持「思考」(extended thinking)模式,类似 OpenAI 的 reasoning_effort:
client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
thinking={
"type": "enabled",
"budget_tokens": 8000 # 思考的 Token 预算
},
messages=[...]
)
Claude Code CLI 默认开启 thinking,无需手动配。
推荐 budget
| 任务类型 | budget_tokens |
|---|---|
| 简单代码生成 | 1024 |
| 一般编码 | 4096(默认) |
| 复杂逻辑 / 架构 | 8000 ~ 16000 |
| 难题、跨模块 | 16000+ |
Prompt Caching(强烈推荐)
Anthropic 原生支持 prompt caching,命中缓存按 10% 价格计费,命中率高的话能省 80% 以上成本。
何时缓存
- 长 system prompt(重复使用)
- 大段固定 context(文档、代码库片段)
- 工具定义(function schema)
用法
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
system=[
{
"type": "text",
"text": "<你的长 system prompt>",
"cache_control": {"type": "ephemeral"} # 标记缓存
}
],
messages=[...]
)
缓存 TTL
- 5 分钟(默认):免费缓存写入
- 1 小时(
"type": "ephemeral", "ttl": "1h"):写入费 1.25x,命中价 10%
Claude Code CLI 自动缓存
CLI 默认对 system prompt 和 CLAUDE.md 自动启用 prompt caching,无需手动配。
模型切换
CLI
# 临时
claude --model claude-opus-4-7 "..."
# 默认
export ANTHROPIC_MODEL="claude-opus-4-7"
claude
# 进入会话后切
claude
> /model claude-haiku-4-5-20251001
VSCode 插件
VSCode 命令面板 → 搜 Claude: Select Model。
Cursor
Composer 顶部模型选择器直接切。
Claude Desktop App
底部输入框右下角模型选择器下拉切换,详见 Claude App 桌面端。
渠道选择
如果控制台提供「节点选择」或「渠道切换」功能,可按需手动锁定(具体可选项以控制台为准)。一般情况保持默认即可。
计费规则
定价的基本结构:
| 维度 | 大致关系 |
|---|---|
| 三档模型 | Opus > Sonnet > Haiku(Anthropic 官方比例,差距悬殊) |
| 输入 vs 输出 | 输出单价通常高于输入数倍 |
| 同档模型 | 不同小版本(4.7 / 4.6 / 4.5 快照)价格基本一致 |
| Prompt Caching 命中 | 远低于原价(Anthropic 官方折扣) |
| Prompt Caching 写入(5 min TTL) | 与原价相同(免费缓存) |
| Prompt Caching 写入(1 hour TTL) | 略高于原价 |
省钱建议:
- 日常用 Sonnet 4.6,难题才切 Opus —— 单价差距很大
- 长 system prompt 开 prompt caching(缓存命中价格优势极大)
- Tab 补全、commit msg 等高频任务用 Haiku 4.5
- 给 Key 设「日用量上限」做兜底,防止脚本失控烧钱
模型推荐组合
性价比优先
Sonnet 4.6 默认 + Haiku 4.5 补全 + Opus 仅难题
效果优先
Opus 4.7 默认 + Sonnet 4.6 补全 + thinking budget 8K+
速度优先
Haiku 4.5 全部用(牺牲一点效果换最快响应)
生产稳定
锁日期快照(sonnet-4-5-20250929 / opus-4-5-20251101)+ prompt caching
