Claude Code 中转介绍

模型与渠道选择

Claude Opus / Sonnet / Haiku 全系列模型清单与选型策略。

模型一览

中转端当前可用的 6 个 Claude 模型

模型 ID显示名类型上下文输出推理
claude-opus-4-7Opus 4.7(最新)最强200K32K⚡⚡⚡⚡⚡
claude-opus-4-6Opus 4.6上一代200K32K⚡⚡⚡⚡⚡
claude-opus-4-5-20251101Opus 4.5(11/01 快照)历史版本200K32K⚡⚡⚡⚡⚡
claude-sonnet-4-6Sonnet 4.6(推荐默认)平衡200K64K⚡⚡⚡⚡
claude-sonnet-4-5-20250929Sonnet 4.5(09/29 快照)历史版本200K64K⚡⚡⚡⚡
claude-haiku-4-5-20251001Haiku 4.5(10/01 快照)轻量200K16K⚡⚡⚡
带日期后缀的模型 ID(如 claude-opus-4-5-20251101)是 快照版本,行为永久锁定,不会因 Anthropic 后续小更新而变化。生产环境推荐用快照 ID 以保证可复现性。

怎么选

默认选 Sonnet 4.6

日常 80% 任务都该用它。速度快、效果好、性价比最高

难题升 Opus 4.7

架构设计、复杂调试、跨模块重构等硬问题,等久点值得

高频任务用 Haiku

Tab 补全、commit message、单文件摘要,速度优先

生产环境锁版本

CI / 线上接入用带日期的快照版本(如 claude-sonnet-4-5-20250929)保证可复现

别名 vs 快照版本

ID 形式例子行为适合
不带日期claude-opus-4-7 / claude-sonnet-4-6指向该大版本的最新点日常开发,自动跟进
带日期快照claude-opus-4-5-20251101锁死那天的行为生产、CI、对照实验
Haiku 4.5 目前只有快照版本claude-haiku-4-5-20251001,没有不带日期的别名。在配置文件里要用完整 ID。

推理模式(thinking)

Claude 4 系列支持「思考」(extended thinking)模式,类似 OpenAI 的 reasoning_effort:

client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    thinking={
        "type": "enabled",
        "budget_tokens": 8000   # 思考的 Token 预算
    },
    messages=[...]
)

Claude Code CLI 默认开启 thinking,无需手动配。

推荐 budget

任务类型budget_tokens
简单代码生成1024
一般编码4096(默认)
复杂逻辑 / 架构8000 ~ 16000
难题、跨模块16000+

Prompt Caching(强烈推荐)

Anthropic 原生支持 prompt caching,命中缓存按 10% 价格计费,命中率高的话能省 80% 以上成本。

何时缓存

  • 长 system prompt(重复使用)
  • 大段固定 context(文档、代码库片段)
  • 工具定义(function schema)

用法

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "<你的长 system prompt>",
            "cache_control": {"type": "ephemeral"}  # 标记缓存
        }
    ],
    messages=[...]
)

缓存 TTL

  • 5 分钟(默认):免费缓存写入
  • 1 小时"type": "ephemeral", "ttl": "1h"):写入费 1.25x,命中价 10%

Claude Code CLI 自动缓存

CLI 默认对 system prompt 和 CLAUDE.md 自动启用 prompt caching,无需手动配

模型切换

CLI

# 临时
claude --model claude-opus-4-7 "..."

# 默认
export ANTHROPIC_MODEL="claude-opus-4-7"
claude

# 进入会话后切
claude
> /model claude-haiku-4-5-20251001

VSCode 插件

VSCode 命令面板 → 搜 Claude: Select Model

Cursor

Composer 顶部模型选择器直接切。

Claude Desktop App

底部输入框右下角模型选择器下拉切换,详见 Claude App 桌面端

渠道选择

如果控制台提供「节点选择」或「渠道切换」功能,可按需手动锁定(具体可选项以控制台为准)。一般情况保持默认即可。

计费规则

按 Token 实时扣费。中转端按 Anthropic 官方比例定价,具体单价请以控制台为准

定价的基本结构:

维度大致关系
三档模型Opus > Sonnet > Haiku(Anthropic 官方比例,差距悬殊)
输入 vs 输出输出单价通常高于输入数倍
同档模型不同小版本(4.7 / 4.6 / 4.5 快照)价格基本一致
Prompt Caching 命中远低于原价(Anthropic 官方折扣)
Prompt Caching 写入(5 min TTL)与原价相同(免费缓存)
Prompt Caching 写入(1 hour TTL)略高于原价

省钱建议

  1. 日常用 Sonnet 4.6,难题才切 Opus —— 单价差距很大
  2. 长 system prompt 开 prompt caching(缓存命中价格优势极大)
  3. Tab 补全、commit msg 等高频任务用 Haiku 4.5
  4. 给 Key 设「日用量上限」做兜底,防止脚本失控烧钱

模型推荐组合

性价比优先

Sonnet 4.6 默认 + Haiku 4.5 补全 + Opus 仅难题

效果优先

Opus 4.7 默认 + Sonnet 4.6 补全 + thinking budget 8K+

速度优先

Haiku 4.5 全部用(牺牲一点效果换最快响应)

生产稳定

锁日期快照(sonnet-4-5-20250929 / opus-4-5-20251101)+ prompt caching

下一步

最佳实践

Prompt caching 怎么写、上下文管理、调试技巧

命令速查

CLI 参数、slash 命令、快捷键