Claude Code 省钱指南
核心原则
核心思路
独立任务开新终端,频繁压缩保持精简,选对模型省大钱。
Token 消耗的最大来源是对话历史的累积——每次你发消息,Claude 都会重新读取整个上下文。所以核心策略就是:保持上下文尽可能小。
会话管理(最重要)
独立任务 → 新开终端
这是最有效的省 token 手段。每个新终端 = 全新上下文,只加载系统提示 + CLAUDE.md。
| 场景 | 做法 |
|---|---|
| 修完 bug,要写新功能 | 新开终端 |
| 前端任务完成,转后端 | 新开终端 |
| 调研结束,开始实现 | 新开终端 |
| 同一功能的迭代修改 | 继续当前终端 |
工作流示例:
bash
终端1: 修复登录 bug → 完成后关闭
终端2: 写新的 API 接口 → 完成后关闭
终端3: 重构数据库查询 → 完成后关闭
会话命名与恢复
bash
/rename auth-fix # 给当前会话命名
# ... 完成工作 ...
/clear # 清空上下文
# 之后如果需要回顾:
/resume auth-fix # 恢复之前的会话
上下文压缩
/compact 命令
bash
/compact # 压缩对话历史
/compact 只保留代码修改和 API 相关的内容 # 带指令的压缩
- 可以将对话大幅压缩
- 在上下文达到 ~60% 时主动压缩,不要等到 80% 自动压缩
- 每 30–45 分钟高强度工作后执行一次
/clear 命令
bash
/clear # 完全清空对话历史
- 比
/compact更彻底,上下文直接归零 - 适合切换到完全不相关的任务时使用
何时用 /compact vs /clear
| 场景 | 用 /compact | 用 /clear |
|---|---|---|
| 还在同一任务,但上下文太长 | ✅ | |
| 切换到完全不相关的任务 | ✅ | |
| 探索性对话结束,要开始实现 | ✅ | |
| 需要保留之前的决策方向 | ✅ |
查看上下文消耗
bash
/context # 查看 token 消耗明细(系统提示、工具、记忆、对话历史等)
模型选择策略
不同任务用不同模型,性价比差异巨大:
| 模型 | 适用场景 | 成本 |
|---|---|---|
| Sonnet 4.6 | 日常编码、大多数任务(推荐默认) | 中 |
| Opus 4.6 | 复杂架构设计、深度 debug、多文件重构 | 高 |
| Haiku 4.5 | 简单问答、格式化、常规转换 | 低 |
切换模型:
bash
/model
推荐策略:
- 默认用 Sonnet(质量接近 Opus,成本更低)
- 遇到复杂问题临时切 Opus
- 简单重复任务用 Haiku
写好 Prompt(减少来回)
具体、精确的指令
bash
# ❌ 模糊(Claude 需要大量探索,消耗 token)
修复认证中间件
# ✅ 精确(Claude 直奔目标)
在 src/auth/middleware.py 的 validate_token 函数中,
添加 token 过期时间检查:比较 exp 字段和当前时间戳,
过期返回 401
一次性给全信息
bash
# ❌ 分多轮给信息(3 轮对话 = 3 倍上下文消耗)
用户: 改一下登录 → Claude: 改什么? → 用户: 加验证码 → ...
# ✅ 一次说清(1 轮搞定)
在登录页面添加图片验证码,使用 captcha 库生成,
验证失败显示"验证码错误",有效期 5 分钟
限制输出范围
bash
只修改这个函数,不要动其他代码
只给代码,不需要解释
回答控制在 200 字以内
最多生成 3 个测试用例
Plan 模式(避免返工)
先规划再实现,避免实现错了重来(白白烧 token):
bash
# 第 1 轮:先让 Claude 出方案
请先列出实现方案:要改哪些文件、怎么改、可能的问题。不要写代码。
# 审核方案后,第 2 轮:确认实现
方案可以,开始实现。
进阶策略:用 Opus 规划,用 Sonnet 实现
bash
/model opus
# 讨论方案
/model sonnet
# 按方案实现
精简 CLAUDE.md
CLAUDE.md 的每个 token 在每次会话启动时都会被加载,所以要保持精简:
markdown
# ✅ 好的 CLAUDE.md(500-1000 token)
- 关键约束和规则
- 项目特殊约定
- 指向详细文档的路径
# ❌ 差的 CLAUDE.md(5000+ token)
- 整个项目历史
- 大段代码示例
- 重复文档中已有的信息
原则:
- 只放 Claude 通过读代码无法发现的信息
- 用路径引用代替内容复制
- 定期清理过时内容
其他实用技巧
监控消耗:
bash
/context # token 消耗明细
/cost # 累计 API 使用量
速查表
| 操作 | 命令 | 效果 |
|---|---|---|
| 查看 token 明细 | /context | 诊断 |
| 压缩对话 | /compact | 节约消耗 |
| 清空上下文 | /clear | 节约消耗 |
| 切模型 | /model | 节约消耗 |
| 查看费用 | /cost | 监控 |
| 命名会话 | /rename xxx | 方便查找 |
| 恢复会话 | /resume xxx | 回顾历史 |
一句话总结
每个独立任务开新终端 → 60% 时主动 /compact → 默认用 Sonnet → 写精确 prompt → 先规划再实现。
做到这几点,token 消耗能显著降低。