Claude Code 省钱指南

核心原则

核心思路

独立任务开新终端,频繁压缩保持精简,选对模型省大钱。

Token 消耗的最大来源是对话历史的累积——每次你发消息,Claude 都会重新读取整个上下文。所以核心策略就是:保持上下文尽可能小

会话管理(最重要)

独立任务 → 新开终端

这是最有效的省 token 手段。每个新终端 = 全新上下文,只加载系统提示 + CLAUDE.md。

场景做法
修完 bug,要写新功能新开终端
前端任务完成,转后端新开终端
调研结束,开始实现新开终端
同一功能的迭代修改继续当前终端

工作流示例:

bash
终端1: 修复登录 bug        → 完成后关闭
终端2: 写新的 API 接口      → 完成后关闭
终端3: 重构数据库查询       → 完成后关闭

会话命名与恢复

bash
/rename auth-fix          # 给当前会话命名
# ... 完成工作 ...
/clear                    # 清空上下文

# 之后如果需要回顾:
/resume auth-fix          # 恢复之前的会话

上下文压缩

/compact 命令

bash
/compact                                      # 压缩对话历史
/compact 只保留代码修改和 API 相关的内容         # 带指令的压缩
  • 可以将对话大幅压缩
  • 在上下文达到 ~60% 时主动压缩,不要等到 80% 自动压缩
  • 每 30–45 分钟高强度工作后执行一次

/clear 命令

bash
/clear    # 完全清空对话历史
  • /compact 更彻底,上下文直接归零
  • 适合切换到完全不相关的任务时使用

何时用 /compact vs /clear

场景/compact/clear
还在同一任务,但上下文太长
切换到完全不相关的任务
探索性对话结束,要开始实现
需要保留之前的决策方向

查看上下文消耗

bash
/context    # 查看 token 消耗明细(系统提示、工具、记忆、对话历史等)

模型选择策略

不同任务用不同模型,性价比差异巨大

模型适用场景成本
Sonnet 4.6日常编码、大多数任务(推荐默认)
Opus 4.6复杂架构设计、深度 debug、多文件重构
Haiku 4.5简单问答、格式化、常规转换

切换模型:

bash
/model

推荐策略:

  1. 默认用 Sonnet(质量接近 Opus,成本更低)
  2. 遇到复杂问题临时切 Opus
  3. 简单重复任务用 Haiku

写好 Prompt(减少来回)

具体、精确的指令

bash
# ❌ 模糊(Claude 需要大量探索,消耗 token)
修复认证中间件

# ✅ 精确(Claude 直奔目标)
在 src/auth/middleware.py 的 validate_token 函数中,
添加 token 过期时间检查:比较 exp 字段和当前时间戳,
过期返回 401

一次性给全信息

bash
# ❌ 分多轮给信息(3 轮对话 = 3 倍上下文消耗)
用户: 改一下登录 → Claude: 改什么? → 用户: 加验证码 → ...

# ✅ 一次说清(1 轮搞定)
在登录页面添加图片验证码,使用 captcha 库生成,
验证失败显示"验证码错误",有效期 5 分钟

限制输出范围

bash
只修改这个函数,不要动其他代码
只给代码,不需要解释
回答控制在 200 字以内
最多生成 3 个测试用例

Plan 模式(避免返工)

先规划再实现,避免实现错了重来(白白烧 token):

bash
# 第 1 轮:先让 Claude 出方案
请先列出实现方案:要改哪些文件、怎么改、可能的问题。不要写代码。

# 审核方案后,第 2 轮:确认实现
方案可以,开始实现。

进阶策略:用 Opus 规划,用 Sonnet 实现

bash
/model opus
# 讨论方案
/model sonnet
# 按方案实现

精简 CLAUDE.md

CLAUDE.md 的每个 token 在每次会话启动时都会被加载,所以要保持精简:

markdown
# ✅ 好的 CLAUDE.md(500-1000 token)
- 关键约束和规则
- 项目特殊约定
- 指向详细文档的路径

# ❌ 差的 CLAUDE.md(5000+ token)
- 整个项目历史
- 大段代码示例
- 重复文档中已有的信息

原则:

  • 只放 Claude 通过读代码无法发现的信息
  • 用路径引用代替内容复制
  • 定期清理过时内容

其他实用技巧

监控消耗:

bash
/context       # token 消耗明细
/cost          # 累计 API 使用量

速查表

操作命令效果
查看 token 明细/context诊断
压缩对话/compact节约消耗
清空上下文/clear节约消耗
切模型/model节约消耗
查看费用/cost监控
命名会话/rename xxx方便查找
恢复会话/resume xxx回顾历史

一句话总结

每个独立任务开新终端 → 60% 时主动 /compact → 默认用 Sonnet → 写精确 prompt → 先规划再实现。

做到这几点,token 消耗能显著降低。