TOC

我的 Token 消耗情况

我用的是 Cursor 做开发,根据 Cursor 后台统计,一个月消耗 Token 大约 6 亿 Token。
需要购买 Pro+ 套餐才能满足要求,一个月 48 美金(年付),折合人民币大约 336 元。

听说龙虾的创始人每月消耗 6000 多亿 Token,是我的 1000 倍,确实有点吓人。
哪怕采购量大可以打一折,也得 3 万多元人民币。
PS:他是 OpenAI 员工,可以无限量调用自家模型,不用花钱。


听同事讲,公司提供的 Codex 200 刀的套餐,所有研发共用,每月基本上足够。
Codex 200 刀的这个套餐可以这么划算么?我查了 Codex 订阅和相关信息,看起来也不至于这么划算啊。
不知道实际上同事们的使用程度到底如何。


基础认知:

  1. Cusor Tab(代码自动补全)通常不消耗额度,AI 对话/生成能力才会消耗额度
  2. 模型价格 × 输入上下文长度 × 输出长度 × 调用次数
    其中:输入上下文通常是最容易失控的部分,一定需要控制好。
  3. 控制上下文范围,比控制模型选择更重要

草拟了一个控制 Token 消耗的方法:

  1. 默认使用 Auto 模型,让 Cursor 根据任务自动选择成本和效果更加平衡的模型。
  2. 任务拆解后再交给 AI,不要直接把复杂目标交给 AI,确保问题规模小,描述准确。
    让 AI 解决明确的小问题,而不是让 AI 自己探索整个系统。
    扫描大量代码 + 生成超长上下文 + 多轮修改 = 快速消耗 Token
    我的套餐更适合日常开发修改,不适合让 Agent 长时间承担「全仓库理解 + 多轮推理 + 大范围修改」这类高消耗任务。
    所以少说:解决 xx 问题、重构 xx 方案。
  3. 精准控制上下文范围,尽可能精准指定代码范围,只把相关代码加入模型上下文。
    不仅上下文更小,修改也会更准确一些。
  4. 新任务就开启新对话(New Agent),避免长期复用同一个对话。
    长期积累会导致上下文膨胀。
    保持每个 Agent 任务边界清晰。
  5. 定期查看 Dashboard 监控模型使用量和 On-Demand 消耗。
如果你有魔法,你可以看到一个评论框~