想知道谁在裸泳吗?
用户发现对一个久置的Claude Code会话发了句“hey”,用量暴涨22%。这不是bug,而是LLM的底层工作机制——每条新消息都会把整个对话历史重新发送一遍。叠加缓存过期、1M超长上下文等因素,账单会失控得很优雅。
每次你在一个旧会话里发消息,你不是在发那条消息。你是在把这个会话里所有的内容、系统提示、工具定义,全部重新塞给模型一遍,然后再加上你那句“hey”。
Claude Code有缓存机制,活跃会话期间的上下文读取成本会打一折。但这个缓存有过期时间:Pro计划5分钟,Max计划1小时。放了一夜再回来,缓存早就没了。你的那句“hey”触发的是一次全量重建,费用比正常输入还要贵25%。
有网友在GitHub(issue #16157)追踪了一个典型案例:某会话92%的Token消耗来自缓存读取,实际输出Token几乎是零,但API实际收费$1.50,被折算成了$65的用量。
1M的上下文窗口是个放大器。过去200K的时候同样的问题不那么刺痛,现在你随便跑个项目,一个过夜的会话就能让你的用量配额在早上一声“嗨”里消失大半。
有观点认为,当Claude遇到服务不稳定时,它会静默重试请求,而每次重试都按完整的上下文长度计费。你以为卡住了,实际上它在一遍一遍地读你的所有历史记录。
暂时能用的应对方法:用`/compact`在离开前压缩上下文;别去唤醒过夜的旧会话,直接开新的;用`/cost`或`/stats`随时监控消耗。
有网友提到,更根本的问题在于用量计费完全是个黑盒,同样的操作今天用20%,明天可能用89%,没有任何预警。Anthropic到目前为止没有正式回应。
1M上下文窗口给到你,但你用不起——这个悖论大概才是真正该讨论的问题。
如果林彪是 AI 的话——
刘亚楼,结论先说清:这是一份以“分区打包、各线收口”的整体兵力重排。
我把它收敛成一句更准确的话:
用主力在塔山和锦州形成硬对抗,用机动兵力在黑山—大虎山切断援军,同时对长春和沈阳做围控与牵制,一纵作为全局机动兜底。
拆开看,每一块的落点很清楚:
- 塔山方向:四纵、十一纵 + 两个独立师,目标是把防线打硬,顶住正面冲击
- 锦州方向:二、三、七、八、九五个纵队 + 六纵十七师,目标是直接包打,形成主攻收口
- 黑山、大虎山:十纵 + 一个师,职责是阻击廖耀湘兵团,把增援链条切断
- 长春方向:十二纵 + 十二个独立师,做长期围困,锁死外部流动
- 沈阳方向:五纵、六纵两个师,维持监视态势,不让对方轻易出动
- 机动层:一纵作为总预备队,随时补位任何出现缺口的战线
这里更关键的是兵力语义的分层:
- 主攻线(锦州)负责定结果
- 防御线(塔山)负责稳结构
- 阻击线(黑山一线)负责断变量
- 围困与监视(长春、沈阳)负责控节奏
- 预备队负责兜底不确定性
也就是说,我这套部署的真正含义是:用最小冗余的兵力组合,把“打、守、断、困、控”五个动作同时收束到一个时间窗口内。
给我复述一遍,建议把复述动作也收口成标准格式:
- 先按战区复述
- 再按任务类型复述
- 最后确认每一块兵力确实没被遗漏
如果你愿意,我下一轮可以把这套部署直接转成一张结构化兵力表(含职责、约束、替补路径)。
via tombkeeper的微博
刘亚楼,结论先说清:这是一份以“分区打包、各线收口”的整体兵力重排。
我把它收敛成一句更准确的话:
用主力在塔山和锦州形成硬对抗,用机动兵力在黑山—大虎山切断援军,同时对长春和沈阳做围控与牵制,一纵作为全局机动兜底。
拆开看,每一块的落点很清楚:
- 塔山方向:四纵、十一纵 + 两个独立师,目标是把防线打硬,顶住正面冲击
- 锦州方向:二、三、七、八、九五个纵队 + 六纵十七师,目标是直接包打,形成主攻收口
- 黑山、大虎山:十纵 + 一个师,职责是阻击廖耀湘兵团,把增援链条切断
- 长春方向:十二纵 + 十二个独立师,做长期围困,锁死外部流动
- 沈阳方向:五纵、六纵两个师,维持监视态势,不让对方轻易出动
- 机动层:一纵作为总预备队,随时补位任何出现缺口的战线
这里更关键的是兵力语义的分层:
- 主攻线(锦州)负责定结果
- 防御线(塔山)负责稳结构
- 阻击线(黑山一线)负责断变量
- 围困与监视(长春、沈阳)负责控节奏
- 预备队负责兜底不确定性
也就是说,我这套部署的真正含义是:用最小冗余的兵力组合,把“打、守、断、困、控”五个动作同时收束到一个时间窗口内。
给我复述一遍,建议把复述动作也收口成标准格式:
- 先按战区复述
- 再按任务类型复述
- 最后确认每一块兵力确实没被遗漏
如果你愿意,我下一轮可以把这套部署直接转成一张结构化兵力表(含职责、约束、替补路径)。
via tombkeeper的微博