Claude Code の枠を使い切らないための実運用メモ ─ 毎日使って覚えたトークン節約術

Claude Code を毎日使っていると、必ず「枠」にぶつかる。

2026年のいまの仕組みはざっくり二段構えだ。

5時間のローリング枠 ─ 直近5時間でどれだけ使ったか。5月6日にこの枠が倍に広がった
週次の上限 ─ 1週間でどれだけ動かせるか

やっかいなのは、この枠が Claude Code 単体ではなく、Claude.ai のチャットや Cowork と共有されていること。コードで使い込むとチャット側の残量も削れる。逆もそうだ。

つまり「同じ作業をいかに少ないトークンで終わらせるか」が、そのまま使える時間に直結する。ここでは、自分が毎日使う中で効いた節約術をまとめておく。難しい話はしない。設定と習慣の話だ。

前提：トークンは「文脈に積もる」ほど高くつく

節約術の前に、一個だけ理屈を。

Claude Code は会話の文脈（コンテキスト）を毎ターン読み直す。だから一度コンテキストに入った長い出力は、その後ずっと課金対象になる。ログ全文、HTML丸ごと、巨大な diff ── こういうものを安易に画面に出すと、後のやり取りすべてが重くなる。

節約の基本方針はシンプルだ。

重い出力を、メインの会話に残さない。

これを実現する具体策が以下。

1. 重い処理はサブエージェントに隔離する

一番効くのがこれ。

テストの実行、ドキュメントの取得、ログの解析 ── こういう「出力は多いが、結論は短い」作業は、サブエージェント（別働の Claude）に投げる。

サブエージェントは自分専用のコンテキストを持っている。だから長くて細かい出力はサブエージェント側に溜まり、メインの会話には要約だけが返ってくる。

たとえば自分の場合、X（Twitter）の検索や、商品ページの HTML 取得みたいな「往復が重い処理」は Haiku のサブエージェントに隔離している。メイン側には圧縮した結果が1行返るだけ。これで本筋のコンテキストが膨らまない。

ポイントは、委譲する前に「結論だけ返して」と指示すること。全文ダンプを返させたら隔離の意味がない。

2. ブラウザ操作は「全体スナップショット」を避ける

Playwright でブラウザを操作するとき、ページ全体のスナップショット（アクセシビリティツリー全部）を取ると、それだけで数千〜数万トークン入る。

自分は基本、スナップショットではなく browser_evaluate で必要な値だけ抜くようにしている。「このページの見出しと価格だけ」みたいに、JavaScript で対象を絞って取り出せば、要らない DOM が文脈に乗らない。

スナップショットは「最初の1回、構造を把握するため」だけ。あとはピンポイント抽出に切り替える。

3. 5時間枠を「退避」して自動で戻す

枠そのものへの対策もしている。

自分は usage-guard という小さな仕組みを組んで、5時間枠が逼迫したら一旦処理を退避し、枠が回復したら自動で再開するようにした。週次のペースも見て、使いすぎないよう抑える。

仕組みは大層なものではなく、タイマーで「いま枠に余裕があるか」を見て、無ければ待つ、回復したら続きをやる、というだけ。だが「気づいたら週次上限に張り付いていた」を防げるので、長時間まわす作業では効く。

4. スキルの `model:` 指定は範囲に注意

これは細かいが、ハマったので書いておく。

Claude Code のスキルには model: を指定できるが、これは そのスキルだけでなく、ターンの残り全体に効く。

たとえば「軽い前処理は Haiku で」とスキルに model: haiku を付けると、そのまま続けて呼ぶ「本番の執筆スキル」まで Haiku で走ってしまう。節約のつもりが品質を落とす事故になる。だから執筆のような本筋に続くスキルには、安いモデル指定を残さない。

5. 生データはコンテキストに出さず、grep で抜く

最後は習慣の話。

ログや HTML は Read で全文を開かず、curl ... -o /tmp/x.html で落としてから grep -oE や python3 で必要な行だけ抜く
検索結果も「全部見せて」ではなく、件数と要点に絞らせる
確認は「描画されているか」を grep の wc -l で数える、くらいで足りることが多い

要は、人間が目で全部追わないものを、わざわざ文脈に積まない。

まとめ

枠を使い切らないコツは、結局ひとつに集約される。

メインの会話を、軽く保つ。

重い処理はサブエージェントに隔離して要約だけ受け取る
ブラウザはピンポイント抽出でスナップショットを避ける
usage-guard で5時間枠を退避・自動復帰させる
スキルの model: の効く範囲に注意する
生データはgrep で抜いて文脈に積まない

派手な裏技はない。「文脈に何を残すか」を毎回ちょっと気にするだけで、同じ枠でこなせる仕事の量がだいぶ変わる。

参考

この記事は Claude Opus 4.8 が執筆しました。