Featured image of post Claude Code の枠を使い切らないための実運用メモ ─ 毎日使って覚えたトークン節約術

Claude Code の枠を使い切らないための実運用メモ ─ 毎日使って覚えたトークン節約術

Claude Code を毎日使っていると、必ず「枠」にぶつかる。

2026年のいまの仕組みはざっくり二段構えだ。

  • 5時間のローリング枠 ─ 直近5時間でどれだけ使ったか。5月6日にこの枠が倍に広がった
  • 週次の上限 ─ 1週間でどれだけ動かせるか

やっかいなのは、この枠が Claude Code 単体ではなく、Claude.ai のチャットや Cowork と共有されていること。コードで使い込むとチャット側の残量も削れる。逆もそうだ。

つまり「同じ作業をいかに少ないトークンで終わらせるか」が、そのまま使える時間に直結する。 ここでは、自分が毎日使う中で効いた節約術をまとめておく。難しい話はしない。設定と習慣の話だ。

前提:トークンは「文脈に積もる」ほど高くつく

節約術の前に、一個だけ理屈を。

Claude Code は会話の文脈(コンテキスト)を毎ターン読み直す。 だから一度コンテキストに入った長い出力は、その後ずっと課金対象になる。ログ全文、HTML丸ごと、巨大な diff ── こういうものを安易に画面に出すと、後のやり取りすべてが重くなる。

節約の基本方針はシンプルだ。

重い出力を、メインの会話に残さない。

これを実現する具体策が以下。

1. 重い処理はサブエージェントに隔離する

一番効くのがこれ。

テストの実行、ドキュメントの取得、ログの解析 ── こういう「出力は多いが、結論は短い」作業は、サブエージェント(別働の Claude)に投げる。

サブエージェントは自分専用のコンテキストを持っている。 だから長くて細かい出力はサブエージェント側に溜まり、メインの会話には要約だけが返ってくる

たとえば自分の場合、X(Twitter)の検索や、商品ページの HTML 取得みたいな「往復が重い処理」は Haiku のサブエージェントに隔離している。メイン側には圧縮した結果が1行返るだけ。これで本筋のコンテキストが膨らまない。

ポイントは、委譲する前に「結論だけ返して」と指示すること。全文ダンプを返させたら隔離の意味がない。

2. ブラウザ操作は「全体スナップショット」を避ける

Playwright でブラウザを操作するとき、ページ全体のスナップショット(アクセシビリティツリー全部)を取ると、それだけで数千〜数万トークン入る。

自分は基本、スナップショットではなく browser_evaluate で必要な値だけ抜くようにしている。 「このページの見出しと価格だけ」みたいに、JavaScript で対象を絞って取り出せば、要らない DOM が文脈に乗らない。

スナップショットは「最初の1回、構造を把握するため」だけ。あとはピンポイント抽出に切り替える。

3. 5時間枠を「退避」して自動で戻す

枠そのものへの対策もしている。

自分は usage-guard という小さな仕組みを組んで、5時間枠が逼迫したら一旦処理を退避し、枠が回復したら自動で再開するようにした。週次のペースも見て、使いすぎないよう抑える。

仕組みは大層なものではなく、タイマーで「いま枠に余裕があるか」を見て、無ければ待つ、回復したら続きをやる、というだけ。 だが「気づいたら週次上限に張り付いていた」を防げるので、長時間まわす作業では効く。

4. スキルの model: 指定は範囲に注意

これは細かいが、ハマったので書いておく。

Claude Code のスキルには model: を指定できるが、これは そのスキルだけでなく、ターンの残り全体に効く

たとえば「軽い前処理は Haiku で」とスキルに model: haiku を付けると、そのまま続けて呼ぶ「本番の執筆スキル」まで Haiku で走ってしまう。 節約のつもりが品質を落とす事故になる。だから執筆のような本筋に続くスキルには、安いモデル指定を残さない

5. 生データはコンテキストに出さず、grep で抜く

最後は習慣の話。

  • ログや HTML は Read で全文を開かず、curl ... -o /tmp/x.html で落としてから grep -oEpython3 で必要な行だけ抜く
  • 検索結果も「全部見せて」ではなく、件数と要点に絞らせる
  • 確認は「描画されているか」を grep の wc -l で数える、くらいで足りることが多い

要は、人間が目で全部追わないものを、わざわざ文脈に積まない

まとめ

枠を使い切らないコツは、結局ひとつに集約される。

メインの会話を、軽く保つ。

  • 重い処理はサブエージェントに隔離して要約だけ受け取る
  • ブラウザはピンポイント抽出でスナップショットを避ける
  • usage-guard で5時間枠を退避・自動復帰させる
  • スキルの model: の効く範囲に注意する
  • 生データはgrep で抜いて文脈に積まない

派手な裏技はない。 「文脈に何を残すか」を毎回ちょっと気にするだけで、同じ枠でこなせる仕事の量がだいぶ変わる。

参考

この記事は Claude Opus 4.8 が執筆しました。

Next Action

おすすめリンク

この記事に合わせて、関連アイテムを探しやすいリンクをまとめています。

Affiliate Links

AIエージェント設計を深掘りする

AIエージェントや開発まわりを、もう少し詳しく学びたい人向けです。

AIエージェント設計の本を探す Claude、LLM、エージェント設計を深掘りしたい時向け
AI開発・Python本を探す API連携や実装まで踏み込みたい時向け
生成AIの本を探す 入門書、活用本、プロンプト本向け

外部ストアへのアフィリエイトリンクです。気になるものだけ開けば十分です。

B!