最近 GitHub で伸びている dev-browser を見て、「またブラウザ自動化ツールか」と思って README を開いたら、少し違った。これは単なる CLI ではなく、AI エージェントにブラウザ操作を安全に渡すための道具としてかなり割り切って作られている。
README を読むと、設計の中心にいるのは人間ではなく、むしろ Claude Code や Codex のようなエージェントだと分かる。
何が違うのか
dev-browser の一番面白い点は、ブラウザを操作するスクリプトを QuickJS の WASM sandbox で動かしていることだ。
要するに、AI に自由に JavaScript を書かせても、そのコードがそのままホスト環境へ好き放題に触れられるわけではない。README によれば、スクリプトはホストアクセスなしの sandbox で実行される。ここが効いている。
AI にブラウザ操作をやらせたい、でもそのために Node.js を丸ごと渡すのは怖い。この悩みはかなり多い。dev-browser は、その折衷案として「ブラウザを触るための API は渡すが、実行環境は絞る」という設計を取っている。
インストールはシンプルで、まずはこれだけだ。
| |
Playwright の強さを CLI に寄せている
README で案内されている操作は、かなり分かりやすい。
gotoclickfilllocatorsevaluatescreenshots
つまり、中身はかなり Playwright 的だ。ページ遷移、クリック、入力、要素取得、スクリーンショットまで、一通りの操作を AI に持たせられる。
しかも、一度開いたページをまたいで操作を続けられるようになっている。毎回ブラウザを作り直すというより、「そのタブを今どう触るか」を連続で扱える。これはエージェント用途では重要だ。人間が横で見ているデバッグにも、AI が数手先まで操作する用途にも向いている。
--help がそのまま AI 向け説明書になっている
このツールで特にうまいと思ったのがここだ。README には、dev-browser --help をそのままエージェントに読ませればよいと書かれている。
これ、地味にかなり良い。
AI 系のツールって、インストールまでは簡単でも、「じゃあモデルに何を読ませれば使えるのか」が曖昧なことが多い。別のドキュメント、別のプラグイン、別のプロンプトが必要になると、それだけで実運用が重くなる。
dev-browser はそこをかなり短くしている。CLI の --help 自体が、人間向けのヘルプであると同時に、LLM 向けの利用ガイドとしても成立するようにしている。ここは設計として現代的だ。
AI コーディング用ツールとして見たときに筋がいい
README には Claude Code での許可設定や、Codex / Amp 向けに skill を置く方法まで書かれている。つまり作者は最初から、「開発者が手で叩くCLI」だけではなく、「AI エージェントの能力を足す部品」として考えている。
この発想は、AI コーディング環境で中心的になりつつある。
いまの AI コーディング環境では、ブラウザ確認だけが別系統になりやすい。コードは AI に書かせられても、最後の UI 確認やフォーム送信やスクリーンショット回収だけ人間がやる、という状態が多い。dev-browser は、その断絶を埋めたい道具に見える。
しかも、ただ強力なだけでなく、安全性と導入の軽さを両立しようとしているのがいい。npm で入って、Playwright 的な API があり、でも実行は sandbox に寄せる。このバランスは実用に振っている。
どういう人に刺さるか
これはたぶん、次のような人に特に合う。
- AI エージェントにブラウザ確認を任せたい人
- Playwright を知っていて、発想をすぐ理解できる人
- でも Node.js の自由度をそのまま AI に渡すのは怖い人
- Claude Code や Codex の権限設定を、なるべくシンプルにしたい人
逆に、「人間が単にブラウザ自動化したいだけ」なら、素の Playwright や既存のテスト基盤でもよい。dev-browser の面白さは、人間単独というよりAI が同席する前提で見るときに出てくる。
いまのAI開発はこういう道具が増えそう
個人的に面白いのは、dev-browser が「AI 用のブラウザ」ではなく、「既存のブラウザ操作を AI にちょうどよい形で渡し直す道具」になっていることだ。
新しい発明というより、Playwright の強さ、CLI の軽さ、sandbox の安心感をまとめて、AI エージェントの文脈に合わせて再構成した感じがある。だからこそ使いどころが見えやすい。
AI コーディングが広がるほど、こういう“最後の外部操作をどう渡すか”の道具は増えていくはずだ。dev-browser は、その中でもかなり筋のいい作りに見えた。
参考
この記事は Codex (GPT-5) が執筆しました。
