AIが攻撃側に渡る前に、防御側が使い切る——Anthropicは2026年4月8日、「Project Glasswing」を発表した。未公開の最新モデル「Claude Mythos Preview」を使い、世界の重要ソフトウェアに潜む脆弱性を先回りで発見・修正するイニシアチブで、AWS、Apple、Cisco、Google、Microsoft、NVIDIAなど11社がローンチパートナーとして名を連ねた。
何が起きたのか
Mythos PreviewはAnthropicが開発した未リリースの汎用フロンティアモデルで、ソフトウェアの脆弱性を発見する能力が「最高レベルの熟練した人間を除くすべての人間を上回る」とされる。
実際、Anthropicはここ数週間でMythos Previewを使い、すべての主要OSとすべての主要ブラウザを含む数千件のゼロデイ脆弱性を発見したと発表した。具体的な事例として3件が公開されている:
- OpenBSD: 27年間見落とされていた脆弱性。接続するだけでリモートからマシンをクラッシュさせることができる。世界で最もセキュリティに厳しいOSの一つとされてきたOpenBSDに、これほど長く残っていた穴があったことは素直に驚く
- FFmpeg: 16年間残っていた脆弱性。自動テストが500万回実行されても検出できなかったコード行に潜んでいた
- Linuxカーネル: 複数の脆弱性を自律的に発見・連鎖させ、一般ユーザー権限からマシンの完全制御へとエスカレーションする手法を開発
これらはすでにパッチが当たっており、他の多くの脆弱性についても暗号ハッシュを公開済みで、修正後に詳細を開示する予定だ。
サイバーセキュリティの脆弱性再現ベンチマーク「CyberGym」では、Mythos Previewが83.1%のスコアを記録し、現行最高モデルのOpus 4.6(66.6%)を大幅に上回った。SWE-benchでもMythos Previewが77.8%でOpus 4.6(53.4%)を引き離している。
一般公開はしない
Anthropicはこのモデルを一般公開しない方針を明確にしている。
「Mythos Previewを一般提供する予定はない。私たちの目標はMythosクラスのモデルを安全に大規模展開することだが、まず最も危険な出力を確実にブロックするセーフガードが必要だ」とAnthropicは説明する。セーフガードのテストは次期Claude Opusモデルで先行して行い、同等レベルのリスクを持たないモデルで改善・洗練させてからMythosクラスへ適用する計画だ。
Project Glasswingの参加企業は、第一者・オープンソース両方のシステムをスキャン・強化する目的でMythos Previewにアクセスできる。ローカルの脆弱性検出、バイナリのブラックボックステスト、エンドポイントの保護、ペネトレーションテストなどが想定される用途だ。
プレビュー期間中はAnthropicが最大1億ドルの使用クレジットを提供し、40以上の重要ソフトウェアを維持する組織にも拡大する。プレビュー終了後の料金は入力100万トークンあたり25ドル、出力100万トークンあたり125ドル。さらにオープンソースのセキュリティ強化のため、Linux FoundationのAlpha-OmegaとOpenSSFに250万ドル、Apache Software Foundationに150万ドルを直接寄付する。
なぜいまなのか
背景には、AIによるサイバー攻撃の急速な高度化がある。かつて数ヶ月かかっていた脆弱性の発見と悪用が、AIを使えば数分で可能になりつつある。CrowdStrikeは「攻撃者がゼロデイ脆弱性を見つけ、エクスプロイトを開発するペースは今後さらに加速する」と声明で述べた。
Microsoftのセキュリティ担当副社長Igor Tsyganskiy氏は「AIが介在することで、サイバーセキュリティはもはや純粋に人間の処理能力に縛られない」と指摘。防御側が後手に回らないためには今すぐ動く必要があるという認識が、大手企業の参加を促した形だ。
Anthropicは米国政府とも継続的に協議しており、民主主義国がAI技術で決定的なリードを維持することが国家安全保障上の優先事項だと主張している。90日以内に発見された脆弱性と修正内容の公開報告を行い、業界全体がその知見を活用できるようにする予定だ。
参考
この記事は Claude Sonnet 4.6 が執筆しました。
