Anthropicの未公開AIが27年もののOpenBSD脆弱性を発見。Project Glasswingでサイバー防衛に投入

AIが攻撃側に渡る前に、防御側が使い切る——Anthropicは2026年4月8日、「Project Glasswing」を発表した。未公開の最新モデル「Claude Mythos Preview」を使い、世界の重要ソフトウェアに潜む脆弱性を先回りで発見・修正するイニシアチブで、AWS、Apple、Cisco、Google、Microsoft、NVIDIAなど11社がローンチパートナーとして名を連ねた。

何が起きたのか

Mythos PreviewはAnthropicが開発した未リリースの汎用フロンティアモデルで、ソフトウェアの脆弱性を発見する能力が「最高レベルの熟練した人間を除くすべての人間を上回る」とされる。

実際、Anthropicはここ数週間でMythos Previewを使い、すべての主要OSとすべての主要ブラウザを含む数千件のゼロデイ脆弱性を発見したと発表した。具体的な事例として3件が公開されている：

OpenBSD: 27年間見落とされていた脆弱性。接続するだけでリモートからマシンをクラッシュさせることができる。世界で最もセキュリティに厳しいOSの一つとされてきたOpenBSDに、これほど長く残っていた穴があったことは素直に驚く
FFmpeg: 16年間残っていた脆弱性。自動テストが500万回実行されても検出できなかったコード行に潜んでいた
Linuxカーネル: 複数の脆弱性を自律的に発見・連鎖させ、一般ユーザー権限からマシンの完全制御へとエスカレーションする手法を開発

これらはすでにパッチが当たっており、他の多くの脆弱性についても暗号ハッシュを公開済みで、修正後に詳細を開示する予定だ。

サイバーセキュリティの脆弱性再現ベンチマーク「CyberGym」では、Mythos Previewが83.1%のスコアを記録し、現行最高モデルのOpus 4.6（66.6%）を大幅に上回った。SWE-benchでもMythos Previewが77.8%でOpus 4.6（53.4%）を引き離している。

一般公開はしない

Anthropicはこのモデルを一般公開しない方針を明確にしている。

「Mythos Previewを一般提供する予定はない。私たちの目標はMythosクラスのモデルを安全に大規模展開することだが、まず最も危険な出力を確実にブロックするセーフガードが必要だ」とAnthropicは説明する。セーフガードのテストは次期Claude Opusモデルで先行して行い、同等レベルのリスクを持たないモデルで改善・洗練させてからMythosクラスへ適用する計画だ。

Project Glasswingの参加企業は、第一者・オープンソース両方のシステムをスキャン・強化する目的でMythos Previewにアクセスできる。ローカルの脆弱性検出、バイナリのブラックボックステスト、エンドポイントの保護、ペネトレーションテストなどが想定される用途だ。

プレビュー期間中はAnthropicが最大1億ドルの使用クレジットを提供し、40以上の重要ソフトウェアを維持する組織にも拡大する。プレビュー終了後の料金は入力100万トークンあたり25ドル、出力100万トークンあたり125ドル。さらにオープンソースのセキュリティ強化のため、Linux FoundationのAlpha-OmegaとOpenSSFに250万ドル、Apache Software Foundationに150万ドルを直接寄付する。