英国AI Security Institute (AISI)による新しい評価によると、AnthropicのClaude Mythos Previewは、企業ネットワーク攻撃の完全なシミュレーションを完了した初のAIモデルとなった。
このモデルが2025年4月7日に発表されてから数日後に公開された調査結果は、AIのサイバー能力が世界中のセキュリティチームの早急な注意を必要とするレベルに達したことを示唆している。
Claude Mythosとは何か?
Anthropicは2025年4月7日にClaude Mythos Previewモデルを発表したが、広範な一般公開は行わなかった。代わりに、チームはその高度な機能を評価し準備するため、セキュリティ研究機関に限定的なアクセスを許可している。
Xでフォローして最新ニュースをリアルタイムで入手しましょう
この開発はすでにテクノロジーや政策界で注目を集め始めている。この件に詳しい関係者を引用したロイターの報道によると、米国財務長官スコット・ベッセントとFRS(連邦準備制度理事会) 議長ジェローム・パウエルは、主要銀行のCEOと緊急会議を開き、このモデルに関連する潜在的なサイバーリスクについて警告した。
Claude Mythos Previewのパフォーマンス
英国政府の科学・イノベーション・技術省内の研究組織であるAI Security Institute (AISI)は、AnthropicのClaude Mythos Previewのサイバーセキュリティ能力を検証するため、サイバー評価を実施した。
まず、キャプチャー・ザ・フラグ(CTF)評価が行われた。これは、システムが脆弱性を特定して悪用し、隠された「フラグ」を取得する必要がある評価である。Mythosはエキスパートレベルのタスクで73%の成功率を達成した。これは2025年4月以前にはどのモデルも解決できなかった課題である。
Claude Mythosのサイバー攻撃能力。出典:AISIさらに、AISIは「The Last Ones」(TLO)と呼ばれる32段階の企業ネットワーク攻撃シミュレーションを構築した。人間のセキュリティ専門家がこれを完了するには約20時間が必要となる。
Mythos Previewは10回の試行中3回、シミュレーション全体を完了した。平均して、32の攻撃ステップのうち22を完了した。次点のClaude Opus 4.6は平均16ステップにとどまった。
Anthropic自身のレッドチームテストでは、Claude Mythos Previewがユーザーから明示的に指示された場合、すべての主要オペレーティングシステムと主要なウェブブラウザにおいてゼロデイ脆弱性を検出し悪用できることが判明した。
AISIは、組織が基本的なサイバーセキュリティ対策を優先すべきだと指摘している。これには、定期的なパッチ適用、厳格なアクセス制御、セキュリティ構成の強化、包括的なログ記録が含まれる。
私たちのYouTubeチャンネルに登録して、リーダーやジャーナリストの専門的な見解をご覧ください
Claude Mythosが従来のAIでは解決できなかったエキスパートサイバータスクの73%を突破という記事はBeInCryptoに最初に掲載されました。
出典: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/







