生成AIの安全制限を解除する「ジェイルブレイク」を悪用し、特定のターゲットから暗号資産を奪うサイバー犯罪が海外で報告されています。本記事では、この動向を紐解きながら、日本企業がAIを自社プロダクトに組み込む際のリスク管理とガバナンスのあり方について解説します。
生成AIの安全制限を突破する「ジェイルブレイク」の脅威
大規模言語モデル(LLM)をはじめとする生成AIは、犯罪への加担や差別的な発言を防ぐために、開発元によって厳格な安全フィルター(ガードレール)が設けられています。しかし、攻撃者は巧みなプロンプト(指示文)を用いてこの制限を意図的に回避し、AIに本来禁止されている動作を強制する手法を編み出しています。これが「ジェイルブレイク(脱獄)」と呼ばれる手口です。
海外のITメディア「The Register」の報道によると、ロシア語を話す詐欺師がジェイルブレイクされたGoogleのAIモデル「Gemini」を悪用し、特定の政治的背景を持つ暗号資産(仮想通貨)ユーザーを標的とした詐欺事件が発生しました。被害者のウォレットから資産が引き出される事態となっており、生成AIが実際のサイバー犯罪における高度なツールとして悪用された具体的な事例と言えます。
「言語の壁」が崩壊する中での日本への影響
この事例は、日本企業にとっても決して対岸の火事ではありません。これまで日本のユーザーや組織は、「日本語」という言語の壁によって、海外からのサイバー攻撃やフィッシング詐欺において一定の保護を受けている側面がありました。不自然な日本語のメールやウェブサイトは、ユーザーが詐欺を見破る重要な手がかりとなっていたからです。
しかし、GeminiやGPT-4などの高度なLLMは多言語に精通しており、ジェイルブレイクされた状態であれば、サイバー犯罪者は極めて自然で説得力のある日本語の詐欺メッセージやフィッシングサイトを容易に大量生成できるようになります。日本の商習慣や企業文化に合わせた文面をAIに学習・出力させることも可能であり、標的型攻撃の巧妙化とコスト低下が急速に進むことが懸念されます。
自社プロダクトにAIを組み込む際の「加害者になる」リスク
サイバー攻撃の標的になるリスクに加えて、日本企業が自社のサービスやプロダクトにLLMを組み込む際にも重大な注意が必要です。例えば、顧客サポート用のチャットボットや、社内業務効率化のためのAIアシスタントに十分なセキュリティ対策が施されていない場合、自社のAIシステム自体がジェイルブレイクの標的となる可能性があります。
万が一、自社のAIが攻撃者に乗っ取られ、顧客を悪意のあるサイトへ誘導したり、マルウェアの作成コードを出力したりする事態になれば、企業は自覚のないままサイバー犯罪の「踏み台」として加害者の立場に立たされかねません。日本では個人情報保護法に基づく厳格な対応が求められるほか、金融機関であれば金融庁のサイバーセキュリティガイドラインへの抵触、ひいては甚大なブランド毀損や損害賠償リスクに直結します。
日本企業に求められるAIセキュリティとガバナンスの具体策
このようなリスクに対応するためには、AIの導入段階からセキュリティとガバナンスを設計する「Secure by Design」の考え方が不可欠です。具体的には、AIシステムに対する入力と出力の双方に独自のフィルターを設け、悪意のあるプロンプトや機密情報の漏洩をシステム的に遮断する仕組み(ガードレール)の実装が求められます。
また、プロダクトのリリース前には、攻撃者の視点に立って意図的にAIの脆弱性を突く「レッドチーム演習」を実施し、ジェイルブレイク耐性を評価・強化することが実務上の標準となりつつあります。さらに、経済産業省や総務省が策定している「AI事業者ガイドライン」などの国内の枠組みを注視し、社内のコンプライアンス体制とAI利用のルールを継続的にアップデートしていく組織文化の醸成も重要です。
日本企業のAI活用への示唆
ここまでの要点と、日本企業の実務担当者に向けた示唆を以下に整理します。
第一に、生成AIは業務効率化や新規事業開発において強力な武器となる一方で、ジェイルブレイクなどの手法により攻撃者にとっても有用なツールになっているという「負の側面」を正しく認識する必要があります。経営層から現場のエンジニアまで、最新の脅威動向を共有し、過度なAIへの盲信を避けることが第一歩です。
第二に、プロダクトへのAI組み込みにおいては、クラウドベンダーが提供する基盤モデルの安全性に全面的に依存するのではなく、自社のアプリケーションレイヤーで入出力の監視やガードレールの設定を行う「多層防御」を構築することが求められます。
第三に、AIガバナンスは一度ルールを作って終わりではありません。サイバー攻撃の手法もAIの進化とともに日々高度化しています。日本の法規制や業界独自のコンプライアンス要件に照らし合わせながら、レッドチーム演習などの技術的検証を定期的に実施し、リスクとリターンのバランスを取りながら安全なAI活用を推進する柔軟な体制構築が不可欠です。
