Gemini アプリが、どのような方法で悪意のあるコンテンツやプロンプト インジェクション攻撃からユーザーを保護しているかをご紹介します。
生成 AI における悪意のあるコンテンツとプロンプト インジェクション
メールやコンテンツを標的とする脅威にはマルウェアやフィッシング攻撃などがありますが、同様に生成 AI ツールを標的とするセキュリティ脅威も存在します。プロンプト インジェクション攻撃は、生成 AI ツールから意図しない回答や有害な回答を引き出そうとする攻撃です。攻撃者がプロンプト インジェクション攻撃を実行する方法としては、クエリを直接送信する方法だけでなく、悪意のあるコンテンツをユーザーと共有する方法もあります。後者の場合、ユーザーが気がつかずに生成 AI ツール(Gemini アプリや Gemini for Workspace)のプロンプトで悪意のあるコンテンツを参照してしまうことで、プロンプト インジェクションが発生します。
Google は高度なセキュリティ対策により危険なコンテンツや不審なコンテンツを特定し、Gemini ユーザーを保護します。
悪意のあるコンテンツやプロンプト インジェクション攻撃を検知するための仕組み
Gemini アプリでは、悪意のあるコンテンツやプロンプト インジェクション攻撃からユーザーを保護するために、不審なアクティビティが検知された場合に入力をブロックすることがあります。
Gemini が疑わしいプロンプトに関連するアクティビティを特定した場合
- セキュリティ リスクのあるコンテンツについては Gemini アプリから警告が通知される
- 状況によっては、回答の生成にいずれのコンテンツも使用されないことがある
- Gemini が不審なコンテンツを除外し、一部のコンテンツのみを使用して回答を生成することがある
たとえば、Gemini アプリに複数のメール メッセージを要約するようリクエストし、いずれかのメッセージに悪意のあるコンテンツが含まれていた場合、Gemini は安全上の理由からプロンプトに回答しないことがあります。
安全ではないコンテンツを回避する
知らない人から受け取ったコンテンツを利用するときは注意する
- 他のツール(Gmail など)からコンテンツを受け取る際は Google からの警告に注意する
- 信頼できないソースからのリンクはクリックしない
- 誰が共有したかが不明なコンテンツ(Gemini アプリの公開チャットや Gemini Canvas ウェブアプリなど)は慎重に利用する
生成 AI における悪意のあるコンテンツとプロンプト インジェクション
回答が不正確または安全でないと思われる場合は、フィードバックを送信してください。