[株式会社 CyCraft Japan]AIセキュリティの実践：インジェクション攻撃とガードレール防御 | Time Table – 世界トップクラスの専門家による情報セキュリティ国際会議「CODE BLUE（コードブルー）」

DAY 1

14:25-
14:55

大規模言語モデル（LLM）の導入が進む中、Prompt Injection、Prompt Extraction、Jailbreak といった新しい攻撃手法が急速に拡大しています。従来のセキュリティ対策だけでは十分に対応できません。本セッションでは、AIシステムの防御に不可欠な2つの柱に絞って解説します：

アドバーサリアル・レッドチームテスト —— 多様なインジェクションシナリオを通じて、LLMの隠れた脆弱性を明らかにする方法。
ガードレール防御 —— 検証可能な多層コントロールを組み込み、悪意あるプロンプトを抑止し、安全なモデル挙動を保証する手法。

実際の検証事例や防御アプローチを共有し、ブラックボックスに依存せず、組織がどのように AI 時代の新たな脅威に備えるべきかを議論します。

Speakers:
Renata Chang（レナタ　チョウ）株式会社 CyCraft Japan Architect Consultant

Location :
- Track 2(HALL A)
Category :
- OpenTalks
Share :