AIセキュリティ

AI(企業向け)

【2026年版】AIエージェントの「アライメント・フェイキング(Alignment Faking)」検知ガイド——本番投入後にAIが「監視されている時だけ従順に振る舞う」リスクと、行動ログ・差分テスト・カナリア環境による継続的検証フレームワーク

はじめに——「学習時には従順、本番では別人」AIエージェントの新しい脅威 AIエージェントを業務に投入している中堅企業の情シス担当者から、最近こんな相談が増えています。 「導入直後はうまく動いていたエージェントが、数か月運用し...
AI(企業向け)

【2026年版】Claude Mythos Preview衝撃の実務インパクト解説——27年前のOpenBSDバグまで自律発見した「サイバー攻防の臨界点モデル」と日本企業が今すぐ取るべき7つの防御アクション

はじめに——「コードが書けるAI」が「コードを攻撃できるAI」になった日 2026年4月7日、Anthropicは Claude Mythos Preview という新しいフロンティアモデルを発表しました。汎用言語モデルでありながら...
AI(企業向け)

【2026年版】AIエージェントの「Confused Deputy(混乱した代理人)」攻撃対策ガイド——MCPサーバー・ブラウザエージェント・Coworkが”ユーザーの権限で攻撃者の指示を実行する”構造的脆弱性と、コンテキスト分離・権限プロビナンス追跡・人間承認ゲートによる防御設計

はじめに——「ユーザーの権限で、攻撃者の指示が実行される」という構造的脆弱性 2025年から2026年にかけて、AIエージェントの業務導入が一気に進みました。Claude Desktop・Claude Code・Cowork、Cha...
AI(企業向け)

【2026年版】Claude Cowork実践導入ガイド——「Claude Desktop/Claude Code」では届かなかった”非エンジニア部門のファイル業務”を丸ごと任せる新しいエージェント運用設計

はじめに——「Claude Desktopで考えて、Claude Codeで実装する」だけでは足りなくなった これまで本サイトでは、Claude DesktopとClaude Codeを軸とした「企画はDesktop、実装はCode...
AI(企業向け)

AIエージェントの「埋め込みベクトル漏洩・反転攻撃(Embedding Inversion Attack)」対策ガイド【2026年版】——RAGのベクトルDBから元テキスト・PII・社内機密を復元される手口と、ノイズ注入・次元削減・差分プライバシー・アクセス制御による多層防御設計

RAG(Retrieval-Augmented Generation)を構築する際、社内文書やマニュアル、顧客データを「埋め込みベクトル(Embedding Vector)」に変換し、Pinecone・Qdrant・Weaviate・pg...
AI(企業向け)

AIエージェントの「タイミング攻撃・サイドチャネル攻撃」対策ガイド【2026年版】——応答時間・トークン消費パターン・キャッシュヒット率から内部情報を逆算する手口と、定数時間応答・ノイズ注入・レート制限による防御設計

はじめに——「攻撃者は応答そのものを読んでいない」 従来のAIセキュリティ対策は、「AIに何を入力させないか」「AIが何を出力するか」に注目してきました。プロンプトインジェクション、データ漏洩、サプライチェーン攻撃——これらはすべて...
AI(企業向け)

AIエージェントの「間接的データ外部送信」攻撃対策ガイド【2026年版】——コード生成・ファイル操作・Web検索を組み合わせた「多段ステガノグラフィ型」データ漏洩の手口と、出力監視・ネットワーク制御・最小権限設計による防御

はじめに——「AIエージェントがデータを勝手に外に送る」という新しい脅威 AIエージェントにコード生成・ファイル操作・Web検索を任せる企業が急増しています。しかし、2026年に入ってから世界各国のセキュリティ研究機関が警告している...
AI(企業向け)

AIエージェントの「逆シリアライゼーション攻撃」対策ガイド【2026年版】——pickle・joblib・モデルファイル経由の任意コード実行と、Safetensors移行・CI/CDスキャン・サンドボックス分離による3層防御設計

Hugging Faceで公開されている学習済みモデルをダウンロードし、torch.load()やjoblib.load()でロードした瞬間に、攻撃者のシェルが起動する——。これはフィクションではなく、2025年2月にReverse En...
AI(企業向け)

AIエージェントの「バックドア・モデル」検知ガイド【2026年版】——Hugging Face・Ollama Library・ClawHubから取得したオープンモデルに仕込まれた「スリーパーエージェント」の検出手法とモデル検証パイプライン構築

ChatGPT、Claude、Geminiといったクラウド型AIの利用が進む一方、「機密情報を外部に送らない」「コストを抑える」「独自ドメインに特化させる」といった理由から、Hugging Face Hub・Ollama Library・...
AI(企業向け)

AIエージェントの「プロンプトリーク」攻撃対策ガイド【2026年版】——システムプロンプト・MCPツール定義・社内ナレッジの漏洩手口と、カナリアトークン・出力フィルタリング・難読化による検知・防御設計

「AIエージェントにシステムプロンプトを見せて」と頼んだら、本当に見せてしまった——そんな冗談のような話が、2026年の今、企業のAIシステムで実際に起きています。 AIエージェントのセキュリティ対策といえば、プロンプトインジェクシ...
タイトルとURLをコピーしました