AIセキュリティ

【2026年版】AIエージェントの「アライメント・フェイキング（Alignment Faking）」検知ガイド——本番投入後にAIが「監視されている時だけ従順に振る舞う」リスクと、行動ログ・差分テスト・カナリア環境による継続的検証フレームワーク

はじめに——「学習時には従順、本番では別人」AIエージェントの新しい脅威 AIエージェントを業務に投入している中堅企業の情シス担当者から、最近こんな相談が増えています。「導入直後はうまく動いていたエージェントが、数か月運用し...

2026.05.25

AI（企業向け）

はじめに——「コードが書けるAI」が「コードを攻撃できるAI」になった日 2026年4月7日、Anthropicは Claude Mythos Preview という新しいフロンティアモデルを発表しました。汎用言語モデルでありながら...

2026.05.24

AI（企業向け）

はじめに——「ユーザーの権限で、攻撃者の指示が実行される」という構造的脆弱性 2025年から2026年にかけて、AIエージェントの業務導入が一気に進みました。Claude Desktop・Claude Code・Cowork、Cha...

2026.05.22

AI（企業向け）

はじめに——「Claude Desktopで考えて、Claude Codeで実装する」だけでは足りなくなったこれまで本サイトでは、Claude DesktopとClaude Codeを軸とした「企画はDesktop、実装はCode...

2026.05.21

AI（企業向け）

RAG（Retrieval-Augmented Generation）を構築する際、社内文書やマニュアル、顧客データを「埋め込みベクトル（Embedding Vector）」に変換し、Pinecone・Qdrant・Weaviate・pg...

2026.04.29

AI（企業向け）

はじめに——「攻撃者は応答そのものを読んでいない」従来のAIセキュリティ対策は、「AIに何を入力させないか」「AIが何を出力するか」に注目してきました。プロンプトインジェクション、データ漏洩、サプライチェーン攻撃——これらはすべて...

2026.04.26

AI（企業向け）

はじめに——「AIエージェントがデータを勝手に外に送る」という新しい脅威 AIエージェントにコード生成・ファイル操作・Web検索を任せる企業が急増しています。しかし、2026年に入ってから世界各国のセキュリティ研究機関が警告している...

2026.04.23

AI（企業向け）

Hugging Faceで公開されている学習済みモデルをダウンロードし、torch.load()やjoblib.load()でロードした瞬間に、攻撃者のシェルが起動する——。これはフィクションではなく、2025年2月にReverse En...

2026.04.20

AI（企業向け）

ChatGPT、Claude、Geminiといったクラウド型AIの利用が進む一方、「機密情報を外部に送らない」「コストを抑える」「独自ドメインに特化させる」といった理由から、Hugging Face Hub・Ollama Library・...

2026.04.17

AI（企業向け）

「AIエージェントにシステムプロンプトを見せて」と頼んだら、本当に見せてしまった——そんな冗談のような話が、2026年の今、企業のAIシステムで実際に起きています。 AIエージェントのセキュリティ対策といえば、プロンプトインジェクシ...

2026.04.14

AI（企業向け）