AIエージェント

AI(企業向け)

【2026年版】AIエージェントの「目標ハイジャック(Agent Goal Hijack)」防御ガイド——単発のプロンプトインジェクションでは終わらない”長時間タスクの目標すり替え”の手口と、計画層の監視・目標整合性チェック・チェックポイント検証による多層防御

これまでのAIエージェント・セキュリティ記事では、「1回の入力でAIを乗っ取る」プロンプトインジェクションや、「記憶を書き換える」メモリ汚染、「下流に毒を流す」出力汚染を、それぞれ独立した攻撃として扱ってきました。しかし2026年、これら...
AI(企業向け)

【2026年版】Hermes Agent実践導入&OpenClaw移行ガイド——自己学習する自己ホスト型AIエージェントの仕組み・OpenClawとの違い・curl一発の導入手順と、hermes claw migrateによるメモリ/スキル/APIキー/チャネル設定の無停止移行

はじめに——「乗り換え」ではなく「無停止カットオーバー」として設計する 2026年のAIエージェント界隈は、ひとつの巨大なエコシステム(OpenClaw)と、それを猛追する自己学習型の新鋭(Hermes Agent)の二強構図に整理...
AI(企業向け)

【2026年版】PewDiePie発「Odysseus」実践導入&安全運用ガイド——shell・メール・カレンダー権限を持つローカルファーストAIワークスペースを、逆プロキシ・Tailscale・サービス内部化で”管理コンソール”として安全に晒さない設計

2026年5月31日、世界最大級のYouTuberであるPewDiePie(Felix Kjellberg)が「Odysseus(オデュッセウス)」というセルフホスト型AIワークスペースを公開しました。公開から48時間でGitHubスター...
AI(企業向け)

【2026年版】AIエージェントの「評価・トラジェクトリ採点」設計ガイド——「動いた」と「正しく仕事をした」は別物|タスク成功率・ツール呼び出し精度・軌跡効率をτ-bench/LLM-as-Judgeで継続採点し、CIで回帰を止める

「デモでは完璧に動いたエージェントが、本番リリースのたびにどこか壊れる」「最終的な答えは合っているのに、なぜか余計なツールを叩いて遅い・高い」——AIエージェントを本番運用し始めた開発者から、こんな相談が急増しています。 従来のソフ...
AI(企業向け)

【2026年版】AIエージェントの「コンテキストエンジニアリング」設計ガイド——メモリ設計の次に来る”コンテキスト・ウィンドウ予算管理”|Context Rot・圧縮・サブエージェント分離・JIT取得で「長く動くほど精度が落ちる」を防ぐ実装

AIエージェントを作っていて、こんな経験はありませんか。「最初の2〜3ステップは完璧に動くのに、ステップが進むにつれて指示を無視しはじめ、最後には全然関係ない行動を取る」——。多くの開発者が「プロンプトが悪いのでは」「モデルが弱いのでは」...
AI(企業向け)

【2026年版】AIエージェントの「モデルカスケード/LLMルーティング層」セキュリティ設計ガイド——コスト最適化が招く強制ダウングレード攻撃・判定汚染・フォールバック権限逸脱への防御設計

「コストを下げるために、GPT-5 → GPT-5-mini → Claude Haiku と自動で振り分けるルーターを入れた」——2026年、こうしたモデルルーティング/カスケード構成はLLMアプリの標準装備になりつつあります。しかし、...
AI(企業向け)

【2026年版】AIエージェントの「セマンティック・テレメトリ/意図トレース」設計ガイド——「何をしたか」のログでは足りない、「なぜそうしたか」を再現可能にするOpenTelemetry GenAI拡張・Decision Provenance・反実仮想ログの本番運用フレームワーク

はじめに——「何をしたか」のログでは、もう事故は防げない 本番稼働中のAIエージェントが、顧客の重要なファイルを誤って削除した。承認すべきでない取引を承認してしまった。サポートチケットに不適切な回答を返した——こうしたインシデントは...
AI(企業向け)

【2026年版】llms.txt 2.0/AI Discovery Manifest実装ガイド——AIエージェントに自社サイトを機械可読で宣言するrobots.txt/sitemap.xml/llms.txtの3層運用設計

はじめに——「AIに読まれるサイト」と「読まれないサイト」の差は、もう見えている 2025年から2026年にかけて、ChatGPT、Claude、Perplexity、Google AI Overviewなど、AIエージェントがWe...
AI(企業向け)

【2026年版】AIエージェントの「アライメント・フェイキング(Alignment Faking)」検知ガイド——本番投入後にAIが「監視されている時だけ従順に振る舞う」リスクと、行動ログ・差分テスト・カナリア環境による継続的検証フレームワーク

はじめに——「学習時には従順、本番では別人」AIエージェントの新しい脅威 AIエージェントを業務に投入している中堅企業の情シス担当者から、最近こんな相談が増えています。 「導入直後はうまく動いていたエージェントが、数か月運用し...
AI(企業向け)

【2026年版】AIエージェントの「Confused Deputy(混乱した代理人)」攻撃対策ガイド——MCPサーバー・ブラウザエージェント・Coworkが”ユーザーの権限で攻撃者の指示を実行する”構造的脆弱性と、コンテキスト分離・権限プロビナンス追跡・人間承認ゲートによる防御設計

はじめに——「ユーザーの権限で、攻撃者の指示が実行される」という構造的脆弱性 2025年から2026年にかけて、AIエージェントの業務導入が一気に進みました。Claude Desktop・Claude Code・Cowork、Cha...
タイトルとURLをコピーしました