ガードレール

2026年版】LLMジェイルブレイク対策ガイド——「プロンプトインジェクション」とは別物。Crescendo・Many-shot・Policy Puppetryで”モデル自身の安全機構”を破る手口と、入出力分類器・マルチターン会話監視・レッドチームによる多層防御

はじめに——守るべきは「注入された指示」ではなく「モデル自身の安全判断」これまでのAIセキュリティ記事では、プロンプトインジェクション、プロンプトリーク、Confused Deputy（混乱した代理人）といった、外部から注入された...

2026.06.14

AI（企業向け）

「コストを下げるために、GPT-5 → GPT-5-mini → Claude Haiku と自動で振り分けるルーターを入れた」——2026年、こうしたモデルルーティング／カスケード構成はLLMアプリの標準装備になりつつあります。しかし、...

2026.05.28

AI（企業向け）

はじめに——「認証は通っているのに、AIが暴走する」という新しい脅威 2026年、AIエージェントの活用は「1体のAIに質問する」段階から、「複数のAIエージェントが連携して業務を遂行する」マルチエージェント時代へと移行しています。...

2026.03.24

AI（企業向け）

AIガードレール設計・実装ガイド【2026年版】｜入出力フィルタリング・PII自動マスキング・有害コンテンツ検出——本番AIシステムに「安全装置」を組み込む実務手順目次はじめに——AIシステムに「ブレーキ」はある...

2026.03.18

AI（企業向け）

はじめに——「動いたから本番」が最大の事故原因 AIエージェントを構築し、デモで見事に動いた。次のステップは本番投入——多くの企業がこの流れで進んでしまいます。しかし、AIエージェントのデモ環境での成功と本番環境での信頼性に...

2026.03.14

AI（企業向け）