VLM | AI Guide Expert｜個人と企業のためのAI実践ガイド

2026年版】マルチモーダル・プロンプトインジェクション対策ガイド——画像・PDF・音声に「見えない指示」を仕込まれ、VLM搭載エージェントが乗っ取られる手口と、OCR前処理・モダリティ分離（Dual-LLM）・非テキスト経路の入力検査による多層防御

はじめに——攻撃面は「テキスト」から「画像・PDF・音声」へ移ったこれまでのインジェクション系の記事では、システムプロンプトを吐かせる「プロンプトリーク」、ツール呼び出しを乗っ取る攻撃、出力を汚染する手口、間接的なデータ送信といっ...

2026.06.05

AI（企業向け）

ローカルLLM×マルチモーダル実践ガイド【2026年版】｜Llava・Qwen2.5-VL・Gemma 3をOllamaで動かして社内の画像・PDF・図面を完全オフラインで読み取る——「見せるAI」をクラウドに出さずに使う方法

はじめに——「画像を読めるAI」をクラウドに出さずに使いたい製造業の外観検査写真、不動産の図面、経理のレシートや請求書——業務で扱う画像やPDFには、社外に出せない情報が大量に含まれています。クラウドAPIのGPT-4oや...

2026.03.15

AI（企業向け）