VLM

AI(企業向け)

2026年版】マルチモーダル・プロンプトインジェクション対策ガイド——画像・PDF・音声に「見えない指示」を仕込まれ、VLM搭載エージェントが乗っ取られる手口と、OCR前処理・モダリティ分離(Dual-LLM)・非テキスト経路の入力検査による多層防御

はじめに——攻撃面は「テキスト」から「画像・PDF・音声」へ移った これまでのインジェクション系の記事では、システムプロンプトを吐かせる「プロンプトリーク」、ツール呼び出しを乗っ取る攻撃、出力を汚染する手口、間接的なデータ送信といっ...
AI(企業向け)

ローカルLLM×マルチモーダル実践ガイド【2026年版】|Llava・Qwen2.5-VL・Gemma 3をOllamaで動かして社内の画像・PDF・図面を完全オフラインで読み取る——「見せるAI」をクラウドに出さずに使う方法

はじめに——「画像を読めるAI」をクラウドに出さずに使いたい 製造業の外観検査写真、不動産の図面、経理のレシートや請求書——業務で扱う画像やPDFには、社外に出せない情報が大量に含まれています。 クラウドAPIのGPT-4oや...
タイトルとURLをコピーしました