World Models(世界モデル)とは?|LLMの次を目指すAIの新しいアプローチ
ChatGPTやClaudeなどの大規模言語モデル(LLM)が世界を席巻する中、「LLMは行き止まりだ」と主張するAI研究者がいます。
その人物は、ヤン・ルカン(Yann LeCun)。ディープラーニングの父と呼ばれ、2018年にチューリング賞を受賞した、AI研究の第一人者です。
ルカンは2025年11月にMetaを退社し、LLMとは異なるアプローチ「World Models(世界モデル)」を開発する新会社を設立しました。
この記事では、World Modelsとは何か、LLMとの違い、そしてなぜ注目されているのかを解説します。
LLMの限界とは?
まず、なぜルカンがLLMを「行き止まり」と考えているのかを理解しましょう。
LLMは「次の単語を予測する」だけ
LLMの基本的な仕組みは、膨大なテキストデータから「次に来る単語」を予測することです。これは非常に強力で、人間のような文章を生成できます。
しかし、ルカンによれば、この仕組みには根本的な問題があります。
- 世界を「理解」していない:LLMはテキストのパターンを学習しているだけで、物理的な世界がどう動くかを理解していません。
- ハルシネーション(嘘)を生む:LLMは「もっともらしい続き」を出力するため、事実と異なる内容を堂々と生成することがあります。
- 計画を立てられない:LLMは一度に一つの単語を予測するだけで、長期的な計画や推論が苦手です。
人間の学習との違い
人間の赤ちゃんは、何千時間もの視覚体験から世界の仕組みを学びます。テーブルからコップを落とせば床に落ちる、ボールを投げれば放物線を描く——こうした物理法則を、誰に教わるでもなく理解します。
一方、LLMは何十億ページものテキストを読んでも、こうした「常識」を本当の意味では獲得できません。
ルカンはこう述べています。
「LLMをスケールアップ(大規模化)するだけでは、人間レベルのAIには到達しない。LLMは巨大な記憶と検索能力を持つシステムであり、新しい問題の解決策を発明できるシステムではない」
World Models(世界モデル)とは?
では、World Modelsとは何でしょうか?
一言で言えば「AIの脳内シミュレーター」
World Modelsは、AIが外界の仕組みを学習し、頭の中で「こうしたらこうなる」とシミュレーションできるようにする仕組みです。
人間は、コップを落とす前に「落としたら割れるだろう」と予測できます。これは、私たちの脳内に「世界のモデル」があり、行動の結果をシミュレーションできるからです。
World Modelsは、この能力をAIに持たせようとするアプローチです。
LLMとWorld Modelsの違い
| 項目 | LLM | World Models |
|---|---|---|
| 学習対象 | テキスト | 動画・空間・物理データ |
| 予測方法 | 次の単語を予測 | 世界の状態変化を予測 |
| 理解の深さ | 表面的なパターン | 因果関係・物理法則 |
| 計画能力 | 限定的 | 長期的な計画が可能 |
| ハルシネーション | 起きやすい | 物理的にありえないことを弾ける |
JEPA:World Modelsを実現するアーキテクチャ
ルカンが提唱する具体的な技術が、JEPA(Joint Embedding Predictive Architecture) です。
JEPAの基本的な考え方
従来の生成AIは、画像や動画の「ピクセル」を一つ一つ予測・生成します。しかし、これは非常に非効率です。草が風に揺れる様子など、本質的でない細部まで予測しようとするため、計算コストが膨大になります。
JEPAは違います。ピクセルそのものではなく、「何が起きているか」という抽象的な表現(埋め込み) を予測します。
具体例で理解する
たとえば、テーブルの上にコップがある動画を考えてみましょう。
従来の生成AI:コップの色、光の反射、テーブルの木目、背景の壁紙……すべてのピクセルを予測しようとします。
JEPA:「コップがテーブルの上にある」→「手が伸びてコップを掴む」→「コップがテーブルから離れる」という状態の変化を抽象的に予測します。
これにより、本質的な情報に集中でき、計算効率が大幅に向上します。
I-JEPAとV-JEPA
ルカンのチームは、JEPAの概念を実装したモデルをすでに発表しています。
- I-JEPA(Image JEPA):静止画像を理解するモデル。画像の一部を隠して、隠された部分に何があるかを抽象的に予測します。
- V-JEPA(Video JEPA):動画を理解するモデル。動画の一部をマスクして、マスクされた部分で何が起きているかを予測します。
V-JEPAは、物体同士の細かな相互作用を検出・理解することに優れており、「物理的にありえない」シーンを見抜くことができます。
なぜ今、World Modelsが注目されているのか
LLMの進化が鈍化?
2025年後半から、「LLMのスケーリング(大規模化)による性能向上が頭打ちになりつつある」という声が聞かれるようになりました。
OpenAIの共同創業者イリヤ・サツケバーも、最近のインタビューで「現在のモデルはプラトー(停滞)に達しており、事前学習の結果が平坦化している」と述べています。
これにより、LLM以外のアプローチへの関心が高まっています。
2026年は「World Modelsの年」?
World Modelsに取り組む企業や研究機関が急増しています。
- Google DeepMind:Genieなどのworld modelを開発
- World Labs(フェイフェイ・リー設立):商用world model「Marble」をリリース
- Runway:GWM-1をリリース
- General Intuition:1億3400万ドルのシード資金を調達
調査会社PitchBookは、ゲーム分野でのworld model市場が2030年までに2760億ドル規模に成長すると予測しています。
ルカンの新会社「AMI Labs」
会社概要
ルカンは2025年11月にMetaを退社し、AMI Labs(Advanced Machine Intelligence Labs) を設立しました。
- 評価額:30〜50億ドル(約4,500億〜7,500億円)を目指して資金調達中
- CEO:Alex LeBrun(フランスのヘルステックNabla創業者)
- ルカン自身の役職:エグゼクティブ・チェアマン(会長)
- 本社:パリ(2026年初頭に設立予定)
- パートナー:Nabla(ヘルステック企業、FDA認証可能なAIシステムへの応用を検討)
AMI Labsの目標
ルカンは自身のFacebook投稿でこう述べています。
「物理世界を理解し、永続的な記憶を持ち、推論し、複雑な行動シーケンスを計画できるシステムを作ること。これがAIの次の大きな革命だ」
初期の「ベビー版」モデルは1年以内、本格的なシステムは数年後に登場する予定です。
Meta退社の理由
ルカンがMetaを去った背景には、いくつかの要因があります。
- Llama 4のベンチマーク問題:ルカン自身が「結果が少し改ざんされていた」と認めました。これによりザッカーバーグCEOが激怒し、GenAI部門への信頼を失いました。
- 方針の対立:Metaが新設した「Superintelligence Labs」はLLM中心のアプローチを採用。ルカンは「新しいAI人材は完全にLLM信者(LLM-pilled)だ」と批判しています。
- 研究の自由:ルカンは「研究者に何をしろとは言えない。特に私のような研究者には」と述べ、自分の信じる研究を追求するために独立しました。
おまけ:ルカン、GeminiユーザーだったI
2026年2月1日、ルカンはLinkedInに興味深い投稿をしました。
「I use Gemini 😊」
自分が12年間在籍し、AI研究を率いてきたMetaのAI(Meta AI)ではなく、GoogleのGeminiを使っていると公言したのです。
これは単なる個人の好みの表明かもしれませんが、LLMに対する彼のスタンス、そしてMetaとの関係を考えると、なかなか皮肉な発言です。
ちなみに、2026年1月時点でGeminiはAIチャットボット市場でシェア22%を獲得し、ChatGPT(64.6%)を猛追しています。
まとめ
World Modelsは、LLMとは根本的に異なるアプローチでAIの進化を目指す技術です。
- LLM:テキストのパターンを学習し、次の単語を予測
- World Models:物理世界の仕組みを学習し、状態の変化を予測
ルカンは「LLMは超知能への行き止まり」と断言し、自らの会社でWorld Modelsの実用化に挑んでいます。
彼の予測が正しければ、3〜5年以内にWorld ModelsがLLMに取って代わる可能性もあります。一方で、LLM陣営は「スケーリングはまだ限界に達していない」と反論しています。
どちらが正しいかはまだわかりませんが、AI業界にとって、LLM一辺倒ではない多様なアプローチが生まれていることは健全なことでしょう。
World Modelsの進展は、ロボティクス、自動運転、ヘルスケアなど、物理世界と関わる分野に大きな影響を与える可能性があります。今後の動向に注目です。
この記事の情報は2026年2月時点のものです。

コメント