2025.12.24
Karpathyが描く2025年のLLM:6つのパラダイムシフト
TL;DR

出典:NotebookLM作成
- RLVR:検証可能な報酬による強化学習が、LLMの推論能力向上の鍵となる
- Jagged Intelligence:LLMは「動物」のような汎用知性ではなく、特定領域で突出した「ゴースト」のような知性を示す
- LLMアプリ層:汎用モデルを専門家化する「厚い」アプリケーション層がビジネスチャンスに
- PC統合型AI:Claude Codeのように、ユーザーのPC環境に深く統合されるAIが登場
- Vibe coding:自然言語によるプログラミングが民主化し、ソフトウェア開発のあり方が激変する
- LLM GUI:テキスト対話から、視覚的・空間的なインターフェースへの移行の兆候が現れる
はじめに
こんにちは、グループ研究開発本部・AI研究開発室のB.Dです。
LLM(大規模言語モデル)の世界は、日進月歩で進化を続けています。この急速な変化の中で、将来の技術トレンドを捉えることは非常に重要です。
今回、TeslaでDirector of AIを務め、OpenAIの創設メンバーでもある著名なAI研究者Andrej Karpathy氏が、自身のブログで示唆に富む記事「2025 LLM Year in Review」(2025/12/19公開)を公開しました。本記事は、2025年にLLM分野で起きた重要な変化を年末に振り返り、今後の技術トレンドを考えるための観点を整理したものです。
そこで今回は、その要点を皆さんと一緒に見ていきます。

出典:karpathy.bearblog.dev/year-in-review-2025/
1. Reinforcement Learning from Verifiable Rewards (RLVR)
2025年初頭まで、LLMの生産スタックは概ね以下の3つのステージで構成されていました。
- Pretraining(事前学習):大量のテキストデータから言語のパターンを学習する。
- Supervised Finetuning (SFT):指示に従うように、高品質な教師データでファインチューニングする。
- Reinforcement Learning from Human Feedback (RLHF):人間のフィードバックを基に、より好ましい応答を生成するよう強化学習で調整する。
Karpathy氏は、ここに「Reinforcement Learning from Verifiable Rewards (RLVR)」が主要なステージとして加わったことを、2025年の大きな転換として捉えています。RLVRとは、数学やコードのパズルのように正解が自動的に検証できる環境で、検証結果を報酬としてモデルを最適化する考え方です。モデルは報酬最大化の過程で、問題分解や試行錯誤など、人間から見て「推論」に見える振る舞いを強めていきます。
SFTやRLHFが比較的短い調整であるのに対し、RLVRはごまかしの効かない客観的な報酬に対して長い最適化を回しやすく、投入計算の効きが大きいという見立てが示されます。その結果として、(1)事前学習に割り当てられていた計算の一部がRLVR側に寄る、(2)テスト時に「思考時間」(推論トレースの長さ等)を増やして計算を能力に変換する調整ノブが重視される、という2つの流れが強まったと整理されています。
例として、初期の分かりやすいデモにo1(o1-previewは2024年9月に公開)が挙げられ、直感的に能力差を感じる転換点としてo3(2025年4月にリリース)が語られています。
2. Ghosts vs. Animals / Jagged Intelligence
2025年は、LLMの知性の「形状」に関する直感が大きく更新された年だとKarpathy氏は述べます。その比喩が「我々は『動物』を育てているのではなく、『ゴースト』を召喚している」です。人間の知能が生存環境の最適化圧力で進化してきたのに対し、LLMはテキスト模倣、検証可能領域での報酬、そして人間評価といった異なる圧力で最適化されます。
その結果として、特定ドメイン(特に検証可能な領域)では能力が急激に尖る一方、別領域では驚くほど未熟であるという、「ギザギザ(jagged)」な性能分布が目立つようになります。高い知的作業ができるのに、別のところでは初歩的なミスをする、といった同居が起こりうるという問題意識です。

人間知能(青) vs 人工知能(赤)。出典:karpathy.bearblog.dev/year-in-review-2025/
この「ギザギザな知能」は、従来のベンチマークに対する信頼性の低下にもつながります。ベンチマークは構造的に「検証可能な環境」になりやすく、RLVRによって狙い撃ちで対策されてしまうためです。
3. Cursor / 新しいLLMアプリのレイヤー
コードエディタCursorの台頭は、「LLMアプリ」という新しいレイヤーの存在を明確にしました。2025年の大きな論点は、このレイヤーがどれだけ厚くなるかという点です。Karpathy氏は、このレイヤーが非常に厚くなると見ています。LLMアプリは、特定用途のためにLLM呼び出しを調整・統合し、ユーザーに価値を届けます。主要な機能は概ね以下の4つに整理できます。
- コンテキストエンジニアリング:LLMに与える適切なコンテキストを構築・管理する。
- 複数のLLMコールの連携:複数呼び出しを処理フローに組み込み、品質・速度・コストのバランスをとる。
- アプリケーション固有のGUI:ユーザーが直感的に操作できる専用UIを提供する。
- 自律性スライダー:AIの自律性(どこまで勝手に進めるか)をユーザーが調整できるようにする。
汎用モデル(LLMラボ)が生み出す「汎用能力」を、アプリ層が「特定分野で機能する専門家チーム」へと組織化していく。このラストワンマイルの統合こそが、LLMアプリ層の厚みと価値の源泉になります。
4. Claude Code / コンピュータ上で動作するAI
Anthropic社のClaude Code (CC)は、LLMエージェントがどのようなものになるかを示す説得力のあるデモとして語られます。Karpathy氏が強調するポイントは、演算がクラウドかローカルかという単純な場所の違いではなく、AIがユーザーの既存環境全体にフルアクセスできるかという本質です。すでに起動しているコンピュータ、そのインストール状況、コンテキスト、データ、シークレット、設定、そして低遅延のインタラクションに密接に統合されるほど、体験価値が大きくなるという見立てです。
5. Vibe coding
2025年、AIの能力は、コードの存在をほとんど意識せずに自然言語(英語)だけでプログラムを組み立てられるレベルに到達し、この動きをKarpathy氏は「vibe coding」と呼びます(本人が以前の投稿で使い始めた語としても触れられています)。この変化がもたらす大きな影響の一つが、プログラミングの民主化です。従来のテクノロジーとは対照的に、LLMは専門家や企業、政府よりも一般の人々に大きな利益をもたらし得る、という観点が示されます。
一方で恩恵は専門家にも及びます。小さなツールやプロトタイプ、既存ライブラリの選定・導入、言語の深い習熟を要した作業が、対話を通じて高速に形になるため、実験速度が大きく上がります。結果として、コードが「安く・素早く・作って捨てられる」方向に性質を変え、試行回数が武器になる世界観が強まります。
6. Nano banana / LLM GUI
GoogleのGemini「Nano banana」は、LLMにおけるGUI(グラフィカルユーザインタフェース)の到来を告げる初期の兆候として触れられます。Karpathy氏は、現在のLLMとの「チャット」中心の対話を、1980年代のコンピュータにおける「コンソールへのコマンド入力」に例えます。人間はテキストを読むよりも情報を視覚的・空間的に消費する傾向があるため、LLMも単なるテキストではなく、画像、インフォグラフィック、スライド、動画といった視覚的フォーマットで応答していく方向が重要になる、という主張です。
一目瞭然ですが、本稿のキャッチコピーも、NotebookLMを通じてNano bananaを利用しています。
考察:2025年のLLMトレンドから見える未来
Karpathy氏は結論として、LLMが「予想より賢く、同時に予想より愚かな」新しい種類の知性として台頭しているとまとめ、現在の能力ですら産業が活用しきれていないという見立てを提示します。これらのトレンドは日本の開発者やエンジニアにとっても重要です。PC統合型のAIエージェントが広がるほど、標準ベンチマークだけに依存した評価は難しくなり、自分たちの現場のタスク・データ・制約に即した検証スイートを整備する必要性が増していきます。
まとめ
本記事では、Andrej Karpathy氏が振り返る2025年のLLMにおける6つのパラダイムシフトを解説しました。
- RLVR:検証可能な報酬による最適化が、計算リソース配分と能力の「調整ノブ」を再定義した。
- ギザギザな知能:動物とは異なる「ゴースト」の比喩として、LLMの特異な能力分布への理解が深まった。
- LLMアプリのレイヤー:汎用LLMに文脈を与え専門家化する、厚いアプリケーション層が価値の中心になる。
- PC統合型AI:低遅延でユーザー環境と統合されるほど体験価値が増し、エージェントの設計思想が変わる。
- Vibe coding:自然言語によるプログラミングが一般化し、一般ユーザーにも専門家にも試行回数の武器を与えた。
- LLM GUI:テキスト対話から、人間が好む視覚的・空間的インターフェースへの移行の可能性が示された。
これらの変化は、LLMが単なるツールから、私たちの働き方や創造性を根本から変えるパートナーへと進化していく過程を示唆しています。
最後に
グループ研究開発本部 AI研究開発室では、データサイエンティスト/機械学習エンジニアを募集しています。ビッグデータの解析業務などAI研究開発室にご興味を持って頂ける方がいらっしゃいましたら、ぜひ 募集職種一覧 からご応募をお願いします。皆さんのご応募をお待ちしています。
グループ研究開発本部の最新情報をTwitterで配信中です。ぜひフォローください。
Follow @GMO_RD


