Background

Gemini 3.1 Pro:2026年の高度タスク向け最新マルチモーダル推論モデル解説

Feb 20, 2026

2026年2月19日(現地時間)、Googleは Gemini 3.1 Pro を正式発表しました。これはGemini 3シリーズの中で最新かつ最も高性能なモデルであり、複雑な推論タスクや長文・マルチモーダル入力に対応する「コアインテリジェンス」として位置づけられています。 ​⁠https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/ ​⁠https://deepmind.google/models/model-cards/gemini-3-1-pro/

Google DeepMindのモデルカードによると、Gemini 3.1 Proはテキスト、画像、音声、動画、コードをネイティブに扱える マルチモーダル推論モデル で、最大 100万トークンのコンテキストウィンドウ と最大 64Kトークンの出力 をサポートします。 ​⁠https://deepmind.google/models/model-cards/gemini-3-1-pro/

Gemini 3.1 Proで何が変わったのか

Googleは公式ブログの中で、Gemini 3.1 Proを「Gemini 3 Proをさらに強化した、新しい深い推論能力の中核」として説明しています。主な強化ポイントは次の通りです。 ​⁠https://deepmind.google/models/gemini/pro/

  • 推論性能の大幅な向上:
    抽象推論ベンチマーク(ARC‑AGI‑2)や学術的な高度推論タスク、長期タスク型エージェントベンチマークなどで、Gemini 3 Proを大きく上回る結果を達成。

  • マルチモーダル能力の強化:
    テキストだけでなく、画像・音声・動画・コードを入力として扱い、複数のモダリティをまたぐ理解と推論が可能。

  • ロングコンテキスト対応:
    最大100万トークンのコンテキスト(プレビュー)をサポートし、大量の文書やコードベースを一度に扱える。

  • エージェント的な利用に最適化:
    ツール利用、関数呼び出し、検索、コード実行などと組み合わせた「マルチステップタスク」に強い設計。

Googleはこれを「Learn anything(何でも学ぶ)」「Build anything(何でも作る)」「Plan anything(何でも計画する)」という3つの柱で説明しています。 ​⁠https://deepmind.google/models/gemini/pro/

主な機能と特徴

  1. 高度な推論能力

DeepMindのモデルカードによれば、Gemini 3.1 Pro(特に Thinking High 設定)は、以下のようなタスクで強力な性能を示しています。 ​⁠https://deepmind.google/models/model-cards/gemini-3-1-pro/

  • ARC‑AGI‑2(抽象推論パズル):

▫ Gemini 3.1 Pro:77.1%(ARC Prizeで検証済み)

▫ Gemini 3 Pro:31.1%
このベンチマークでは他のフロンティアモデルと比較しても非常に高いスコアを示しています。

  • Humanity’s Last Exam(高度な学術推論・テキスト+マルチモーダル):

▫ 3.1 Pro:44.4%(ツールなし)

▫ 3 Pro:37.5%

  • LiveCodeBench Pro(競技プログラミング・Elo):

▫ 3.1 Pro:2887

▫ 3 Pro:2439

▫ 比較対象として掲載されている他モデルよりも高いEloを達成。

  • APEX‑Agents(長期のプロフェッショナルタスク):

▫ 3.1 Pro:33.5%

▫ 3 Pro:18.4%

  • BrowseComp(検索+ツールを使ったエージェント型タスク):

▫ 3.1 Pro:85.9%

▫ 3 Pro:59.2%

これらの結果から、Gemini 3.1 Proは Gemini 3 Proに対して一貫して大きな性能向上 を示しており、推論・コード・ツール利用・長文コンテキストにまたがる難しいタスクに特化したモデルであることがわかります。

  1. ネイティブなマルチモーダル対応

Gemini 3.1 Proは最初からマルチモーダルとして設計されており、次のような入力に対応します。 ​⁠https://deepmind.google/models/model-cards/gemini-3-1-pro/

  • テキスト

  • 画像

  • 音声

  • 動画

  • コード(リポジトリ単位のコードベースを含む)

出力は主にテキスト(最大64Kトークン)ですが、マルチモーダル入力を前提として設計されているため、例えば:

  • 複数画像+テキストの組み合わせからの説明生成

  • 動画コンテンツの理解・要約

  • オーディオ解析(感情・ジャンル・内容の要約)

  • ドキュメント+コード+ログをまたがるクロスモーダル推論

などに向いています。

  1. 最大100万トークンのロングコンテキスト

モデルカードでは、Gemini 3.1 Proは最大 1Mトークンの入力コンテキスト を扱えることが明記されています(プレビュー段階)。 ​⁠https://deepmind.google/models/model-cards/gemini-3-1-pro/

  • 長大な技術文書群

  • 大規模コードベース

  • 会議ログ・チャットログの長期履歴

  • 大量のPDFやナレッジベース

などを一度に読み込ませ、横断的な要約や分析、プランニングを行うことを想定しています。

想定されるユースケース

GoogleのブログとDeepMindのモデルカードでは、Gemini 3.1 Proの主な用途として次のようなシナリオが挙げられています。 ​⁠https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/ ​⁠https://deepmind.google/models/gemini/pro/

  • エージェント的なタスク実行:

▫ ツール呼び出し・ウェブ検索・コード実行を組み合わせて、複数ステップのタスクを自律的に進める。

▫ 例:モニタリングデータの収集とダッシュボード構築、長期計画の立案など。

  • 高度なコーディング支援:

▫ SWE‑BenchやSciCodeなどのベンチマークでの成績向上。

▫ 大規模コードリポジトリにまたがるリファクタリングやバグ修正の提案。

▫ 競技プログラミング並みの難易度にも対応するコード生成。

  • クリエイティブコーディング / インタラクティブ体験:

▫ テキストからアニメーションSVGやインタラクティブWebページを生成。

▫ 3Dシミュレーション、オーディオ生成、ジェスチャー入力などを組み合わせた体験をコードレベルで構築。

  • 長大ドキュメント+マルチモーダル分析:

▫ 大量のPDFやレポート、画像、ログを読み込み、横断的な要約・比較・洞察の抽出。

▫ 複数モダリティの情報を結びつけた複雑な質問への回答。

どこからアクセスできるか

2026年2月19日時点で、Gemini 3.1 Proは プレビュー版 として段階的に提供されており、Googleは以下のプロダクトからのアクセスを案内しています。 ​⁠https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/ ​⁠https://deepmind.google/models/model-cards/gemini-3-1-pro/

開発者向け

  • Google AI Studio(Gemini API)

  • Gemini CLI

  • 新しいエージェント開発プラットフォーム Google Antigravity

  • Android Studio との統合

エンタープライズ向け

  • Vertex AI(Google Cloud)

  • Gemini Enterprise プラン

コンシューマー向け

  • Gemini アプリ(Google AI Pro / Ultraプランでより高い利用上限)

  • NotebookLM(Pro / Ultraユーザー向けに3.1 Proを提供)

モデルカードでは、配布チャネルとして:

  • Gemini App

  • Google Cloud / Vertex AI

  • Google AI Studio

  • Gemini API

  • Google Antigravity

  • NotebookLM

が明記されています。 ​⁠https://deepmind.google/models/model-cards/gemini-3-1-pro/

セーフティと制限

Gemini 3.1 Proのモデルカードは、安全性に関して次のように述べています。 ​⁠https://deepmind.google/models/model-cards/gemini-3-1-pro/

  • テキストと多言語コンテンツに関する自動安全性指標では、Gemini 3 Proと同等かわずかな改善。

  • 画像→テキスト領域では一部指標でわずかな悪化も確認されているが、多くは「重大ではない」レベルとされ、追加の評価と緩和策が進められている。

  • Googleの「Frontier Safety Framework」に基づく クリティカル能力レベル(CCL) については、CBRN、危険な操作、機械学習R&Dの悪用などの分野で、依然としてクリティカルラインを下回ると評価。

  • サイバー関連能力はGemini 3 Proより向上しているが、同様にクリティカル閾値の下にとどまるよう制御されている。

その一方で、GoogleはGemini 3.1 Proについても以下を明確にしています。

  • 誤りや幻覚(hallucination)がゼロになるわけではない。

  • 高リスク用途では、追加の検証や人間によるレビューが必須。

  • 利用にあたっては、Gemini 3 Pro / 3.1 Proのモデルカードおよび利用ポリシーに沿う必要がある。

まとめ

Gemini 3.1 Proは、2026年時点でGoogleが提供する Gemini 3シリーズの最上位モデル であり、特に次のような場面で使うことを想定したモデルです。

  • 推論・コード・ツール利用・長文コンテキストが絡む 複雑なタスク

  • テキスト・画像・音声・動画・コードが混在する マルチモーダルな問題設定

  • 1Mトークン級のコンテキストを必要とする 大規模ドキュメント/コードベースの解析

  • 検索や関数呼び出し、コード実行と連携した エージェント的ワークフロー

開発者であれば Google AI Studio や Gemini API、企業ユーザーであれば Vertex AI / Gemini Enterprise、一般ユーザーであれば Gemini アプリや NotebookLM といった形で、今後徐々に3.1 Proへアクセスしやすくなっていくと見られます。