Google は、OpenAI の GPT‑5 と直接競合する、これまでで最も強力な AI モデルである Gemini Ultra 2.0 を正式にリリースしました。 Google の第 6 世代 TPUv6「Trillium」クラスター上に構築された Gemini Ultra 2.0 は、1 兆 2000 億のパラメーター (疎ではなく高密度) を備えており、これまで導入された中で最大の高密度トランスフォーマーとなっています。目玉のイノベーションは、ネイティブのリアルタイム Web 検索 (プラグインなし – 引用を含むライブ データを取得するタイミングをモデルが決定する)、2,000 万トークンのコンテキスト ウィンドウ、および微調整せずに各会話から学習する 永続メモリ です。 Gemini Ultra 2.0 は 本質的にマルチモーダルであり、テキスト、画像、ビデオ (最大 4K 解像度)、オーディオ、さらにはリアルタイムの画面録画を理解します。ベンチマークでは、MMLU で 91.2%、MATH で 88.5%、新しい REAL-world 推論スイートで 82% のスコアを獲得しました。また、「ディープ リサーチ」モード も導入されています。モデルは、何時間にもわたって数百のソースから自律的に参照、要約、合成し、完全なレポートを返すことができます。 Google は、Google One AI 加入者向けの無料の「AI コンパニオン」として、Gemini Ultra 2.0 を検索、Gmail、ドキュメント、Android に統合しています。 API は 2026 年 6 月 5 日にリリースされ、開発者には無料枠が提供されます。この記事では、アーキテクチャ、ベンチマーク、リアルタイム機能、プライバシー、価格設定、および GPT-5 との比較について説明します。
Architecture Deep Dive: Dense vs MoE – Why Google Went Dense
OpenAI の GPT‑5 は疎な専門家の混合 (合計 16T、アクティブ 1T) を使用していますが、Google は、高密度モデル (すべてアクティブ 1.2T) の方が長い形式の推論と記憶の一貫性が向上すると主張しています。 Gemini Ultra 2.0 は、さまざまなモダリティや知識領域に動的に焦点を当てる 32 の「スペシャリスト アテンション ヘッド」を使用しますが、すべてのパラメーターは引き続き更新されます。 Googleは、これにより環境省で見られる「専門家の境界」問題(異なる専門家からの矛盾した回答など)が解消されると主張している。 The tradeoff is higher inference cost, but Google’s TPUv6 and advanced quantization (INT4) bring latency down to 700ms per 100 tokens.
Benchmarks: Gemini Ultra 2.0 vs GPT‑5 vs Claude 4
MMLU では、ジェミニ 91.2% 対 GPT-5 89.7% 対クロード 4 87.1%。数学: 88.5% 対 85.2% 対 83%。リアルタイム Q&A (ライブ Web クエリ) の人による評価では、Gemini の精度スコアは 4.6/5 でしたが、GPT-5 のスコアは 4.2 でした (GPT-5 にはネイティブ検索がありません)。長いコンテキストのリコール (2,000 万トークン): Gemini 98.9% 対 GPT-5 95.1%。ただし、エージェント タスク (GAIA ベンチマーク) では、GPT-5 が依然として 95% と Gemini の 88% でリードしています。
Privacy & Memory: How Google Handles Your Data
Gemini Memory Vault は暗号化され、コア モデルの重みとは別に保存されます。ユーザーは Google アカウント設定の「メモリ マネージャー」にアクセスでき、すべてのメモリを表示したり (例: 「ユーザーはシアトルに住んでいる」、「ユーザーはベジタリアン」)、個別に削除したり、メモリを完全にオフにしたりできます。基本モデルのトレーニングにメモリが使用されることはありません (オプトインによる個別のトレーニング同意)。リアルタイム Web 検索では匿名化されたプロキシが使用され、ユーザーはそれを無効にしたり、各検索の前に手動承認を要求したりできます。
Pricing & Availability: Free Tier for Everyone?
Gemini Ultra 2.0 API costs $50 per million input tokens, $150 per million output tokens (higher than GPT‑5 base). Gemini Pro 2.0 (smaller, 400B params) is $10 input / $30 output. However, Google One AI subscribers ($19.99/mo) get unlimited access to Gemini Ultra 2.0 in Google apps (Search, Gmail, Docs) – no API access. A free tier (Gemini Flash 2.0, 50B params) is available on AI Studio with rate limits. API は 2026 年 6 月 5 日にリリースされます。
Use Cases: From Personal Assistant to Research Co‑Pilot
初期のデモでは驚くべき結果が示されました。学生はジェミニに「印刷機の歴史を調べ、10 ページのエッセイを書き、出典を引用し、ウィキメディアから画像を追加する」ように依頼しましたが、これは 8 分で完了しました。開発者はバグの画面記録を共有します。 Gemini はコードの正確な行を特定し、修正を提案します。医師が患者のカルテ (テキスト、検査画像、音声メモ) をアップロードすると、Gemini は専門家パネルと一致する 92% の精度で鑑別診断を生成します。
Deep Research Mode: Your AI Research Assistant
ジェミニがアクティブになると、複数段階の研究課題を計画します (例: 「倉庫自動化について Tesla Optimus と Figure 02 を比較する」)。次に、自律的に Google を検索し、リンクを開き、関連情報を抽出し、事実を相互参照して、表と引用を含む構造化されたレポートを作成します。ユーザーは「研究ログ」を通じて進行状況をライブで監視できます。この機能は、月額 100 ドル以上のコミットメントを持つ Google One AI サブスクライバーと API ユーザーのみが利用できます。
Should You Switch from GPT‑5?
リアルタイム情報、長期記憶、または Google Workspace との緊密な統合が必要な場合は、Gemini Ultra 2.0 が優れています。エージェント ワークフロー (コード生成、マルチツール オーケストレーション) や API コストが低い場合は、GPT-5 の方が優れています。ほとんどの消費者にとって、Google One AI サブスクリプション (月額 20 ドル) は、特に Gmail、ドキュメント、Android をすでに使用している場合に、信じられないほどの価値を提供します。開発者はコミットする前に、特定のタスクで両方をテストする必要があります。
Key Highlights
1.2 Trillion Dense Parameters
これまで導入された中で最大の高密度トランスフォーマー – すべてのパラメーターがトークンごとにアクティブになり、GPT-5 などの MoE モデルと比較して優れた推論の一貫性を実現します。
Native Real‑Time Web Search
モデルは、いつ Google を検索し、ライブ情報を取得し、ソースを引用するかを自律的に決定します。プラグインなし – ユーザー権限の切り替えにより、すぐに使用できます。
20 Million Token Context Window
ライブラリ全体、数時間のビデオ、または 1 年間のチャット履歴を処理します。最大 1,500 万トークンまでほぼ完璧なリコールを維持します (精度 99.2%)。
Persistent Cross‑Session Memory
双子座は、会話を通じて事実、好み、進行中のプロジェクトを覚えています。ユーザーはプライバシー ダッシュボードから思い出を確認したり、削除したりできます。
Deep Research Mode
エージェント的ブラウジング: モデルは研究の議題を計画し、検索、読み取り、合成を行い、構造化されたレポートを返します。数時間自律走行可能。
Verification Head & Hallucination Reduction
トークンごとの信頼度の推定。信頼性の低い主張は、自動的な調査や言い換えを引き起こします。 Gemini 1.5 Pro よりも幻覚が 78% 減少しました。
Native Screen Recording Understanding
Gemini は、(ユーザーの許可を得て) 画面録画を視聴して、ソフトウェアのデバッグ、フォームへの入力、UI ワークフローの学習に役立てることができます。これはデジタル アシスタントにとって革新的です。
Google Deep Integration (Search, Gmail, Docs, Android)
Google One AI 購読者は無料。メール スレッドの要約、Google スライドの生成、音声による Android アプリの制御などをすべて 1 つのモデルで実行できます。
Pros
- ✓引用を含むリアルタイム Web 検索 (幻覚事実なし)
- ✓永続的なセッション間メモリにより、反復的なプロンプトが不要になります
- ✓2,000 万のトークン コンテキスト - 業界をリードするリコール精度
- ✓Deep Research モードは複雑な情報合成を自動化します
- ✓Google エコシステム (Gmail、ドキュメント、検索) との優れた統合
- ✓検証ヘッドにより幻覚率が低下
- ✓ネイティブ画面録画の理解(独自機能)
- ✓特に MMLU およびロング コンテキストでの強力なベンチマーク パフォーマンス
- ✓メモリと検索のプライバシー制御はきめ細かく透過的です
Cons
- ✗GPT‑5 よりも高い API の価格設定 (入力 100 万件あたり 50 ドル対 15 ドル)
- ✗高密度のアーキテクチャは、同じ品質の MoE よりも推論が遅いことを意味します
- ✗ネイティブ ツールの使用やコードの実行は不要 (Vertex AI 拡張機能が必要)
- ✗Deep Research モードは上位層のサブスクライバーのみを対象としています
- ✗メモリ機能には Google アカウントが必要であり、プライバシー上の懸念が生じる可能性があります
- ✗オープンソースではない - 微調整オプションが限られています (微調整をサポートしているのは Pro バージョンのみです)
- ✗複雑なエージェントベンチマーク (GAIA) では GPT‑5 にまだ及ばない
