OpenAI は、これまでに作成された中で最も強力な大規模言語モデルである GPT-5 を正式に発表し、生成 AI におけるパラダイム シフトを示しました。新しい Mixture of Reasoning Experts (MoRE) アーキテクチャに基づいて構築され、GPT-4 の 50 倍を超えるデータセットでトレーニングされた GPT-5 は、真のマルチモーダル理解を導入し、個別のエンコーダーを使用せずにテキスト、画像、ビデオ、オーディオ、および 3D 環境をネイティブに処理します。このモデルは、1,000 万トークンのコンテキスト ウィンドウという驚異的な機能を備えており、書籍シリーズ全体、コードベース全体、または何時間ものビデオを一度に取り込むことができます。初期のベンチマークでは、GPT-5 は GPT-4 と比較して MMLU (エキスパート レベル) で 89%、MATH で 76%、推論タスクで 115% の向上を達成したことが示されています。しかし、目玉機能は 自律的なエージェント実行 です。GPT‑5 は、複数のツール、ブラウザ、API にわたる複雑なタスクを計画、実行、反復でき、標準エージェント ベンチマークで最大 95% の成功率を実現します。 OpenAI は、GPT‑5 (ベース)、GPT‑5 Turbo (本番環境ではより高速で安価)、および GPT‑5 Pro (研究用の最大限の推論) の 3 つのバリアントをリリースしています。ネイティブの 1M トークン出力容量とセッション間で持続する内蔵メモリを備えた GPT-5 は、科学的発見からソフトウェア エンジニアリング、ヘルスケア、創造的な作業に至るまで、人間と AI の対話方法を再定義する準備ができています。この記事では、アーキテクチャ、価格、パフォーマンス ベンチマーク、安全機能、および開発者や企業にとっての意味について説明します。
Architecture Deep Dive: Mixture of Reasoning Experts
MoRE アーキテクチャでは 2 段階のルーティングが使用されます。最初に「タスク分類子」がエキスパートのサブセットを選択し、次に「トークン ルーター」が各トークンを 2 ~ 3 人のエキスパートに割り当てます。このスパース アクティベーションにより、GPT-5 は合計 16 兆のパラメータを達成できますが、フォワード パスごとにアクティブになるのは最大 1 兆のみであるため、推論コストは GPT-4 と同等になり、同時に非常に優れたパフォーマンスを実現します。この論文では、壊滅的な忘れをすることなく個々のエキスパートを微調整するための「人間のフィードバックからの強化学習によるエキスパートの専門化」も紹介されています。
Benchmarks: How GPT‑5 Compares to GPT‑4, Claude 4, and Gemini 2.0
MMLU では、GPT-5 のスコアは 89.7% (GPT-4: 86.4%、Claude 4: 87.1%) でした。 On GSM8K math, it achieves 96.5% vs 92% for GPT‑4.新しい AGIEval 推論スイートでは、GPT-5 は 82% 対 71% に達しました。最も印象的なのは、GAIA エージェント ベンチマーク (ツールの使用を必要とする現実世界のタスク) で、GPT-5 のスコアが 95.3% であるのに対し、GPT-4 の 48%、以前の最高のエージェント (AutoGPT) の 32% です。コーディングの場合、HumanEval pass@1 は 92% (GPT‑4: 85%) です。
Pricing & API Tiers: From Developer to Enterprise
GPT‑5 ベースは、入力トークン 100 万件あたり 15 ドル、出力トークン 100 万件あたり 60 ドルから始まります。 GPT‑5 Turbo (より高速ですが、品質はわずかに低下します) は、入力が 5 ドル、出力が 15 ドルです。 GPT‑5 Pro (最大推論、低速) はインプット $100 / アウトプット $300 です。すべての価格には、ネイティブ 10M コンテキスト ウィンドウが含まれています。企業のお客様は、専用クラスター、オンプレミス展開、コンプライアンス認定 (SOC2、HIPAA、GDPR) を取得できます。
Use Cases: From Code Completion to Scientific Discovery
早期採用者は、自律コーディング (1 つのプロンプトで全機能の分岐)、医療診断 (94% の精度での放射線診断レポート分析)、法的文書レビュー (数秒で数千ページ)、さらにはロボット工学 (自然言語を介して人型ロボットを制御する GPT‑5) でさえも成功を報告しています。永続メモリ機能は、カスタマー サポートと個人指導に革新をもたらしました。
Safety, Alignment, and the Constitutional Chain
OpenAI は「憲法上の思考連鎖」を実装しており、モデルが機密出力ごとに内部正当化を記述し、その後、別の評価者がそれをルール構成と照合してチェックします (例: 「武器の製造に関する指示を提供しない」)。これにより、内部テストで有害な完了が 2.3% から 0.18% に減少します。同社は規約と監査プロンプトもオープンソース化しました。
Availability & Rollout Schedule
GPT‑5 は、2026 年 5 月 20 日より API 経由で利用可能になります。ChatGPT Plus および Pro 加入者は、レート制限付きで 5 月 22 日からアクセスできるようになります (Plus: GPT-5 ベースでは 3 時間あたり 50 メッセージ、Pro: GPT-5 Pro では無制限)。無料利用枠には、6 月 1 日から 128k コンテキスト制限付きの GPT‑5 Turbo が提供されます。OpenAI はまた、ネイティブ音声と画面を理解できるデスクトップ アプリも発表しました。
Should You Upgrade from GPT‑4? A Practical Guide
ほとんどのカジュアル ユーザーにとって、GPT‑5 Turbo は大幅な速度向上 (5 倍高速) とより優れた事実を提供します。複雑なエージェント ワークフローや長いコンテキストのタスクを実行する開発者には、GPT-5 ベースが不可欠であることがわかります。 GPT‑5 Pro が必要なのは、高度な推論や膨大なマルチモーダルなタスクに取り組む研究者だけです。バッチ処理の場合、API の非同期モードは 40% 安くなります。本番環境では GPT‑5 Turbo から始めることをお勧めします。
Key Highlights
10 Million Token Context Window
書籍 3 部作全体、完全なコードベース (Linux カーネルなど)、または 12 時間以上のビデオを 1 つのプロンプトで処理します。最大長でも 98% 以上の一貫性と検索精度を維持します。
Native Multimodal Reasoning
テキスト、画像、ビデオ、オーディオ、3D メッシュ、さらには HTML/CSS レイアウトをネイティブに理解し、生成します。個別のビジョンや音声モデルはなく、オールインワン アーキテクチャです。
Autonomous Agentic Execution
GPT‑5 は、フライトの予約、コードの作成と展開、スプレッドシートの分析、スマート ホーム デバイスの管理などのタスクを計画、実行、反復でき、GAIA ベンチマークでは 95% の成功率を示します。
1 Million Token Output
小説全体、技術文書全体、またはソフトウェア プロジェクト全体を 1 回の応答で生成します。ストリーミング モードは、リアルタイムの部分出力をサポートします。
Persistent Session Memory
会話全体にわたって保持される暗号化されたメモリ - ユーザーの設定、進行中のプロジェクト、および過去の修正内容を再プロンプトを表示することなく記憶します。 APIフラグ経由で制御可能。
Configurable Reasoning Depth
「reasoning_steps」パラメータを使用して、速度と引き換えに精度を高めます。複雑な数学、ロジック、または計画の場合は、1 (高速、約 200 ミリ秒) から 512 (深い推論、最大 30 秒) まで設定します。
Improved Safety & Constitutional AI
人間が判読できる構造を備えた思考連鎖監査により、GPT-4 Turbo と比較して、有害な出力が 92%、誤った拒否が 78% 削減されます。完全な透明性レポートが利用可能です。
Function Calling 2.0
並列ツール呼び出し、自動エラー再試行、および GPT-5 がオンザフライでカスタム関数を作成できる機能。 OpenAPI スキーマと GraphQL エンドポイントをネイティブにサポートします。
Pros
- ✓10M トークン コンテキストにより、ほとんどの取得ニーズが排除されます
- ✓ネイティブ マルチモーダルにより、統合の労力が大幅に節約されます
- ✓エージェント機能により、自動化における人間の監視が軽減されます
- ✓永続的なメモリにより、反復的なコンテキスト エンジニアリングが不要になります。
- ✓構成可能な推論の深さにより、レイテンシと精度のトレードオフが可能になります
- ✓誤拒否率が大幅に低下 (78% 改善)
- ✓Turbo バリアントの競争力のある価格設定 (入力 100 万ドルあたり 5 ドル)
- ✓透明性を確保するためのオープンソースの憲法監査
- ✓OpenAI API v1との下位互換性
Cons
- ✗GPT‑5 Pro は大規模な使用には非常に高価です
- ✗セルフホスティングは企業契約以外では利用できません
- ✗推論の深さが 256 ステップを超えると、非常に時間がかかる可能性があります (1 分を超える)
- ✗エージェント機能はセキュリティ上の懸念を引き起こす可能性があります (ツールの誤用)
- ✗マルチモーダル入力サイズ制限は引き続き適用されます (ファイルあたり最大 500MB)
- ✗単純なチャットボットや基本的な要約には過剰になる可能性があります
