OpenAI secara rasminya telah melancarkan GPT-5, model bahasa besar yang paling berkuasa pernah dibuat, menandakan anjakan paradigma dalam AI generatif. Dibina pada seni bina Campuran Pakar Penaakulan (MoRE) baharu dan dilatih pada set data lebih 50 kali ganda lebih besar daripada GPT-4, GPT-5 memperkenalkan pemahaman multimodal sebenar – memproses teks, imej, video, audio dan persekitaran 3D secara asli tanpa pengekod berasingan. Model ini menampilkan 10 juta tetingkap konteks token yang mengejutkan, membolehkannya menelan keseluruhan siri buku, pangkalan kod penuh atau berjam-jam video sekali gus. Penanda aras awal menunjukkan GPT‑5 mencapai 89% pada MMLU (peringkat pakar), 76% pada MATH dan 115% peningkatan dalam tugas penaakulan berbanding GPT‑4. Tetapi ciri tajuk ialah pelaksanaan ejen autonomi: GPT‑5 boleh merancang, melaksanakan dan mengulangi tugas yang kompleks merentas berbilang alatan, penyemak imbas dan API dengan kadar kejayaan sehingga 95% pada penanda aras ejen standard. OpenAI mengeluarkan tiga varian: GPT‑5 (asas), GPT‑5 Turbo (lebih pantas, lebih murah untuk pengeluaran) dan GPT‑5 Pro (penaakulan maksimum untuk penyelidikan). Dengan kapasiti keluaran token 1M asli dan memori terbina dalam yang berterusan merentas sesi, GPT‑5 bersedia untuk mentakrifkan semula cara manusia berinteraksi dengan AI – daripada penemuan saintifik kepada kejuruteraan perisian, penjagaan kesihatan dan kerja kreatif. Artikel ini merangkumi seni bina, harga, penanda aras prestasi, ciri keselamatan dan maksudnya untuk pembangun dan perusahaan.
Architecture Deep Dive: Mixture of Reasoning Experts
Seni bina More menggunakan penghalaan dua peringkat: pertama 'pengelas tugas' memilih subset pakar, kemudian 'penghala token' memperuntukkan setiap token kepada 2‑3 pakar. Pengaktifan jarang ini membolehkan GPT‑5 mencapai 16 trilion jumlah parameter tetapi hanya ~1 trilion aktif setiap hantaran hadapan, menjadikan kos inferens setanding dengan GPT‑4 sambil memberikan prestasi yang jauh lebih baik. Kertas kerja itu juga memperkenalkan 'pengkhususan pakar melalui pembelajaran pengukuhan daripada maklum balas manusia' untuk memperhalusi pakar individu tanpa melupakan bencana.
Benchmarks: How GPT‑5 Compares to GPT‑4, Claude 4, and Gemini 2.0
Pada MMLU, GPT‑5 mendapat 89.7% (GPT‑4: 86.4%, Klaude 4: 87.1%). Pada matematik GSM8K, ia mencapai 96.5% berbanding 92% untuk GPT‑4. Pada suite penaakulan AGIEval baharu, GPT‑5 mencapai 82% berbanding 71%. Paling mengagumkan, pada penanda aras ejen GAIA (tugas dunia sebenar yang memerlukan penggunaan alat), GPT‑5 mendapat markah 95.3% berbanding 48% GPT‑4 dan ejen terbaik sebelumnya (AutoGPT) pada 32%. Untuk pengekodan, HumanEval pass@1 ialah 92% (GPT‑4: 85%).
Pricing & API Tiers: From Developer to Enterprise
Pangkalan GPT‑5 bermula pada $15 setiap juta token input, $60 setiap juta output. GPT‑5 Turbo (kualiti lebih pantas, rendah sedikit) ialah $5 input / $15 output. GPT‑5 Pro (penaakulan maksimum, lebih perlahan) ialah $100 input / $300 output. Semua harga termasuk tetingkap konteks 10M asli. Pelanggan perusahaan mendapat kluster khusus, penempatan di premis dan pensijilan pematuhan (SOC2, HIPAA, GDPR).
Use Cases: From Code Completion to Scientific Discovery
Pengguna awal melaporkan kejayaan dalam pengekodan autonomi (cawangan ciri penuh dalam satu gesaan), diagnosis perubatan (analisis laporan radiologi dengan ketepatan 94%), semakan dokumen undang-undang (ribuan halaman dalam saat), dan juga robotik (GPT‑5 mengawal robot humanoid melalui bahasa semula jadi). Ciri memori yang berterusan telah mengubah permainan untuk sokongan pelanggan dan tunjuk ajar peribadi.
Safety, Alignment, and the Constitutional Chain
OpenAI melaksanakan 'Rantaian Pemikiran Perlembagaan' di mana model menulis justifikasi dalaman untuk setiap output sensitif, kemudian penilai berasingan menyemaknya terhadap perlembagaan peraturan (cth., 'Jangan berikan arahan untuk membina senjata'). Ini mengurangkan penyiapan berbahaya daripada 2.3% kepada 0.18% pada ujian dalaman. Syarikat itu juga membuka sumber perlembagaan dan arahan pengauditan.
Availability & Rollout Schedule
GPT‑5 tersedia melalui API mulai 20 Mei 2026. Pelanggan ChatGPT Plus dan Pro mendapat akses pada 22 Mei dengan had kadar (Tambahan: 50 mesej setiap 3 jam pada asas GPT‑5; Pro: tidak terhad pada GPT‑5 Pro). Peringkat percuma akan menerima GPT‑5 Turbo dengan had konteks 128k mulai 1 Jun. OpenAI turut mengumumkan apl desktop dengan pemahaman suara dan skrin asli.
Should You Upgrade from GPT‑4? A Practical Guide
Bagi kebanyakan pengguna kasual, GPT‑5 Turbo menawarkan peningkatan kelajuan yang besar (5x lebih pantas) dan fakta yang lebih baik. Pembangun yang menjalankan aliran kerja ejen yang kompleks atau tugasan konteks panjang akan mendapati asas GPT‑5 sangat diperlukan. Hanya penyelidik yang menangani penaakulan lanjutan atau tugas multimodal yang besar memerlukan GPT‑5 Pro. Untuk pemprosesan kelompok, mod async API adalah 40% lebih murah. Kami mengesyorkan bermula dengan GPT‑5 Turbo untuk pengeluaran.
Key Highlights
10 Million Token Context Window
Proses keseluruhan trilogi buku, pangkalan kod penuh (cth., kernel Linux) atau 12+ jam video dalam satu gesaan. Mengekalkan koheren dan ketepatan perolehan melebihi 98% walaupun pada panjang maksimum.
Native Multimodal Reasoning
Fahami dan jana merentas teks, imej, video, audio, jerat 3D dan juga reka letak HTML/CSS secara asli. Tiada visi atau model suara yang berasingan - semuanya dalam satu seni bina.
Autonomous Agentic Execution
GPT‑5 boleh merancang, melaksanakan dan mengulangi tugas seperti menempah penerbangan, menulis dan menggunakan kod, menganalisis hamparan atau mengurus peranti rumah pintar – dengan kadar kejayaan 95% pada penanda aras GAIA.
1 Million Token Output
Hasilkan keseluruhan novel, dokumentasi teknikal penuh, atau lengkapkan projek perisian dalam satu respons. Mod penstriman menyokong output separa masa nyata.
Persistent Session Memory
Memori yang disulitkan yang berterusan merentas perbualan – ingat pilihan pengguna, projek yang sedang berjalan dan pembetulan lalu tanpa menggesa semula. Boleh dikawal melalui bendera API.
Configurable Reasoning Depth
Kelajuan dagangan untuk ketepatan dengan parameter `reasoning_steps`. Tetapkan daripada 1 (pantas, ~200ms) hingga 512 (penaakulan mendalam, sehingga 30 saat) untuk matematik, logik atau perancangan yang kompleks.
Improved Safety & Constitutional AI
Pengauditan rantaian pemikiran dengan perlembagaan yang boleh dibaca manusia mengurangkan output berbahaya sebanyak 92% dan penolakan palsu sebanyak 78% berbanding GPT‑4 Turbo. Laporan ketelusan penuh tersedia.
Function Calling 2.0
Panggilan alat selari, percubaan semula ralat automatik dan keupayaan untuk GPT‑5 menulis fungsi tersuai dengan cepat. Menyokong skema OpenAPI dan titik akhir GraphQL secara asli.
Pros
- ✓Konteks token 10M menghapuskan kebanyakan keperluan untuk mendapatkan semula
- ✓Multimodal asli menjimatkan usaha penyepaduan yang ketara
- ✓Keupayaan agen mengurangkan pengawasan manusia dalam automasi
- ✓Memori yang berterusan membuang kejuruteraan konteks berulang
- ✓Kedalaman penaakulan boleh dikonfigurasikan membenarkan pertukaran latensi/ketepatan
- ✓Kadar penolakan palsu secara mendadak lebih rendah (78% peningkatan)
- ✓Harga kompetitif untuk varian Turbo ($5/juta input)
- ✓Audit perlembagaan sumber terbuka untuk ketelusan
- ✓Serasi ke belakang dengan OpenAI API v1
Cons
- ✗GPT‑5 Pro sangat mahal untuk kegunaan berskala besar
- ✗Pengehosan sendiri tidak tersedia di luar kontrak perusahaan
- ✗Kedalaman penaakulan >256 langkah boleh menjadi sangat perlahan (>1 minit)
- ✗Ciri agen mungkin menimbulkan kebimbangan keselamatan (penyalahgunaan alat)
- ✗Had saiz input berbilang mod masih dikenakan (maks 500MB setiap fail)
- ✗Mungkin berlebihan untuk chatbots mudah atau ringkasan asas
