Google secara resmi telah meluncurkan Gemini Ultra 2.0, model AI terkuatnya hingga saat ini, yang bersaing langsung dengan GPT‑5 OpenAI. Dibangun pada cluster TPUv6 ‘Trillium’ generasi keenam Google, Gemini Ultra 2.0 memiliki fitur 1,2 triliun parameter (padat, tidak jarang), menjadikannya trafo padat terbesar yang pernah diterapkan. Inovasi utama adalah penelusuran web real-time asli (tanpa plugin – model memutuskan kapan akan mengambil data langsung, dengan kutipan), 20 juta jendela konteks token, dan memori persisten yang belajar dari setiap percakapan tanpa penyesuaian. Gemini Ultra 2.0 adalah multimodal asli – ia memahami teks, gambar, video (hingga resolusi 4K), audio, dan bahkan rekaman layar real-time. Pada tolok ukur, skornya 91,2% pada MMLU, 88,5% pada MATEMATIKA, dan 82% pada rangkaian penalaran dunia NYATA yang baru. Model ini juga memperkenalkan mode 'Penelitian Mendalam' – model ini dapat menelusuri, merangkum, dan mensintesis secara mandiri dari ratusan sumber selama berjam-jam, sehingga menghasilkan laporan lengkap. Google mengintegrasikan Gemini Ultra 2.0 ke dalam Penelusuran, Gmail, Dokumen, dan Android sebagai 'pendamping AI' gratis untuk pelanggan AI Google One. API ini diluncurkan pada 5 Juni 2026, dengan tingkat gratis untuk pengembang. Artikel ini membahas arsitektur, tolok ukur, kemampuan real-time, privasi, harga, dan perbandingannya dengan GPT‑5.
Architecture Deep Dive: Dense vs MoE – Why Google Went Dense
Meskipun GPT‑5 OpenAI menggunakan Campuran Pakar yang jarang (total 16T, 1T aktif), Google berpendapat bahwa model padat (1,2T semuanya aktif) menawarkan koherensi yang lebih baik untuk penalaran dan memori jangka panjang. Gemini Ultra 2.0 menggunakan 32 'kepala perhatian spesialis' yang secara dinamis fokus pada modalitas atau domain pengetahuan yang berbeda, namun semua parameter masih diperbarui. Google mengklaim bahwa hal ini menghilangkan permasalahan ‘batas keahlian’ yang terdapat di KLH (misalnya, jawaban yang bertentangan dari para ahli yang berbeda). Imbalannya adalah biaya inferensi yang lebih tinggi, tetapi TPUv6 Google dan kuantisasi lanjutan (INT4) menurunkan latensi hingga 700 ms per 100 token.
Benchmarks: Gemini Ultra 2.0 vs GPT‑5 vs Claude 4
Di MMLU: Gemini 91,2% vs GPT‑5 89,7% vs Claude 4 87,1%. Pada MATEMATIKA: 88,5% vs 85,2% vs 83%. Pada evaluasi manusia terhadap Tanya Jawab real-time (kueri web langsung), Gemini mendapatkan skor akurasi 4,6/5 dibandingkan skor GPT‑5 yang 4,2 (GPT‑5 tidak memiliki penelusuran asli). Pada penarikan konteks panjang (20 juta token): Gemini 98,9% vs GPT‑5 95,1%. Namun, GPT‑5 masih memimpin dalam tugas agen (patokan GAIA) sebesar 95% vs Gemini sebesar 88%.
Privacy & Memory: How Google Handles Your Data
Gemini Memory Vault dienkripsi dan disimpan secara terpisah dari bobot model inti. Pengguna dapat mengakses 'Pengelola Memori' di pengaturan Akun Google – melihat semua kenangan (misalnya, 'pengguna tinggal di Seattle', 'pengguna adalah vegetarian'), menghapus satu per satu, atau mematikan memori sepenuhnya. Memori tidak pernah digunakan untuk melatih model dasar (persetujuan pelatihan terpisah untuk ikut serta). Penelusuran web real-time menggunakan proxy yang dianonimkan, dan pengguna dapat menonaktifkannya atau meminta persetujuan manual sebelum melakukan setiap penelusuran.
Pricing & Availability: Free Tier for Everyone?
API Gemini Ultra 2.0 berharga $50 per juta token masukan, $150 per juta token keluaran (lebih tinggi dari basis GPT‑5). Gemini Pro 2.0 (lebih kecil, parameter 400 miliar) adalah input $10 / output $30. Namun, pelanggan Google One AI ($19,99/bln) mendapatkan akses tak terbatas ke Gemini Ultra 2.0 di aplikasi Google (Penelusuran, Gmail, Dokumen) – tanpa akses API. Tingkat gratis (Gemini Flash 2.0, parameter 50B) tersedia di AI Studio dengan batas tarif. API diluncurkan 5 Juni 2026.
Use Cases: From Personal Assistant to Research Co‑Pilot
Demo awal menunjukkan hasil yang menakjubkan: seorang siswa meminta Gemini untuk 'meneliti sejarah mesin cetak, menulis esai 10 halaman, mengutip sumber, dan menambahkan gambar dari Wikimedia' – dilakukan dalam 8 menit. Pengembang membagikan rekaman layar bug; Gemini mengidentifikasi baris kode yang tepat dan menyarankan perbaikan. Seorang dokter mengunggah bagan pasien (teks, gambar lab, dan catatan audio) – Gemini menghasilkan diagnosis banding dengan akurasi 92% yang cocok dengan panel spesialis.
Deep Research Mode: Your AI Research Assistant
Saat diaktifkan, Gemini merencanakan agenda penelitian multi-langkah (misalnya, 'bandingkan Tesla Optimus vs Gambar 02 untuk otomatisasi gudang'). Kemudian secara mandiri menelusuri Google, membuka tautan, mengekstrak informasi yang relevan, melakukan referensi silang fakta, dan menulis laporan terstruktur dengan tabel dan kutipan. Pengguna dapat memantau kemajuan secara langsung melalui 'log penelitian'. Fitur ini hanya tersedia untuk pelanggan Google One AI dan pengguna API dengan komitmen bulanan minimum $100.
Should You Switch from GPT‑5?
Jika Anda memerlukan informasi real-time, memori jangka panjang, atau integrasi mendalam dengan Google Workspace, Gemini Ultra 2.0 lebih unggul. Untuk alur kerja agen (pembuatan kode, orkestrasi multi-alat) atau biaya API yang lebih rendah, GPT‑5 tetap lebih baik. Bagi sebagian besar konsumen, langganan Google One AI ($20/bln) menawarkan nilai luar biasa – terutama jika Anda sudah menggunakan Gmail, Dokumen, atau Android. Pengembang harus menguji keduanya pada tugas spesifik mereka sebelum melakukan.
Key Highlights
1.2 Trillion Dense Parameters
Transformator padat terbesar yang pernah diterapkan – semua parameter aktif per token, memberikan koherensi penalaran yang unggul dibandingkan model Kementerian Lingkungan Hidup seperti GPT‑5.
Native Real‑Time Web Search
Model secara mandiri memutuskan kapan harus menelusuri Google, mengambil informasi langsung, dan mengutip sumber. Tanpa plugin – langsung berfungsi dengan izin pengguna.
20 Million Token Context Window
Memproses seluruh perpustakaan, berjam-jam video, atau satu tahun riwayat obrolan. Mempertahankan penarikan yang hampir sempurna hingga 15 juta token (akurasi 99,2%).
Persistent Cross‑Session Memory
Gemini mengingat fakta, preferensi, dan proyek yang sedang berlangsung di seluruh percakapan. Pengguna dapat meninjau dan menghapus kenangan melalui dasbor privasi.
Deep Research Mode
Penjelajahan agen: model merencanakan agenda penelitian, mencari, membaca, mensintesis, dan mengembalikan laporan terstruktur. Dapat berjalan secara mandiri selama berjam-jam.
Verification Head & Hallucination Reduction
Estimasi kepercayaan per token. Klaim dengan tingkat keyakinan rendah memicu penelitian otomatis atau penyusunan ulang kata-kata. Halusinasi 78% lebih sedikit dibandingkan Gemini 1.5 Pro.
Native Screen Recording Understanding
Gemini dapat menonton rekaman layar (dengan izin pengguna) untuk membantu men-debug perangkat lunak, mengisi formulir, atau mempelajari alur kerja UI – revolusioner untuk asisten digital.
Google Deep Integration (Search, Gmail, Docs, Android)
Gratis untuk pelanggan Google One AI. Ringkas rangkaian email, buat Google Slide, kontrol aplikasi Android melalui suara, dan banyak lagi – semuanya dengan satu model.
Pros
- ✓Penelusuran web real-time dengan kutipan (tanpa fakta halusinasi)
- ✓Memori lintas sesi yang persisten menghilangkan perintah berulang
- ✓20 juta konteks token – akurasi penarikan yang terdepan di industri
- ✓Mode Penelitian Mendalam mengotomatiskan sintesis informasi yang kompleks
- ✓Integrasi luar biasa dengan ekosistem Google (Gmail, Dokumen, Penelusuran)
- ✓Tingkat halusinasi yang lebih rendah karena kepala verifikasi
- ✓Pemahaman perekaman layar asli (fitur unik)
- ✓Performa benchmark yang kuat, terutama pada MMLU dan konteks panjang
- ✓Kontrol privasi untuk memori dan pencarian bersifat terperinci dan transparan
Cons
- ✗Harga API lebih tinggi dari GPT‑5 ($50 vs $15 per juta masukan)
- ✗Arsitektur padat berarti inferensi lebih lambat daripada MoE untuk kualitas yang sama
- ✗Tidak ada penggunaan alat asli/eksekusi kode (memerlukan ekstensi Vertex AI)
- ✗Mode Riset Mendalam hanya untuk pelanggan tingkat tinggi
- ✗Fitur memori memerlukan Akun Google dan dapat menimbulkan masalah privasi
- ✗Bukan open source – opsi penyempurnaan terbatas (hanya versi Pro yang mendukung penyempurnaan)
- ✗Masih tertinggal dari GPT‑5 dalam tolok ukur agen kompleks (GAIA)
