أطلقت Google رسميًا Gemini Ultra 2.0، وهو أقوى نموذج للذكاء الاصطناعي حتى الآن، ويتنافس بشكل مباشر مع GPT‑5 من OpenAI. يتميز Gemini Ultra 2.0، المبني على مجموعات TPUv6 "Trillium" من الجيل السادس من Google، بـ 1.2 تريليون معلمة (كثيفة وليست متفرقة)، مما يجعله أكبر محول كثيف تم نشره على الإطلاق. الابتكارات الرئيسية هي بحث الويب الأصلي في الوقت الفعلي (بدون مكون إضافي - يقرر النموذج متى يتم سحب البيانات المباشرة، مع الاستشهادات)، ونافذة سياق رمزية مكونة من 20 مليون، وذاكرة ثابتة تتعلم من كل محادثة دون ضبط دقيق. Gemini Ultra 2.0 هو متعدد الوسائط - فهو يفهم النصوص والصور والفيديو (دقة تصل إلى 4K)، والصوت، وحتى تسجيلات الشاشة في الوقت الفعلي. في المعايير، سجلت 91.2% في MMLU، 88.5% في MATH، و82% في مجموعة الاستدلال المنطقي الجديدة في العالم الحقيقي. كما يقدم أيضًا وضع "البحث العميق" - يمكن للنموذج أن يتصفح ويلخص ويجمع بشكل مستقل من مئات المصادر على مدار ساعات، ويعرض تقريرًا كاملاً. تعمل Google على دمج Gemini Ultra 2.0 في البحث وGmail وDocs وAndroid باعتباره "رفيقًا مدعومًا بالذكاء الاصطناعي" مجانيًا لمشتركي Google One AI. سيتم إطلاق واجهة برمجة التطبيقات (API) في 5 يونيو 2026 بطبقة مجانية للمطورين. تتناول هذه المقالة البنية والمعايير والإمكانيات في الوقت الفعلي والخصوصية والتسعير وكيفية مقارنتها بـ GPT‑5.
Architecture Deep Dive: Dense vs MoE – Why Google Went Dense
في حين أن GPT-5 من OpenAI يستخدم مزيجًا متناثرًا من الخبراء (إجمالي 16 تيرابايت، 1 تيرابايت نشط)، فإن جوجل تقول إن النماذج الكثيفة (1.2 تيرابايت كلها نشطة) توفر تماسكًا أفضل للاستدلال طويل الأمد والذاكرة. يستخدم Gemini Ultra 2.0 32 "رأس اهتمام متخصص" يركز بشكل ديناميكي على طرائق أو مجالات معرفية مختلفة، ولكن لا يزال يتم تحديث جميع المعلمات. تدعي جوجل أن هذا يلغي مشكلات "حدود الخبراء" التي تظهر في وزارة التربية والتعليم (على سبيل المثال، الإجابات المتناقضة من خبراء مختلفين). تتمثل المقايضة في تكلفة استدلال أعلى، لكن TPUv6 من Google والتكميم المتقدم (INT4) يخفض زمن الوصول إلى 700 مللي ثانية لكل 100 رمز مميز.
Benchmarks: Gemini Ultra 2.0 vs GPT‑5 vs Claude 4
على MMLU: الجوزاء 91.2% مقابل GPT‑5 89.7% مقابل كلود 4 87.1%. في الرياضيات: 88.5% مقابل 85.2% مقابل 83%. في التقييم البشري للأسئلة والأجوبة في الوقت الفعلي (استعلامات الويب المباشرة)، سجل Gemini 4.6/5 من حيث الدقة مقابل 4.2 لـ GPT‑5 (يفتقر GPT‑5 إلى البحث الأصلي). في حالة استدعاء السياق الطويل (20 مليون رمز): Gemini 98.9% مقابل GPT‑5 95.1%. ومع ذلك، لا يزال GPT‑5 يتصدر المهام الوكيلة (معيار GAIA) بنسبة 95% مقابل 88% لـ Gemini.
Privacy & Memory: How Google Handles Your Data
يتم تشفير Gemini Memory Vault وتخزينه بشكل منفصل عن أوزان النماذج الأساسية. يمكن للمستخدمين الوصول إلى "مدير الذاكرة" في إعدادات حساب Google - عرض جميع الذكريات (على سبيل المثال، "يعيش المستخدم في سياتل"، أو "المستخدم نباتي")، أو حذفها بشكل فردي، أو إيقاف تشغيل الذاكرة بالكامل. لا يتم استخدام الذكريات مطلقًا لتدريب النموذج الأساسي (اشترك في موافقة تدريب منفصلة). يستخدم بحث الويب في الوقت الفعلي وكيلاً مجهولاً، ويمكن للمستخدمين تعطيله أو طلب موافقة يدوية قبل كل عملية بحث.
Pricing & Availability: Free Tier for Everyone?
تبلغ تكلفة Gemini Ultra 2.0 API 50 دولارًا لكل مليون رمز إدخال، و150 دولارًا لكل مليون رمز إخراج (أعلى من قاعدة GPT‑5). Gemini Pro 2.0 (أصغر، 400B معلمات) هو 10 دولارات للإدخال / 30 دولارًا للإخراج. ومع ذلك، يحصل مشتركو Google One AI (19.99 دولارًا شهريًا) على وصول غير محدود إلى Gemini Ultra 2.0 في تطبيقات Google (البحث وGmail ومحرّر المستندات) - بدون الوصول إلى واجهة برمجة التطبيقات. تتوفر طبقة مجانية (Gemini Flash 2.0، 50B معلمات) في AI Studio مع حدود للمعدلات. سيتم إطلاق واجهة برمجة التطبيقات في 5 يونيو 2026.
Use Cases: From Personal Assistant to Research Co‑Pilot
تظهر العروض التوضيحية المبكرة نتائج مذهلة: يطلب أحد الطلاب من جيميني "البحث في تاريخ المطبعة، وكتابة مقال من 10 صفحات، والاستشهاد بالمصادر، وإضافة صور من ويكيميديا" - ويتم ذلك في 8 دقائق. يقوم أحد المطورين بمشاركة تسجيل شاشة لخلل ما؛ يحدد Gemini السطر الدقيق من التعليمات البرمجية ويقترح إصلاحًا. يقوم الطبيب بتحميل مخطط المريض (نص وصور معملية وملاحظات صوتية) - يقوم Gemini بإنشاء تشخيص تفريقي بدقة 92% يطابق لوحة متخصصة.
Deep Research Mode: Your AI Research Assistant
عند التنشيط، تخطط Gemini لأجندة بحثية متعددة الخطوات (على سبيل المثال، "مقارنة Tesla Optimus مع الشكل 02 لأتمتة المستودعات"). ثم يبحث بشكل مستقل في Google، ويفتح الروابط، ويستخرج المعلومات ذات الصلة، ويقارن الحقائق، ويكتب تقريرًا منظمًا يحتوي على جداول واستشهادات. يمكن للمستخدمين مراقبة التقدم مباشرة عبر "سجل البحث". هذه الميزة متاحة فقط لمشتركي Google One AI ومستخدمي واجهة برمجة التطبيقات (API) مع التزام شهري بحد أدنى 100 دولار.
Should You Switch from GPT‑5?
إذا كنت بحاجة إلى معلومات في الوقت الفعلي، أو ذاكرة طويلة المدى، أو تكامل عميق مع Google Workspace، فإن Gemini Ultra 2.0 هو الأفضل. بالنسبة لسير العمل الوكيل (توليد التعليمات البرمجية، وتنسيق الأدوات المتعددة) أو انخفاض تكلفة واجهة برمجة التطبيقات، يظل GPT‑5 أفضل. بالنسبة لمعظم المستهلكين، يقدم اشتراك Google One AI (20 دولارًا شهريًا) قيمة مذهلة - خاصة إذا كنت تستخدم Gmail أو Docs أو Android بالفعل. يجب على المطورين اختبار كليهما في مهامهم المحددة قبل الالتزام.
Key Highlights
1.2 Trillion Dense Parameters
أكبر محول كثيف تم نشره على الإطلاق - جميع المعلمات نشطة لكل رمز مميز، مما يوفر تماسكًا منطقيًا فائقًا مقارنة بنماذج MoE مثل GPT‑5.
Native Real‑Time Web Search
يقرر النموذج بشكل مستقل متى يتم البحث في Google، ويستعيد المعلومات المباشرة، ويستشهد بالمصادر. لا يوجد مكون إضافي - يعمل خارج الصندوق مع تبديل إذن المستخدم.
20 Million Token Context Window
قم بمعالجة مكتبات كاملة أو ساعات من الفيديو أو سنة من سجل الدردشة. يحافظ على استرجاع شبه مثالي لما يصل إلى 15 مليون رمز (دقة 99.2%).
Persistent Cross‑Session Memory
يتذكر الجوزاء الحقائق والتفضيلات والمشاريع الجارية عبر المحادثات. يمكن للمستخدمين مراجعة الذكريات وحذفها عبر لوحة معلومات الخصوصية.
Deep Research Mode
التصفح الوكيل: يخطط النموذج لجدول أعمال البحث، ويبحث، ويقرأ، ويجمع، ويعيد تقريرًا منظمًا. يمكن أن تعمل بشكل مستقل لساعات.
Verification Head & Hallucination Reduction
تقدير الثقة لكل رمز مميز. تؤدي المطالبات منخفضة الثقة إلى إجراء بحث أو إعادة صياغة تلقائية. هلوسة أقل بنسبة 78% من Gemini 1.5 Pro.
Native Screen Recording Understanding
يمكن لـ Gemini مشاهدة تسجيلات الشاشة (بإذن المستخدم) للمساعدة في تصحيح أخطاء البرامج، أو ملء النماذج، أو تعلم سير عمل واجهة المستخدم - وهو أمر ثوري للمساعدين الرقميين.
Google Deep Integration (Search, Gmail, Docs, Android)
مجانًا لمشتركي Google One AI. قم بتلخيص سلاسل رسائل البريد الإلكتروني، وإنشاء شرائح Google، والتحكم في تطبيقات Android عبر الصوت، والمزيد - كل ذلك باستخدام نموذج واحد.
Pros
- ✓بحث الويب في الوقت الفعلي مع الاستشهادات (بدون حقائق هلوسة)
- ✓تعمل الذاكرة المستمرة عبر الجلسات على التخلص من المطالبة المتكررة
- ✓20 مليون سياق رمزي - دقة استدعاء رائدة في الصناعة
- ✓يعمل وضع البحث العميق على أتمتة عملية تجميع المعلومات المعقدة
- ✓تكامل ممتاز مع نظام Google البيئي (Gmail، Docs، Search)
- ✓انخفاض معدل الهلوسة بسبب رأس التحقق
- ✓فهم تسجيل الشاشة الأصلي (ميزة فريدة)
- ✓أداء قياسي قوي، خاصة في MMLU والسياق الطويل
- ✓تتميز عناصر التحكم في الخصوصية للذاكرة والبحث بأنها دقيقة وشفافة
Cons
- ✗تسعير API أعلى من GPT‑5 (50 دولارًا مقابل 15 دولارًا لكل مليون إدخال)
- ✗الهندسة المعمارية الكثيفة تعني استدلالًا أبطأ من وزارة التعليم لنفس الجودة
- ✗لا يوجد استخدام للأداة الأصلية/تنفيذ التعليمات البرمجية (يتطلب امتدادات Vertex AI)
- ✗وضع البحث العميق مخصص فقط للمشتركين من الطبقة الأعلى
- ✗تتطلب ميزة الذاكرة حساب Google وقد تثير مخاوف تتعلق بالخصوصية
- ✗غير مفتوح المصدر - خيارات ضبط دقيقة محدودة (الإصدار Pro فقط يدعم الضبط الدقيق)
- ✗لا تزال متخلفة عن GPT-5 في معايير الوكيل المعقدة (GAIA)
