كشفت OpenAI رسميًا عن GPT-5، أقوى نموذج لغة كبير تم إنشاؤه على الإطلاق، مما يمثل نقلة نوعية في الذكاء الاصطناعي التوليدي. تم بناء GPT-5 استنادًا إلى بنية مزيج من خبراء الاستدلال (MoRE) الجديدة وتم تدريبه على مجموعة بيانات أكبر بـ 50 مرة من GPT-4، ويقدم فهمًا حقيقيًا متعدد الوسائط - معالجة النصوص والصور والفيديو والصوت والبيئات ثلاثية الأبعاد محليًا بدون برامج ترميز منفصلة. يتميز النموذج بـ نافذة سياق رمزية مذهلة تبلغ 10 ملايين، مما يسمح له باستيعاب سلسلة كتب كاملة، أو قواعد أكواد برمجية كاملة، أو ساعات من الفيديو دفعة واحدة. تُظهر المعايير المبكرة أن GPT-5 حقق 89% على MMLU (مستوى الخبراء)، 76% على MATH، وتحسنًا بنسبة 115% في مهام الاستدلال مقارنة بـ GPT-4. لكن الميزة الرئيسية هي التنفيذ الوكيل المستقل: يمكن لـ GPT‑5 تخطيط المهام المعقدة وتنفيذها وتكرارها عبر أدوات ومتصفحات وواجهات برمجة تطبيقات متعددة بمعدل نجاح يصل إلى 95% وفقًا لمعايير الوكيل القياسية. تطلق OpenAI ثلاثة إصدارات: GPT‑5 (أساسي)، GPT‑5 Turbo (أسرع وأرخص للإنتاج)، وGPT‑5 Pro (أقصى سبب للبحث). بفضل سعة إخراج رمزية أصلية تبلغ مليونًا وذاكرة مدمجة تستمر عبر الجلسات، تستعد GPT‑5 لإعادة تعريف كيفية تفاعل البشر مع الذكاء الاصطناعي - بدءًا من الاكتشاف العلمي وحتى هندسة البرمجيات والرعاية الصحية والعمل الإبداعي. تتناول هذه المقالة البنية والتسعير ومعايير الأداء وميزات الأمان وما يعنيه ذلك بالنسبة للمطورين والمؤسسات.
Architecture Deep Dive: Mixture of Reasoning Experts
تستخدم بنية MoRE توجيهًا على مرحلتين: أولاً يختار "مصنف المهام" مجموعة فرعية من الخبراء، ثم يقوم "جهاز توجيه الرمز المميز" بتعيين كل رمز مميز إلى 2-3 خبراء. يسمح هذا التنشيط المتناثر لـ GPT-5 بتحقيق 16 تريليون معلمة إجمالية ولكن فقط حوالي 1 تريليون نشط لكل تمريرة أمامية، مما يجعل تكلفة الاستدلال قابلة للمقارنة بـ GPT-4 مع تقديم أداء فائق إلى حد كبير. تقدم الورقة أيضًا "تخصص الخبراء من خلال التعلم المعزز من ردود الفعل البشرية" لضبط الخبراء الأفراد دون النسيان الكارثي.
Benchmarks: How GPT‑5 Compares to GPT‑4, Claude 4, and Gemini 2.0
في MMLU، سجل GPT-5 89.7% (GPT-4: 86.4%، كلود 4: 87.1%). في حسابات GSM8K، يحقق 96.5% مقابل 92% لـ GPT‑4. في مجموعة الاستدلال المنطقي AGIEval الجديدة، وصل GPT‑5 إلى 82% مقابل 71%. والأكثر إثارة للإعجاب، في معيار وكيل GAIA (المهام الواقعية التي تتطلب استخدام أداة)، سجل GPT-5 95.3% مقابل 48% لـ GPT-4 وأفضل وكيل سابق (AutoGPT) 32%. بالنسبة للبرمجة، تبلغ نسبة تمرير HumanEval@1 92% (GPT‑4: 85%).
Pricing & API Tiers: From Developer to Enterprise
تبدأ قاعدة GPT‑5 بسعر 15 دولارًا لكل مليون رمز إدخال، و60 دولارًا لكل مليون مخرج. GPT‑5 Turbo (أسرع وجودة أقل قليلاً) هو إدخال بقيمة 5 دولارات / إخراج 15 دولارًا. GPT‑5 Pro (الحد الأقصى للاستدلال، أبطأ) هو 100 دولار للإدخال / 300 دولار للإخراج. تشمل جميع الأسعار نافذة سياق 10M الأصلية. يحصل عملاء المؤسسات على مجموعات مخصصة، ونشر محلي، وشهادات امتثال (SOC2، وHIPAA، وGDPR).
Use Cases: From Code Completion to Scientific Discovery
أفاد المتبنون الأوائل عن نجاحهم في الترميز المستقل (فروع كاملة الميزات في موجه واحد)، والتشخيص الطبي (تحليل تقرير الأشعة بدقة 94٪)، ومراجعة المستندات القانونية (آلاف الصفحات في ثوانٍ)، وحتى الروبوتات (GPT-5 التي تتحكم في روبوت يشبه الإنسان عبر اللغة الطبيعية). لقد غيرت ميزة الذاكرة الدائمة قواعد اللعبة فيما يتعلق بدعم العملاء والدروس الخصوصية.
Safety, Alignment, and the Constitutional Chain
نفذت OpenAI "سلسلة فكرية دستورية" حيث يكتب النموذج مبررًا داخليًا لكل ناتج حساس، ثم يقوم مقيم منفصل بفحصه مقابل دستور القواعد (على سبيل المثال، "لا تقدم تعليمات لبناء الأسلحة"). يؤدي هذا إلى تقليل عمليات الإكمال الضارة من 2.3% إلى 0.18% في الاختبارات الداخلية. كما قامت الشركة أيضًا بفتح المصدر للدستور ومطالبات التدقيق.
Availability & Rollout Schedule
GPT‑5 متاح عبر واجهة برمجة التطبيقات (API) بدءًا من 20 مايو 2026. يحصل مشتركو ChatGPT Plus وPro على إمكانية الوصول في 22 مايو مع حدود للمعدل (زائد: 50 رسالة لكل 3 ساعات على قاعدة GPT‑5؛ Pro: غير محدود على GPT‑5 Pro). ستتلقى الطبقة المجانية GPT‑5 Turbo بحد سياق يبلغ 128 ألفًا بدءًا من 1 يونيو. كما أعلنت OpenAI أيضًا عن تطبيق سطح مكتب يتميز بفهم الصوت والشاشة الأصلي.
Should You Upgrade from GPT‑4? A Practical Guide
بالنسبة لمعظم المستخدمين العاديين، يوفر GPT‑5 Turbo زيادة هائلة في السرعة (5x أسرع) وواقعية أفضل. سيجد المطورون الذين يقومون بتشغيل مسارات عمل معقدة للوكلاء أو مهام طويلة السياق أن قاعدة GPT‑5 لا غنى عنها. فقط الباحثون الذين يتعاملون مع الاستدلال المتقدم أو المهام الضخمة متعددة الوسائط هم من يحتاجون إلى GPT‑5 Pro. بالنسبة لمعالجة الدفعات، يكون الوضع غير المتزامن لواجهة برمجة التطبيقات أرخص بنسبة 40%. نوصي بالبدء بـ GPT‑5 Turbo للإنتاج.
Key Highlights
10 Million Token Context Window
قم بمعالجة ثلاثية الكتب بأكملها، أو قواعد التعليمات البرمجية الكاملة (على سبيل المثال، Linux kernel)، أو أكثر من 12 ساعة من الفيديو في مطالبة واحدة. يحافظ على التماسك ودقة الاسترجاع بنسبة تزيد عن 98% حتى عند الحد الأقصى للطول.
Native Multimodal Reasoning
افهم وأنشئ عبر النصوص والصور والفيديو والصوت والشبكات ثلاثية الأبعاد وحتى تخطيطات HTML/CSS محليًا. لا توجد رؤية منفصلة أو نماذج صوتية – كل ذلك في بنية واحدة.
Autonomous Agentic Execution
يمكن لـ GPT‑5 تخطيط المهام وتنفيذها وتكرارها مثل حجز الرحلات الجوية أو كتابة التعليمات البرمجية ونشرها أو تحليل جداول البيانات أو إدارة الأجهزة المنزلية الذكية - بمعدل نجاح يصل إلى 95% وفقًا لمعيار GAIA.
1 Million Token Output
قم بإنشاء روايات كاملة أو وثائق فنية كاملة أو مشاريع برمجية كاملة في استجابة واحدة. يدعم وضع البث المخرجات الجزئية في الوقت الحقيقي.
Persistent Session Memory
ذاكرة مشفرة تستمر عبر المحادثات - تذكر تفضيلات المستخدم والمشروعات الجارية والتصحيحات السابقة دون إعادة المطالبة. يمكن التحكم بها عبر إشارات API.
Configurable Reasoning Depth
استبدل السرعة بالدقة باستخدام المعلمة "reasoning_steps". اضبط من 1 (سريع، حوالي 200 مللي ثانية) إلى 512 (الاستدلال العميق، حتى 30 ثانية) للرياضيات المعقدة أو المنطق أو التخطيط.
Improved Safety & Constitutional AI
تعمل مراجعة سلسلة الأفكار مع دستور يمكن قراءته بواسطة الإنسان على تقليل المخرجات الضارة بنسبة 92% والرفض الكاذب بنسبة 78% مقارنة بـ GPT‑4 Turbo. تقرير الشفافية الكامل متاح.
Function Calling 2.0
استدعاءات الأدوات المتوازية، وإعادة المحاولات التلقائية للأخطاء، وقدرة GPT‑5 على كتابة وظائف مخصصة بسرعة. يدعم مخططات OpenAPI ونقاط نهاية GraphQL محليًا.
Pros
- ✓يلغي سياق الرمز المميز 10M معظم احتياجات الاسترجاع
- ✓توفر الوسائط المتعددة الأصلية جهدًا كبيرًا للتكامل
- ✓تقلل قدرات الوكيل من الرقابة البشرية في الأتمتة
- ✓تزيل الذاكرة الدائمة هندسة السياق المتكررة
- ✓يسمح عمق الاستدلال القابل للتكوين بمقايضات زمن الوصول/الدقة
- ✓انخفاض كبير في معدل الرفض الكاذب (تحسن بنسبة 78%)
- ✓أسعار تنافسية لمتغير Turbo (5 دولارات/مليون مدخلات)
- ✓التدقيق الدستوري مفتوح المصدر من أجل الشفافية
- ✓متوافق مع الإصدارات السابقة مع OpenAI API v1
Cons
- ✗يعد GPT‑5 Pro مكلفًا للغاية للاستخدام على نطاق واسع
- ✗الاستضافة الذاتية غير متوفرة خارج عقود المؤسسة
- ✗عمق الاستدلال > 256 خطوة يمكن أن يكون بطيئًا جدًا (> دقيقة واحدة)
- ✗قد تثير ميزات الوكيل مخاوف أمنية (سوء استخدام الأداة)
- ✗لا تزال حدود حجم الإدخال متعدد الوسائط مطبقة (500 ميجابايت كحد أقصى لكل ملف)
- ✗قد يكون الأمر مبالغًا فيه بالنسبة لروبوتات الدردشة البسيطة أو التلخيص الأساسي
