OpenAI официально представила GPT-5, самую мощную модель большого языка, когда-либо созданную, что знаменует собой сдвиг парадигмы в генеративном искусственном интеллекте. Построенный на новой архитектуре Mixture of Reasoning Experts (MoRE) и обученный на наборе данных, более чем в 50 раз превышающем GPT-4, GPT-5 обеспечивает истинное мультимодальное понимание — обработку текста, изображений, видео, аудио и 3D-сред без использования отдельных кодировщиков. Модель имеет ошеломляющее контекстное окно на 10 миллионов токенов, позволяющее обрабатывать целые серии книг, полные кодовые базы или часы видео за один раз. Ранние тесты показывают, что GPT-5 достигает 89 % по MMLU (экспертный уровень), 76 % по MATH и 115 % улучшение в задачах на рассуждение по сравнению с GPT-4. Но главной особенностью является автономное агентское выполнение: GPT‑5 может планировать, выполнять и выполнять сложные задачи с помощью нескольких инструментов, браузеров и API с вероятностью успеха до 95 % по стандартным тестам агентов. OpenAI выпускает три варианта: GPT‑5 (базовый), GPT‑5 Turbo (быстрее, дешевле для производства) и GPT‑5 Pro (максимальное обоснование для исследований). Благодаря собственной емкости вывода 1 млн токенов и встроенной памяти, которая сохраняется на протяжении всех сеансов, GPT-5 готов переопределить то, как люди взаимодействуют с ИИ — от научных открытий до разработки программного обеспечения, здравоохранения и творческой работы. В этой статье рассказывается об архитектуре, ценах, тестах производительности, функциях безопасности и о том, что это значит для разработчиков и предприятий.
Architecture Deep Dive: Mixture of Reasoning Experts
В архитектуре MoRE используется двухэтапная маршрутизация: сначала «классификатор задач» выбирает подмножество экспертов, затем «маршрутизатор токенов» назначает каждый токен 2–3 экспертам. Такая редкая активация позволяет GPT-5 достигать 16 триллионов общих параметров, но только ~1 триллион активных за один прямой проход, что делает стоимость вывода сопоставимой с GPT-4, обеспечивая при этом значительно более высокую производительность. В документе также представлена «специализация экспертов посредством обучения с подкреплением на основе отзывов людей» для точной настройки отдельных экспертов без катастрофического забывания.
Benchmarks: How GPT‑5 Compares to GPT‑4, Claude 4, and Gemini 2.0
По MMLU GPT-5 набрал 89,7% (GPT-4: 86,4%, Claude 4: 87,1%). По математике GSM8K он достигает 96,5% против 92% для GPT‑4. В новом пакете рассуждений AGIEval GPT‑5 достигает 82% против 71%. Наиболее впечатляюще то, что в тесте агента GAIA (реальные задачи, требующие использования инструментов) GPT-5 набирает 95,3% против 48% у GPT-4 и предыдущего лучшего агента (AutoGPT) с 32%. Для кодирования HumanEval pass@1 составляет 92% (GPT‑4: 85%).
Pricing & API Tiers: From Developer to Enterprise
Базовая цена GPT-5 начинается с 15 долларов США за миллион входных токенов и 60 долларов США за миллион выходных токенов. GPT‑5 Turbo (быстрее, немного более низкое качество) стоит 5 долларов США на входе/15 долларов США на выходе. GPT‑5 Pro (максимальное рассуждение, медленнее) стоит 100 долларов США на входе/300 долларов США на выходе. Все цены включают встроенное контекстное окно размером 10 млн. Корпоративные клиенты получают выделенные кластеры, локальное развертывание и сертификаты соответствия (SOC2, HIPAA, GDPR).
Use Cases: From Code Completion to Scientific Discovery
Первые пользователи сообщают об успехах в автономном кодировании (полнофункциональные разделы в одной подсказке), медицинской диагностике (анализ отчетов о радиологии с точностью 94%), проверке юридических документов (тысячи страниц за секунды) и даже в робототехнике (GPT-5, управляющий роботом-гуманоидом с помощью естественного языка). Функция постоянной памяти изменила правила игры в сфере поддержки клиентов и индивидуального обучения.
Safety, Alignment, and the Constitutional Chain
OpenAI внедрила «конституционную цепочку мыслей», где модель записывает внутреннее обоснование для каждого конфиденциального результата, а затем отдельный оценщик проверяет его на соответствие своду правил (например, «Не предоставлять инструкций по созданию оружия»). Это снижает количество вредных завершений внутренних тестов с 2,3% до 0,18%. Компания также открыла исходный код конституции и инструкций по аудиту.
Availability & Rollout Schedule
GPT‑5 доступен через API с 20 мая 2026 г. Подписчики ChatGPT Plus и Pro получают доступ 22 мая с ограничениями по скорости (Plus: 50 сообщений за 3 часа на базе GPT‑5; Pro: без ограничений на GPT‑5 Pro). Уровень бесплатного пользования получит GPT‑5 Turbo с ограничением контекста в 128 тысяч, начиная с 1 июня. OpenAI также анонсировала настольное приложение с нативной голосовой связью и распознаванием экрана.
Should You Upgrade from GPT‑4? A Practical Guide
Для большинства обычных пользователей GPT‑5 Turbo предлагает значительное увеличение скорости (в 5 раз быстрее) и лучшую реалистичность. Разработчики, выполняющие сложные рабочие процессы агентов или задачи с длинным контекстом, найдут базу GPT-5 незаменимой. GPT‑5 Pro нужен только исследователям, занимающимся сложными рассуждениями или огромными мультимодальными задачами. Для пакетной обработки асинхронный режим API обходится на 40 % дешевле. Мы рекомендуем начать с GPT‑5 Turbo для производства.
Key Highlights
10 Million Token Context Window
Обрабатывайте целые книжные трилогии, полные кодовые базы (например, ядро Linux) или более 12 часов видео в одном запросе. Сохраняет согласованность и точность поиска выше 98% даже при максимальной длине.
Native Multimodal Reasoning
Понимайте и генерируйте текст, изображения, видео, аудио, 3D-сетки и даже макеты HTML/CSS в исходном виде. Никакого отдельного видения или голосовых моделей – все в одной архитектуре.
Autonomous Agentic Execution
GPT‑5 может планировать, выполнять и повторять такие задачи, как бронирование рейсов, написание и развертывание кода, анализ электронных таблиц или управление устройствами умного дома — с показателем успеха 95% по тесту GAIA.
1 Million Token Output
Создавайте целые романы, полную техническую документацию или законченные проекты программного обеспечения за один ответ. Режим потоковой передачи поддерживает частичный вывод в реальном времени.
Persistent Session Memory
Зашифрованная память, которая сохраняется на протяжении всего разговора: запоминайте предпочтения пользователя, текущие проекты и прошлые исправления без повторных запросов. Управляется через флаги API.
Configurable Reasoning Depth
Поменяйте скорость на точность с помощью параметраreasoning_steps. Установите от 1 (быстро, ~200 мс) до 512 (глубокое рассуждение, до 30 секунд) для сложных математических, логических вычислений или планирования.
Improved Safety & Constitutional AI
Аудит цепочки мыслей с понятной для человека структурой снижает вредные выходные данные на 92 %, а ложные отказы — на 78 % по сравнению с GPT‑4 Turbo. Доступен полный отчет о прозрачности.
Function Calling 2.0
Параллельные вызовы инструментов, автоматические повторные попытки ошибок и возможность GPT‑5 писать пользовательские функции «на лету». Изначально поддерживает схемы OpenAPI и конечные точки GraphQL.
Pros
- ✓Контекст токена 10M устраняет большинство потребностей в поиске данных.
- ✓Встроенная мультимодальность экономит значительные усилия по интеграции
- ✓Агентские возможности уменьшают человеческий контроль при автоматизации.
- ✓Постоянная память устраняет повторяющуюся контекстную инженерию
- ✓Настраиваемая глубина рассуждений позволяет найти компромисс между задержкой и точностью.
- ✓Значительно более низкий уровень ложных отказов (улучшение на 78%).
- ✓Конкурентоспособные цены на вариант Turbo (затраты 5 долларов США за миллион)
- ✓Конституционный аудит с открытым исходным кодом на предмет прозрачности
- ✓Обратная совместимость с OpenAI API v1.
Cons
- ✗GPT‑5 Pro чрезвычайно дорог для крупномасштабного использования.
- ✗Самостоятельный хостинг недоступен вне корпоративных контрактов.
- ✗Глубина рассуждения >256 шагов может быть очень медленной (>1 минуты)
- ✗Агентские функции могут вызвать проблемы с безопасностью (неправильное использование инструмента).
- ✗Ограничения на размер мультимодальных входных данных по-прежнему применяются (максимум 500 МБ на файл).
- ✗Может быть излишним для простых чат-ботов или базового обобщения
