
NVIDIA GeForce RTX 5090 Ti 256GB GDDR7
Blackwell Ultra architecture – 28,672 CUDA cores, AI‑driven DLSS 4 Ultimate, and uncompromised 8K 240Hz gaming
Key Highlights
- 28 672 ядра CUDA + 256 ГБ GDDR7 — первый потребительский графический процессор с 0,25 ТБ видеопамяти
- DLSS 4 Ultimate — генерация кадров в 5 раз быстрее с помощью Motion Transformer AI
- Neural Radiance Caching 2.0 и RTX Neural Materials Pro для кинематографической трассировки лучей в реальном времени
- Трехслотовый жидкометаллический охладитель — TDP 600 Вт, поддерживается при температуре ниже 70°C
- PCIe 6.0 x16 и DisplayPort 2.1a — поддержка 16K, 60 Гц и 8K, 240 Гц
- Усиленный разъем 12В‑2х6 с контролем температуры/тока
Overview
How It Works
RTX 5090 Ti оснащен архитектурой Blackwell Ultra — радикальной модернизацией, которая увеличивает количество ядер, добавляет специальный планировщик AI и представляет GDDR7 со встроенным ECC. Вот как это работает шаг за шагом:
Blackwell Ultra SM
Каждый SM теперь содержит 384 ядра CUDA, 6 ядер RT и 12 тензорных ядер. Новая поддержка FP6 утрояет пропускную способность вывода искусственного интеллекта по сравнению с RTX 5090, обеспечивая замену нейронного материала в реальном времени в 8K.
448‑bit GDDR7 Subsystem
256 ГБ памяти GDDR7 на 448-битной шине работают со скоростью 36 Гбит/с — общая пропускная способность 2,5 ТБ/с. Кэш-память L3 объемом 256 МБ сокращает внешний трафик, а аппаратное ускорение ECC обеспечивает целостность данных для обучения ИИ и научного моделирования.
DLSS 4 Ultimate with Multi‑Frame Gen
DLSS 4 Ultimate может генерировать до 4 интерполированных кадров на каждый реальный кадр. Трансформатор движения предсказывает траектории объекта с точностью в 4 раза выше, чем механизм оптического потока, практически устраняя ореолы и задержки.
Advanced Neural Rendering
Neural Radiance Caching 2.0 динамически обучает модель искусственного интеллекта для каждой сцены глобальному освещению, повторно используя до 90 % образцов освещения. RTX Neural Materials Pro заменяет сложные шейдерные слои текстурами, созданными искусственным интеллектом, которые реагируют на освещение и углы в реальном времени.
BVRM Power Delivery & Cooling
28-фазный Модуль регулятора напряжения Blackwell обеспечивает регулировку напряжения за доли миллисекунды. Испарительная камера с тремя слотами использует жидкометаллический интерфейс с фазовым переходом и вентилятор на магнитной левитации, рассеивающий 600 Вт, оставаясь при этом тише, чем RTX 5090.
PCIe 6.0 & DisplayPort 2.1a
Интерфейс PCIe 6.0 x16 обеспечивает двунаправленную полосу пропускания 256 ГБ/с (сигнализация PAM4). Три выхода DisplayPort 2.1a поддерживают 8K 240 Гц или 16K 60 Гц с DSC, а HDMI 2.2 добавляет 12-битную глубину цвета и игровой режим VRR.
Key Features
28,672 CUDA Cores
Самое большое количество ядер потребительского графического процессора за всю историю — грубая растеризация, позволяющая без труда обрабатывать игры в разрешении 8K с частотой 144 Гц и сложный 3D-рендеринг.
256 GB GDDR7 Memory
Беспрецедентная емкость для потребительской карты. Обучайте LLM с 70B-параметрами локально, редактируйте 12-потоковое видео 8K RAW или загружайте целые игровые миры в VRAM.
DLSS 4 Ultimate (5× Frame Generation)
Генерация кадров на основе искусственного интеллекта, преобразователь движения и нейронный рендеринг в совокупности увеличивают частоту кадров до 5 раз, превращая 30 кадров в секунду в 150 кадров в секунду с качеством, близким к исходному.
Triple‑Slot Vapor‑Chamber Cooler
Несмотря на TDP в 600 Вт, кулер удерживает температуру ниже 70°C при полной нагрузке. Жидкометаллический TIM и вентилятор на магнитной подушке устраняют шум откачки и подшипников.
5th‑Gen RT Cores & Path Tracing
Производительность трассировки лучей снова удваивается по сравнению с RTX 5090. Полная трассировка пути в Cyberpunk 2077 и Alan Wake 2 работает в разрешении 4K 120 кадров в секунду с режимом качества DLSS.
12V‑2x6 (675W Rated) Connector
Усиленный разъем 12 В‑2x6 обеспечивает мониторинг температуры и тока в режиме реального времени, исключая любой риск плавления, а также механизм блокировки со слышимым щелчком.
Blackwell Ultra Architecture Deep Dive
Как NVIDIA удвоила усилия в области искусственного интеллекта и пропускной способности
Dual‑Issue CUDA Core Clusters
Каждый SM теперь может выдавать две независимые инструкции за такт, что эффективно увеличивает параллелизм на уровне команд. В сочетании с 384 ядрами CUDA на SM процессор 5090 Ti обеспечивает 140 терафлопс производительности FP32.
Hierarchical Cache + L3 Victim Cache
Кэш L2 объемом 256 МБ дополнен кэшем жертвы L3 объемом 512 МБ, в котором хранятся удаленные строки. Это уменьшает трафик GDDR7 еще на 40%, в результате чего эффективная пропускная способность 2,5 ТБ/с ощущается как 3,5 ТБ/с.
AI‑Assisted Power Gating
Специальный сопроцессор искусственного интеллекта прогнозирует фазы рабочей нагрузки и блокирует неактивные SM за 5 нс. Это снижает энергопотребление в режиме ожидания на 70 % и сохраняет температуру карты во время использования настольного компьютера.
DLSS 4 Ultimate vs. Traditional Rendering
Почему генерация кадров AI становится неотличимой от нативной
Motion Transformer Technology
Вместо простого оптического потока DLSS 4 Ultimate использует сеть трансформаторов, обученную на 10 миллионах векторов движения. Он предсказывает попиксельные траектории на 4 кадра вперед, устраняя ореолы на быстродвижущихся объектах.
Temporal Neural Anti‑Aliasing (TNNA)
Легкая рекуррентная нейронная сеть заменяет традиционную ТАА. Он восстанавливает субпиксельные детали из предыдущих кадров, обеспечивая качество изображения, превосходящее 16× MSAA, при нулевых затратах производительности.
Neural Radiance Caching 2.0
Драйвер обучает небольшую модель диффузии для каждого уровня игры для кэширования данных выборки яркости и важности. Трассировка пути, которая раньше требовала 50 выборок на пиксель, теперь выглядит чисто, используя всего 4 выборки — ускорение в 12 раз.
Pros
- ✓Непревзойденные 28 672 ядра CUDA и 256 ГБ видеопамяти для рабочих нагрузок искусственного интеллекта и 8K
- ✓DLSS 4 Ultimate может повышать скорость от 30 до 150 кадров в секунду с минимальной задержкой.
- ✓PCIe 6.0 и DisplayPort 2.1a с перспективой на ближайшие 5 лет
- ✓256 ГБ GDDR7 позволяет проводить локальное обучение LLM (например, Llama 3 70B с полной точностью)
- ✓Вентиляторное охлаждение жидкого металла + магнитной подвески эффективно и тихо для мощности 600 Вт.
- ✓Обратная совместимость с существующими материнскими платами PCIe 4.0/5.0 и всеми играми.
- ✓Нейронный рендеринг позволяет воспроизводить трассировку пути в играх AAA с разрешением 4K и частотой 120 кадров в секунду.
Cons
- ✗Очень дорого, рекомендованная розничная цена 1999 долларов США – ожидаемая розничная цена может превысить 2500 долларов США.
- ✗TDP 600 Вт требует блока питания премиум-класса мощностью 1200 Вт и выше (рекомендуется ATX 3.1)
- ✗Размер с тремя слотами может не подходить для многих корпусов малого форм-фактора.
- ✗256 ГБ видеопамяти — это слишком для современных игр; выгоды в первую очередь для ИИ/профессионалов
- ✗DLSS 4 Ultimate эксклюзивно для Blackwell Ultra — старые карты не могут использовать генерацию кадров 5×.
- ✗При запуске возможны ограниченные поставки из-за сложной упаковки, изготовленной по 3-нанометровому техпроцессу.
Use Cases
Technical Specifications
RTX 5090 Ti vs RTX 5090 vs RTX 4090
| Feature | rtx5090ti | rtx5090 | rtx4090 | |
|---|---|---|---|---|
| Architecture | Blackwell Ultra (3nm+) | Blackwell (3nm) | Ada Lovelace (5nm) | |
| CUDA Cores | 28,672 | 24,576 | 16,384 | |
| Memory | 256 GB GDDR7 | 192 GB GDDR7 | 24 GB GDDR6X | |
| Bandwidth | 2.5 TB/s | 2.1 TB/s | 1.0 TB/s | |
| TDP | 600W | 500W | 450W | |
| DLSS Version | DLSS 4 Ultimate (5× Frame Gen) | DLSS 4 (3× Frame Gen) | DLSS 3 (1× Frame Gen) | |
| Performance (Cyberpunk 2077 8K) | ~85 fps (Path Tracing + DLSS Ultra Perf) | ~55 fps | ~25 fps | |
| Price (MSRP) | $1,999 | $1,599 | $1,599 |
Setup Tips
Use Two Independent 12V‑2x6 Cables (If Possible)
Хотя на карте используется один разъем 12 В‑2x6, некоторые блоки питания допускают разделение. Используйте кабель самого высокого номинала (675 Вт) и избегайте шлейфового подключения старых кабелей 12 ВHPWR.
Update BIOS for PCIe 6.0 Compatibility
Будущим материнским платам с PCIe 6.0 потребуется обновление BIOS, чтобы обеспечить скорость соединения 256 ГБ/с. На данный момент установите слот PCIe 5.0 или 4.0 вручную, если вы испытываете нестабильность.
Provide Extra Airflow for the Backplate
Задняя панель 5090 Ti нагревается (до 85°C) из-за модулей памяти на задней стороне. Установите боковой вентилятор или убедитесь, что в корпусе имеется положительное давление для охлаждения области задней панели.
Enable Resizable BAR and Above 4G Decoding
Эти параметры BIOS являются обязательными для полной производительности DLSS 4 Ultimate. На большинстве материнских плат они также улучшают шаблоны доступа к памяти для рабочих нагрузок ИИ.