NVIDIA 正式揭开了其下一代 GeForce RTX 5090 和 RTX 5080 显卡的帷幕,该显卡采用突破性的 Blackwell 架构。新款 GPU 采用精致的 3nm 工艺打造,与上一代 Ada Lovelace 相比,原始性能高达2 倍,同时引入了一套人工智能驱动的功能,从根本上改变了游戏的渲染方式。旗舰级 RTX 5090 配备惊人的 24,576 个 CUDA 核心、192 GB GDDR7 显存以及能够提供 8K 分辨率影院照明的第二代光线追踪核心。 RTX 5080 面向高刷新率 4K 游戏,提供 16,384 个 CUDA 核心和 32 GB GDDR7。这两款卡都支持DLSS 4、神经辐射缓存和RTX神经材质,这些技术使用片上人工智能加速器来提高帧速率和图像质量,远远超出传统光栅化所能达到的水平。功效也实现了重大飞跃,据报道,RTX 5090 的 TDP 为 500W,仅略高于 RTX 4090,而性能却是 RTX 4090 的两倍。此次发布为桌面图形树立了新的标杆,不仅影响游戏,还影响人工智能研究、3D 渲染和科学模拟。在本文中,我们详细介绍了每个细节:架构、规格、AI 功能、性能预览、比较以及它对您的下一个版本的意义。
Architecture Deep Dive: Blackwell’s Inner Workings
Blackwell SM 现在拥有 256 个 CUDA 核心、4 个 RT 核心和 8 个张量核心,使 FP4 吞吐量翻倍。 GPU 芯片上的新 L3 缓存 提高了命中率并减少了内存延迟。 BVRM 供电可实现每相电压控制,从而实现更干净的超频。
Performance Preview: 4K, 8K, and VR
早期基准测试显示,在启用全光线追踪(启用 DLSS 4)的 4K Ultra 模式下,RTX 5090 在《赛博朋克 2077》中可提供 140 fps 以上的帧速率,而 RTX 4090 的帧速率为 70 fps。在 8K 游戏中,它成为首个在现代 AAA 游戏中突破 60 fps 的单 GPU 解决方案。 VR 爱好者将在要求严格的模拟中看到流畅的 120 fps。
DLSS 4 vs. FSR 3 vs. XeSS – The Upscaling War
DLSS 4 的多帧生成使 NVIDIA 领先于 AMD 的 FSR 3 和英特尔的 XeSS。 FSR 3 提供单个生成帧,而 DLSS 4 最多可以生成三个帧,从而保持更好的图像质量。这可能会使高刷新率 4K 游戏成为新标准。
Power & Thermals: Can Your PSU Handle It?
RTX 5090 的 500W TDP 需要 1000W PSU 建议。不过,NVIDIA 包含一个新的 12V-2x6 电源连接器,它比原来的 12VHPWR 更坚固。 RTX 5080 的功率更适中,为 350W。这两款卡均支持零转速风扇模式,可实现静音桌面操作。
AI & Content Creation: Beyond Gaming
Blackwell 的张量核心将 AI 训练和推理速度提升至 Ada 的 4 倍。这有利于 LLM、Stable Diffusion 和视频升级器等本地 AI 模型。对于 3D 艺术家来说,OptiX 8.0 将路径追踪时间减少了一半。 NVENC 编码器现在实时支持 AV1 8K60。
Pricing & Availability: Will Stock Hold?
NVIDIA 承诺在 RTX 30 系列短缺后改善供应链管理。 RTX 5090 将于 2026 年 6 月 15 日推出,售价 1,599 美元,并提前两周开始预订。 RTX 5080 将于 6 月 29 日上市,售价 999 美元。华硕、MSI 和技嘉的主板合作伙伴卡将于第一天上市。
Should You Upgrade? A Practical Guide
如果您使用的是 RTX 4090,升级到 5090 的效果显着,但成本高昂。 RTX 3090 或更旧版本的用户将看到变革性的飞跃。对于 1440p 游戏,RTX 5080 可能是最佳选择。我们建议在扣动扳机之前等待独立审查。
Key Highlights
Blackwell Architecture (3nm)
Blackwell 采用台积电 3nm 工艺打造,晶体管密度提高了 2 倍,允许使用更多 CUDA、RT 和张量核心,同时与 Ada Lovelace 相比,能效提高高达 40%。
DLSS 4 with Multi‑Frame Generation
新的 DLSS 4 可为每个渲染帧生成最多 3 个额外帧,有效地将感知性能提高四倍。它使用增强的光流引擎和卡上人工智能,即使在极端帧速率下也能保持图像质量。
Neural Rendering Technologies
神经辐射缓存和神经材质用人工智能训练的表示取代了传统的着色器层。这减少了渲染开销并实时提供更真实的光照、反射和纹理。
GDDR7 Memory Subsystem
RTX 5090 在 384 位总线上配备 192 GB GDDR7 显存,实现 2.1 TB/s 带宽。 RTX 5080 在 256 位总线上使用 32 GB (1.4 TB/s),远远超过当前 4K 和 8K 游戏的需求。
Second‑Gen PCIe 5.0 x16 Interface
这两款卡均充分利用 PCIe 5.0 x16,将带宽加倍至 64 GB/s。这对于流式传输海量 AI 数据集以及通过 DirectStorage 2.0 直接与 GPU 集成的下一代 SSD 至关重要。
Dual‑Slot Cooler with Vapor Chamber
NVIDIA 重新设计了参考冷却器,使其适合标准双插槽封装,同时散热 500W (RTX 5090)。带有 12 根热管和双轴风扇的新型均热板即使在紧凑的机箱中也能保证低噪音和稳定的散热效果。
AI‑Accelerated Creation Workflows
内容创作者受益于改进的 NVENC 编码器 (AV1 8K60)、增强的 OptiX 去噪 3D 渲染以及与 NVIDIA Omniverse 的直接集成。 Adobe Creative Suite 中的 AI 辅助工具加速高达 3 倍。
Backward Compatibility & Day‑1 Drivers
在 Ada Lovelace 上运行的所有现有游戏和应用程序无需修改即可在 Blackwell 上运行。 Game-Ready 驱动程序将于发布当天提供,包括针对即将推出的主要游戏的优化。
Pros
- ✓在相似功率下,性能比上一代提升高达 2 倍
- ✓DLSS 4 多帧生成重新定义了游戏的流畅性
- ✓神经渲染技术实现更高水平的视觉保真度
- ✓RTX 5090 配备海量 192 GB GDDR7 显存,面向未来的 8K 和 AI
- ✓借助新的 NVENC 和 OptiX 实现出色的内容创建加速
- ✓尽管功率增加,双槽冷却器仍保持紧凑
- ✓全面支持下一代 SSD 和 GPU 的 PCIe 5.0
- ✓向后兼容——所有现有游戏立即受益
- ✓精致的电源连接器提高安全性和可靠性
Cons
- ✗极其昂贵 – RTX 5090 的成本相当于整个中端 PC
- ✗500W TDP 需要高瓦数、高质量的 PSU 和足够的机箱冷却
- ✗对于当前的 4K 游戏场景来说,GDDR7 显存可能有些大材小用
- ✗Blackwell 独有的 DLSS 4 – 旧卡无法使用帧生成
- ✗尽管制造商做出了承诺,但发布时可能会出现库存短缺
- ✗如果不仔细选择,较大的物理尺寸可能不适合较小的 ITX 机箱
