
NVIDIA GeForce RTX 5090 Ti 256GB GDDR7
Blackwell Ultra architecture – 28,672 CUDA cores, AI‑driven DLSS 4 Ultimate, and uncompromised 8K 240Hz gaming
Key Highlights
- 28,672 CUDA cores + 256 GB GDDR7 – GPU สำหรับผู้บริโภคตัวแรกที่มี VRAM 0.25 TB
- DLSS 4 Ultimate – การสร้างเฟรม 5 เท่าผ่าน Motion Transformer AI
- Neural Radiance Caching 2.0 และ RTX Neural Materials Pro สำหรับ Ray Tracing แบบเรียลไทม์ในโรงภาพยนตร์
- เครื่องทำความเย็นโลหะเหลวแบบสามสล็อต – 600W TDP เก็บไว้ที่อุณหภูมิต่ำกว่า 70°C
- PCIe 6.0 x16 และ DisplayPort 2.1a – พร้อมใช้งาน 16K 60Hz และ 8K 240Hz
- ขั้วต่อ 12V‑2x6 เสริมแรงพร้อมการตรวจสอบอุณหภูมิ/กระแสไฟฟ้า
Overview
How It Works
RTX 5090 Ti ขับเคลื่อนโดยสถาปัตยกรรม Blackwell Ultra ซึ่งเป็นการออกแบบใหม่ครั้งใหญ่ที่เพิ่มจำนวนคอร์ เพิ่มตัวกำหนดเวลา AI เฉพาะ และแนะนำ GDDR7 พร้อม ECC ในแพ็คเกจ นี่คือวิธีการทำงานทีละขั้นตอน:
Blackwell Ultra SM
ขณะนี้ SM แต่ละตัวมี 384 CUDA คอร์, 6 คอร์ RT และ 12 เทนเซอร์คอร์ ใหม่ รองรับ FP6 เพิ่มปริมาณงานการอนุมาน AI เป็นสามเท่าเมื่อเทียบกับ RTX 5090 ช่วยให้สามารถแทนที่วัสดุประสาทแบบเรียลไทม์ใน 8K
448‑bit GDDR7 Subsystem
หน่วยความจำ GDDR7 256 GB บนบัส 448 บิตทำงานที่ 36 Gbps – แบนด์วิดท์ทั้งหมด 2.5 TB/s แคช L3 ขนาด 256 MB ช่วยลดการรับส่งข้อมูลนอกชิป ในขณะที่ ECC ที่เร่งด้วยฮาร์ดแวร์ช่วยให้มั่นใจในความสมบูรณ์ของข้อมูลสำหรับการฝึกอบรม AI และการจำลองทางวิทยาศาสตร์
DLSS 4 Ultimate with Multi‑Frame Gen
DLSS 4 Ultimate สามารถสร้าง สูงสุด 4 เฟรมที่สอดแทรก ต่อเฟรมจริง Motion Transformer คาดการณ์วิถีการเคลื่อนที่ของวัตถุด้วยความแม่นยำสูงกว่าออปติคัลโฟลว์เอ็นจิ้นถึง 4 เท่า ซึ่งช่วยลดปัญหาภาพซ้อนและค่าหน่วงเวลาได้อย่างแท้จริง
Advanced Neural Rendering
Neural Radiance Caching 2.0 ฝึกโมเดล AI ต่อฉากแบบไดนามิกสำหรับการส่องสว่างทั่วโลก โดยนำตัวอย่างแสงกลับมาใช้ซ้ำได้สูงสุด 90% RTX Neural Materials Pro แทนที่เลเยอร์เชเดอร์ที่ซับซ้อนด้วยพื้นผิวที่สร้างโดย AI ซึ่งจะตอบสนองต่อแสงและมุมแบบเรียลไทม์
BVRM Power Delivery & Cooling
โมดูลควบคุมแรงดันไฟฟ้า Blackwell 28 เฟสให้การปรับแรงดันไฟฟ้าต่ำกว่ามิลลิวินาที ห้องไอน้ำแบบสามช่องใช้ อินเทอร์เฟซโลหะเหลวแบบเปลี่ยนเฟส และพัดลมแม่เหล็กลอยเพื่อกระจายกำลัง 600W ในขณะที่ยังคงเงียบกว่า RTX 5090
PCIe 6.0 & DisplayPort 2.1a
อินเทอร์เฟซ PCIe 6.0 x16 มีแบนด์วิดธ์แบบสองทิศทาง 256 GB/s (การส่งสัญญาณ PAM4) เอาต์พุต DisplayPort 2.1a สามช่องรองรับ 8K 240Hz หรือ 16K 60Hz ด้วย DSC ในขณะที่ HDMI 2.2 เพิ่มความลึกของสี 12 บิตและโหมดเกม VRR
Key Features
28,672 CUDA Cores
จำนวนคอร์ GPU สำหรับผู้บริโภคที่ใหญ่ที่สุดเท่าที่เคยมีมา – การแรสเตอร์แบบ brute-force ที่รองรับการเล่นเกมเนทิฟ 8K 144 Hz และการเรนเดอร์ 3D ที่ซับซ้อนโดยไม่ทำให้เหนื่อย
256 GB GDDR7 Memory
ความจุที่ไม่เคยมีมาก่อนสำหรับบัตรผู้บริโภค ฝึกฝน LLM พารามิเตอร์ 70B ในเครื่อง แก้ไขวิดีโอ RAW 8K 12 สตรีม หรือโหลดโลกของเกมทั้งหมดลงใน VRAM
DLSS 4 Ultimate (5× Frame Generation)
การสร้างเฟรมที่ขับเคลื่อนด้วย AI หม้อแปลงการเคลื่อนไหว และการเรนเดอร์แบบนิวรัลรวมกันเพื่อเพิ่มอัตราเฟรมสูงสุดถึง 5× โดยเปลี่ยน 30 fps ให้เป็น 150 fps ด้วยคุณภาพที่ใกล้เคียงดั้งเดิม
Triple‑Slot Vapor‑Chamber Cooler
แม้ว่าจะใช้ TDP ถึง 600W แต่ตัวทำความเย็นก็รักษาอุณหภูมิให้ต่ำกว่า 70°C ภายใต้ภาระงานเต็มที่ TIM โลหะเหลวและพัดลมลอยแบบแม่เหล็กช่วยลดเสียงรบกวนจากปั๊มและแบริ่ง
5th‑Gen RT Cores & Path Tracing
ประสิทธิภาพการติดตาม Ray เพิ่มขึ้นสองเท่าอีกครั้งเหนือ RTX 5090 การติดตามเส้นทาง เต็มรูปแบบใน Cyberpunk 2077 และ Alan Wake 2 ทำงานที่ 4K 120 fps พร้อมโหมดคุณภาพ DLSS
12V‑2x6 (675W Rated) Connector
ขั้วต่อ 12V‑2x6 เสริมมีการตรวจสอบอุณหภูมิและกระแสแบบเรียลไทม์ ซึ่งช่วยลดความเสี่ยงที่จะเกิดการหลอมละลาย พร้อมกลไกการล็อคที่ได้ยินเสียงคลิก
Blackwell Ultra Architecture Deep Dive
NVIDIA เพิ่ม AI และแบนด์วิดท์เป็นสองเท่าได้อย่างไร
Dual‑Issue CUDA Core Clusters
ขณะนี้ SM แต่ละแห่งสามารถออกคำสั่งแยกกันได้สองคำสั่งต่อหนึ่งนาฬิกา ซึ่งเพิ่มความคล้ายคลึงกันในระดับคำสั่งได้อย่างมีประสิทธิภาพ เมื่อใช้ร่วมกับ 384 CUDA core ต่อ SM ทำให้ 5090 Ti มอบประสิทธิภาพ 140 TFLOPS ของ FP32
Hierarchical Cache + L3 Victim Cache
แคช L2 ขนาด 256 MB ได้รับการเสริมด้วยแคชเหยื่อ L3 ขนาด 512 MB ที่เก็บบรรทัดที่ถูกขับไล่ ซึ่งจะช่วยลดการรับส่งข้อมูล GDDR7 ลงอีก 40% ทำให้แบนด์วิธที่มีประสิทธิภาพ 2.5 TB/s รู้สึกเหมือน 3.5 TB/s
AI‑Assisted Power Gating
โปรเซสเซอร์ร่วม AI เฉพาะคาดการณ์ขั้นตอนปริมาณงานและ Power Gates ที่ไม่ใช้งาน SM ใน 5 ns ซึ่งจะช่วยลดพลังงานที่ไม่ได้ใช้งานลง 70% และช่วยให้การ์ดเย็นในระหว่างการใช้งานเดสก์ท็อป
DLSS 4 Ultimate vs. Traditional Rendering
เหตุใดการสร้างเฟรม AI จึงแยกไม่ออกจากเนทีฟ
Motion Transformer Technology
แทนที่จะใช้โฟลว์ออปติคัลแบบธรรมดา DLSS 4 Ultimate ใช้เครือข่ายหม้อแปลงที่ฝึกกับเวกเตอร์การเคลื่อนที่ 10 ล้านตัว โดยคาดการณ์การเคลื่อนที่ต่อพิกเซลได้สูงสุดถึง 4 เฟรมข้างหน้า ซึ่งช่วยขจัดภาพซ้อนบนวัตถุที่เคลื่อนที่เร็ว
Temporal Neural Anti‑Aliasing (TNNA)
โครงข่ายประสาทเทียมแบบน้ำหนักเบามาแทนที่ TAA แบบเดิม สร้างรายละเอียดพิกเซลย่อยจากเฟรมก่อนหน้าขึ้นมาใหม่ ทำให้ได้คุณภาพของภาพที่เกิน 16× MSAA โดยที่ต้นทุนด้านประสิทธิภาพเป็นศูนย์
Neural Radiance Caching 2.0
ไดรเวอร์จะฝึกโมเดลการแพร่กระจายขนาดเล็กต่อระดับเกมเพื่อแคชข้อมูลการสุ่มตัวอย่างที่สดใสและมีความสำคัญ การติดตามเส้นทางที่เคยต้องใช้ 50 ตัวอย่างต่อพิกเซล ตอนนี้ดูสะอาดตาโดยมีเพียง 4 ตัวอย่าง – เพิ่มขึ้น 12 เท่า
Pros
- ✓คอร์ CUDA 28,672 คอร์ที่ไม่มีใครเทียบได้ และ VRAM 256 GB สำหรับเวิร์กโหลด AI และ 8K
- ✓DLSS 4 Ultimate สามารถเพิ่ม 30fps เป็น 150fps โดยมีเวลาแฝงน้อยที่สุด
- ✓PCIe 6.0 และ DisplayPort 2.1a รองรับอนาคตในอีก 5 ปีข้างหน้า
- ✓256GB GDDR7 ช่วยให้สามารถฝึกอบรม LLM ในพื้นที่ได้ (เช่น Llama 3 70B ที่มีความแม่นยำเต็มที่)
- ✓การระบายความร้อนด้วยพัดลมโลหะเหลว + maglev มีทั้งประสิทธิภาพและความเงียบสำหรับ 600W
- ✓เข้ากันได้กับเมนบอร์ด PCIe 4.0/5.0 ที่มีอยู่และเกมทั้งหมด
- ✓การเรนเดอร์แบบนิวรอลทำให้การติดตามเส้นทางสามารถเล่นได้ที่ 4K 120fps ในเกม AAA
Cons
- ✗แพงมากที่ 1,999 ดอลลาร์ MSRP - ราคาถนนที่คาดหวังอาจเกิน 2,500 ดอลลาร์
- ✗TDP 600W ต้องการพาวเวอร์ซัพพลายระดับพรีเมียม 1200W+ (แนะนำ ATX 3.1)
- ✗ขนาดช่องสามช่องอาจไม่พอดีกับเคสที่มีฟอร์มแฟคเตอร์ขนาดเล็กจำนวนมาก
- ✗VRAM ขนาด 256GB นั้นเกินความจำเป็นสำหรับเกมในปัจจุบัน ผลประโยชน์หลัก AI/มืออาชีพ
- ✗DLSS 4 Ultimate เป็นเอกสิทธิ์ของ Blackwell Ultra – การ์ดรุ่นเก่าไม่สามารถใช้ 5× frame gen
- ✗อุปทานมีจำกัดในช่วงเปิดตัวเนื่องจากบรรจุภัณฑ์ 3nm+ ที่ซับซ้อน
Use Cases
Technical Specifications
RTX 5090 Ti vs RTX 5090 vs RTX 4090
| Feature | rtx5090ti | rtx5090 | rtx4090 | |
|---|---|---|---|---|
| Architecture | Blackwell Ultra (3nm+) | Blackwell (3nm) | Ada Lovelace (5nm) | |
| CUDA Cores | 28,672 | 24,576 | 16,384 | |
| Memory | 256 GB GDDR7 | 192 GB GDDR7 | 24 GB GDDR6X | |
| Bandwidth | 2.5 TB/s | 2.1 TB/s | 1.0 TB/s | |
| TDP | 600W | 500W | 450W | |
| DLSS Version | DLSS 4 Ultimate (5× Frame Gen) | DLSS 4 (3× Frame Gen) | DLSS 3 (1× Frame Gen) | |
| Performance (Cyberpunk 2077 8K) | ~85 fps (Path Tracing + DLSS Ultra Perf) | ~55 fps | ~25 fps | |
| Price (MSRP) | $1,999 | $1,599 | $1,599 |
Setup Tips
Use Two Independent 12V‑2x6 Cables (If Possible)
แม้ว่าการ์ดจะใช้ขั้วต่อ 12V‑2x6 ตัวเดียว แต่ PSU บางตัวก็อนุญาตให้แยกได้ ใช้สายเคเบิลที่มีพิกัดสูงสุด (675W) และหลีกเลี่ยงการเชื่อมต่อแบบเดซี่เชนจากสายเคเบิล 12VHPWR รุ่นเก่า
Update BIOS for PCIe 6.0 Compatibility
เมนบอร์ดในอนาคตที่ใช้ PCIe 6.0 จะต้องมีการอัพเดต BIOS เพื่อเปิดใช้งานความเร็วลิงก์ 256 GB/s ในตอนนี้ ให้ตั้งค่าสล็อตเป็น PCIe 5.0 หรือ 4.0 ด้วยตนเอง หากคุณประสบปัญหาความไม่เสถียร
Provide Extra Airflow for the Backplate
แผ่นรองหลังของ 5090 Ti มีความร้อน (สูงถึง 85°C) เนื่องจากโมดูลหน่วยความจำด้านหลัง ติดตั้งพัดลมด้านข้างหรือตรวจสอบให้แน่ใจว่าเคสของคุณมีแรงดันเป็นบวกเพื่อทำให้บริเวณแผ่นรองหลังเย็นลง
Enable Resizable BAR and Above 4G Decoding
ตัวเลือก BIOS เหล่านี้จำเป็นสำหรับประสิทธิภาพ DLSS 4 Ultimate เต็มรูปแบบ บนมาเธอร์บอร์ดส่วนใหญ่ ยังปรับปรุงรูปแบบการเข้าถึงหน่วยความจำสำหรับเวิร์กโหลด AI อีกด้วย