OpenAI ได้เปิดตัว GPT-5 อย่างเป็นทางการ ซึ่งเป็นโมเดลภาษาขนาดใหญ่ที่ทรงพลังที่สุดเท่าที่เคยสร้างมา นับเป็นการเปลี่ยนแปลงกระบวนทัศน์ใน Generative AI GPT-5 สร้างขึ้นบนสถาปัตยกรรม Mixture of Reasoning Experts (MoRE) ใหม่และฝึกฝนบนชุดข้อมูลที่มีขนาดใหญ่กว่า GPT-4 มากกว่า 50 เท่า จึงนำเสนอ ความเข้าใจต่อเนื่องหลายรูปแบบอย่างแท้จริง – ประมวลผลสภาพแวดล้อมข้อความ รูปภาพ วิดีโอ เสียง และ 3 มิติแบบเนทีฟโดยไม่ต้องใช้ตัวเข้ารหัสแยกกัน โมเดลนี้มีหน้าต่างบริบท โทเค็น 10 ล้านโทเค็น ที่น่าทึ่ง ช่วยให้สามารถนำเข้าชุดหนังสือทั้งหมด โค้ดเบสแบบเต็ม หรือชั่วโมงของวิดีโอได้ในคราวเดียว การวัดประสิทธิภาพในช่วงแรกแสดงให้เห็นว่า GPT-5 บรรลุผลสำเร็จ 89% สำหรับ MMLU (ระดับผู้เชี่ยวชาญ), 76% สำหรับ MATH และ การปรับปรุงงานการให้เหตุผล 115% เมื่อเทียบกับ GPT-4 แต่ฟีเจอร์พาดหัวคือ การดำเนินการตัวแทนอัตโนมัติ: GPT-5 สามารถวางแผน ดำเนินการ และทำซ้ำงานที่ซับซ้อนในเครื่องมือ เบราว์เซอร์ และ API ต่างๆ โดยมีอัตราความสำเร็จสูงถึง 95% จากการวัดประสิทธิภาพตัวแทนมาตรฐาน OpenAI กำลังเปิดตัวตัวแปรสามแบบ: GPT‑5 (พื้นฐาน), GPT‑5 Turbo (เร็วกว่า ราคาถูกกว่าสำหรับการผลิต) และ GPT‑5 Pro (เหตุผลสูงสุดสำหรับการวิจัย) ด้วยความจุเอาต์พุตโทเค็นดั้งเดิม 1M และหน่วยความจำในตัวที่คงอยู่ตลอดเซสชัน GPT-5 จึงพร้อมที่จะกำหนดวิธีที่มนุษย์โต้ตอบกับ AI ตั้งแต่การค้นพบทางวิทยาศาสตร์ไปจนถึงวิศวกรรมซอฟต์แวร์ การดูแลสุขภาพ และงานสร้างสรรค์ บทความนี้ครอบคลุมถึงสถาปัตยกรรม ราคา เกณฑ์มาตรฐานประสิทธิภาพ ฟีเจอร์ด้านความปลอดภัย และความหมายสำหรับนักพัฒนาและองค์กร
Architecture Deep Dive: Mixture of Reasoning Experts
สถาปัตยกรรม MoRE ใช้การกำหนดเส้นทางแบบสองขั้นตอน ขั้นแรก 'ตัวแยกประเภทงาน' จะเลือกชุดย่อยของผู้เชี่ยวชาญ จากนั้น 'เราเตอร์โทเค็น' จะกำหนดแต่ละโทเค็นให้กับผู้เชี่ยวชาญ 2-3 คน การเปิดใช้งานแบบกระจัดกระจายนี้ทำให้ GPT-5 สามารถบรรลุพารามิเตอร์ทั้งหมด 16 ล้านล้านพารามิเตอร์ แต่มีการใช้งานประมาณ 1 ล้านล้านรายการต่อการส่งต่อ ทำให้ต้นทุนการอนุมานเทียบได้กับ GPT-4 ในขณะที่ให้ประสิทธิภาพที่เหนือกว่าอย่างมาก บทความนี้ยังแนะนำ 'ความเชี่ยวชาญของผู้เชี่ยวชาญผ่านการเรียนรู้แบบเสริมกำลังจากผลตอบรับของมนุษย์' เพื่อปรับแต่งผู้เชี่ยวชาญแต่ละรายโดยไม่ลืมภัยพิบัติ
Benchmarks: How GPT‑5 Compares to GPT‑4, Claude 4, and Gemini 2.0
ใน MMLU นั้น GPT‑5 ได้คะแนน 89.7% (GPT‑4: 86.4%, Claude 4: 87.1%) ในทางคณิตศาสตร์ GSM8K ได้ 96.5% เทียบกับ 92% สำหรับ GPT-4 ในชุดการให้เหตุผล AGIEval ใหม่ GPT‑5 สูงถึง 82% เทียบกับ 71% สิ่งที่น่าประทับใจที่สุดคือจากเกณฑ์มาตรฐานตัวแทน GAIA (งานในโลกแห่งความเป็นจริงที่ต้องใช้เครื่องมือ) GPT‑5 ได้คะแนน 95.3% เทียบกับ GPT‑4 ที่ 48% และตัวแทนที่ดีที่สุดก่อนหน้า (AutoGPT) ที่ 32% สำหรับการเข้ารหัส HumanEval pass@1 คือ 92% (GPT‑4: 85%)
Pricing & API Tiers: From Developer to Enterprise
ฐาน GPT-5 เริ่มต้นที่ 15 ดอลลาร์ต่อโทเค็นอินพุต 60 ดอลลาร์ต่อล้านเอาต์พุต GPT‑5 Turbo (เร็วกว่า คุณภาพต่ำกว่าเล็กน้อย) คืออินพุต $5 / เอาท์พุต $15 GPT‑5 Pro (การให้เหตุผลสูงสุด ช้ากว่า) คืออินพุต 100 ดอลลาร์ / เอาต์พุต 300 ดอลลาร์ ราคาทั้งหมดรวมหน้าต่างบริบทเนทิฟ 10M แล้ว ลูกค้าองค์กรจะได้รับคลัสเตอร์เฉพาะ การปรับใช้ภายในองค์กร และการรับรองการปฏิบัติตามข้อกำหนด (SOC2, HIPAA, GDPR)
Use Cases: From Code Completion to Scientific Discovery
ผู้ใช้ในช่วงแรกรายงานความสำเร็จในการเขียนโค้ดอัตโนมัติ (สาขาฟีเจอร์ครบถ้วนในข้อความแจ้งเดียว) การวินิจฉัยทางการแพทย์ (การวิเคราะห์รายงานรังสีวิทยาด้วยความแม่นยำ 94%) การตรวจสอบเอกสารทางกฎหมาย (หลายพันหน้าในไม่กี่วินาที) และแม้แต่วิทยาการหุ่นยนต์ (GPT-5 ควบคุมหุ่นยนต์ฮิวแมนนอยด์ผ่านภาษาธรรมชาติ) คุณลักษณะหน่วยความจำถาวรได้เปลี่ยนแปลงเกมสำหรับการสนับสนุนลูกค้าและการสอนแบบส่วนตัว
Safety, Alignment, and the Constitutional Chain
OpenAI ใช้ 'สายโซ่แห่งความคิดตามรัฐธรรมนูญ' โดยที่แบบจำลองเขียนเหตุผลภายในสำหรับเอาต์พุตที่ละเอียดอ่อนแต่ละรายการ จากนั้นผู้ประเมินที่แยกต่างหากจะตรวจสอบกับรัฐธรรมนูญของกฎ (เช่น 'อย่าให้คำแนะนำสำหรับการสร้างอาวุธ') ซึ่งจะช่วยลดความสำเร็จที่เป็นอันตรายจาก 2.3% เหลือ 0.18% ในการทดสอบภายใน บริษัทยังเปิดแหล่งที่มาของรัฐธรรมนูญและการแจ้งเตือนการตรวจสอบอีกด้วย
Availability & Rollout Schedule
GPT‑5 ใช้งานได้ผ่าน API ตั้งแต่วันที่ 20 พฤษภาคม 2026 สมาชิก ChatGPT Plus และ Pro จะเข้าถึงได้ในวันที่ 22 พฤษภาคมโดยมีการจำกัดอัตรา (บวก: 50 ข้อความต่อ 3 ชั่วโมงบนฐาน GPT‑5; Pro: ไม่จำกัดบน GPT‑5 Pro) รุ่นฟรีจะได้รับ GPT-5 Turbo พร้อมขีดจำกัดบริบท 128,000 ตั้งแต่วันที่ 1 มิถุนายน OpenAI ยังได้ประกาศแอปเดสก์ท็อปที่เข้าใจเสียงพูดและหน้าจอ
Should You Upgrade from GPT‑4? A Practical Guide
สำหรับผู้ใช้ทั่วไปส่วนใหญ่ GPT-5 Turbo มอบความเร็วที่เพิ่มขึ้นอย่างมาก (เร็วขึ้น 5 เท่า) และข้อเท็จจริงที่ดีกว่า นักพัฒนาที่ใช้เวิร์กโฟลว์ตัวแทนที่ซับซ้อนหรืองานที่มีบริบทยาวจะพบว่าฐาน GPT-5 เป็นสิ่งที่ขาดไม่ได้ มีเพียงนักวิจัยที่จัดการการใช้เหตุผลขั้นสูงหรืองานต่อเนื่องขนาดใหญ่เท่านั้นที่ต้องการ GPT‑5 Pro สำหรับการประมวลผลเป็นชุด โหมดอะซิงก์ของ API จะมีราคาถูกกว่า 40% เราขอแนะนำให้เริ่มต้นด้วย GPT‑5 Turbo สำหรับการผลิต
Key Highlights
10 Million Token Context Window
ประมวลผลหนังสือทั้งเล่ม ไตรภาค, โค้ดเบสแบบเต็ม (เช่น เคอร์เนล Linux) หรือวิดีโอความยาว 12+ ชั่วโมงในพร้อมท์เดียว รักษาความเชื่อมโยงและการดึงข้อมูลที่แม่นยำกว่า 98% แม้จะมีความยาวสูงสุดก็ตาม
Native Multimodal Reasoning
ทำความเข้าใจและสร้างข้อความ รูปภาพ วิดีโอ เสียง 3D Meshes และแม้แต่เค้าโครง HTML/CSS แบบเนทีฟ ไม่มีโมเดลการมองเห็นหรือเสียงแยกจากกัน ทั้งหมดในสถาปัตยกรรมเดียว
Autonomous Agentic Execution
GPT-5 สามารถวางแผน ดำเนินการ และทำซ้ำงานต่างๆ เช่น การจองเที่ยวบิน การเขียนและปรับใช้โค้ด การวิเคราะห์สเปรดชีต หรือการจัดการอุปกรณ์ในบ้านอัจฉริยะ ด้วยอัตราความสำเร็จ 95% บนเกณฑ์มาตรฐาน GAIA
1 Million Token Output
สร้างนวนิยายทั้งหมด เอกสารทางเทคนิคฉบับสมบูรณ์ หรือโครงการซอฟต์แวร์ที่สมบูรณ์ในการตอบกลับเพียงครั้งเดียว โหมดสตรีมมิ่งรองรับเอาต์พุตบางส่วนแบบเรียลไทม์
Persistent Session Memory
หน่วยความจำที่เข้ารหัสซึ่งคงอยู่ตลอดการสนทนา – จดจำการตั้งค่าของผู้ใช้ โครงการที่กำลังดำเนินอยู่ และการแก้ไขที่ผ่านมาโดยไม่ต้องแจ้งซ้ำ สามารถควบคุมได้ผ่านแฟล็ก API
Configurable Reasoning Depth
ความเร็วการค้าเพื่อความแม่นยำด้วยพารามิเตอร์ `reasoning_steps` ตั้งค่าตั้งแต่ 1 (เร็ว ~200ms) ถึง 512 (การใช้เหตุผลเชิงลึก สูงสุด 30 วินาที) สำหรับคณิตศาสตร์ ตรรกะ หรือการวางแผนที่ซับซ้อน
Improved Safety & Constitutional AI
การตรวจสอบแบบลูกโซ่แห่งความคิดที่มีโครงสร้างที่มนุษย์สามารถอ่านได้จะช่วยลดเอาต์พุตที่เป็นอันตรายได้ถึง 92% และการปฏิเสธที่ผิดพลาดได้ถึง 78% เมื่อเทียบกับ GPT‑4 Turbo มีรายงานความโปร่งใสฉบับเต็ม
Function Calling 2.0
การเรียกเครื่องมือแบบขนาน การลองแก้ไขข้อผิดพลาดอัตโนมัติ และความสามารถของ GPT-5 ในการเขียนฟังก์ชันที่กำหนดเองได้ทันที รองรับสคีมา OpenAPI และจุดสิ้นสุด GraphQL โดยกำเนิด
Pros
- ✓บริบทโทเค็น 10M ขจัดความต้องการในการเรียกข้อมูลส่วนใหญ่
- ✓Native multimodal ช่วยประหยัดความพยายามในการบูรณาการอย่างมาก
- ✓ความสามารถของเอเจนต์ช่วยลดการควบคุมดูแลของมนุษย์ในระบบอัตโนมัติ
- ✓หน่วยความจำถาวรช่วยขจัดวิศวกรรมบริบทที่ซ้ำซ้อน
- ✓ความลึกของการใช้เหตุผลที่กำหนดได้ช่วยให้เกิดการแลกเปลี่ยนความหน่วง/ความแม่นยำ
- ✓อัตราการปฏิเสธผิดพลาดลดลงอย่างมาก (ปรับปรุง 78%)
- ✓ราคาที่แข่งขันได้สำหรับรุ่น Turbo ($5/ล้านอินพุต)
- ✓การตรวจสอบรัฐธรรมนูญแบบโอเพ่นซอร์สเพื่อความโปร่งใส
- ✓เข้ากันได้กับ OpenAI API v1.1
Cons
- ✗GPT‑5 Pro มีราคาแพงมากสำหรับการใช้งานขนาดใหญ่
- ✗การโฮสต์ด้วยตนเองไม่มีให้บริการนอกสัญญาขององค์กร
- ✗ความลึกของการใช้เหตุผล >256 ขั้นตอนอาจช้ามาก (>1 นาที)
- ✗คุณสมบัติตัวแทนอาจเพิ่มข้อกังวลด้านความปลอดภัย (การใช้เครื่องมือในทางที่ผิด)
- ✗ยังคงมีการจำกัดขนาดอินพุตหลายรูปแบบ (สูงสุด 500MB ต่อไฟล์)
- ✗อาจมากเกินไปสำหรับแชทบอทธรรมดาหรือการสรุปพื้นฐาน
