Table of Contents

GPT-5 for developer: ความสามารถ โค้ดดิ้ง และฟีเจอร์ใหม่ล่าสุด

Facebook
X
LinkedIn
GPT-5 for developers

เรากำลังเปิดตัว GPT-5 ในแพลตฟอร์ม API ของเรา ซึ่งเป็นโมเดลที่ทรงประสิทธิภาพที่สุดสำหรับงานโค้ดดิ้งและงานเชิงตัวแทน (agentic tasks) ที่เคยมีมา โมเดลนี้ทำลายสถิติใหม่ด้วยผลคะแนน 74.9% ใน SWE-bench Verified และ 88% ใน Aider Polyglot โดยโดดเด่นในด้านการแก้บั๊ก การแก้ไขโค้ด การตอบคำถามเกี่ยวกับฐานโค้ดที่ซับซ้อน และการพัฒนาเว็บฝั่งหน้า (front-end) ซึ่งได้รับความนิยมมากกว่า o3 ถึง 70% ในการทดสอบต่าง ๆ ออกแบบมาเพื่อเป็นคู่หูที่ทำงานร่วมกันและปรับเปลี่ยนได้ตามคำสั่ง GPT-5 สามารถปฏิบัติตามคำสั่งอย่างแม่นยำ อธิบายตรรกะระหว่างการเรียกใช้เครื่องมือ และจัดการเวิร์กโฟลว์ที่ใช้เวลานานได้อย่างน่าเชื่อถือเป็นพิเศษ 

ผู้ใช้กลุ่มแรกต่างยกย่อง GPT-5 ว่าเป็น “โมเดลที่ฉลาดที่สุด” พร้อมชื่นชมความแม่นยำในการเรียกใช้เครื่องมือ ตรรกะที่ซับซ้อน และการตอบสนองอย่างรวดเร็ว โดยเฉพาะในโหมด reasoning ต่ำ บน τ2-bench สำหรับโทรคมนาคม GPT-5 ทำคะแนนได้ 96.7% สามารถเชื่อมโยงการเรียกใช้เครื่องมือแบบต่อเนื่องหรือขนานหลายสิบครั้งโดยไม่หลงลืมสถานะ และโดดเด่นในการจัดการข้อผิดพลาดและการเรียกคืนข้อมูลบริบทยาว 

API มีฟีเจอร์ใหม่สำหรับนักพัฒนา ได้แก่: 

  • Verbosity (ต่ำ กลาง สูง) เพื่อจัดการความยาวของคำตอบ 
  • Reasoning_effort พร้อมค่า minimal สำหรับคำตอบที่รวดเร็วขึ้น 
  • Custom tools ที่รองรับการเรียกใช้แบบข้อความธรรมดาและข้อจำกัดทางไวยากรณ์ 

GPT-5 พร้อมให้ใช้งานในรูปแบบ gpt-5, gpt-5-mini และ gpt-5-nano ซึ่งมีการแลกเปลี่ยนระหว่างประสิทธิภาพ ค่าใช้จ่าย และความหน่วงเวลา เวอร์ชัน API จะรันโมเดล reasoning เต็มรูปแบบ ปรับแต่งเพื่อประสิทธิภาพสูงสุด แตกต่างจากเวอร์ชัน ChatGPT ที่ไม่เน้น reasoning (gpt-5-chat-latest)

แนะนำ GPT-5 for developers 

Coding 

coding

GPT-5 ทำคะแนนได้เหนือกว่า o3 ในหลายการทดสอบและการใช้งานจริง บน SWE-bench Verified ได้คะแนน 74.9% (ลดการใช้โทเคน 22% และลดการเรียกใช้เครื่องมือ 45%) และบน Aider Polyglot ทำคะแนนสูงสุดที่ 88% ลดอัตราความผิดพลาดลงถึงหนึ่งในสาม โดย GPT-5 โดดเด่นในการนำทางฐานโค้ดที่ซับซ้อนขนาดใหญ่ ช่วยเร่งกระบวนการทำงานของนักพัฒนาได้อย่างมาก

Aider polyglot

Frontend Engineering 

เมื่อสร้างอินเทอร์เฟซเว็บแอป GPT-5 สร้างโค้ดที่สะอาดกว่า มีความทะเยอทะยาน และมีความสอดคล้องทางสายตามากกว่า ในการทดสอบแบบเทียบเคียงกัน นักพัฒนามักเลือกผลงานของ GPT-5 ถึง 70% เมื่อเทียบกับ o3

นี่คือตัวอย่างที่น่าสนุกและคัดสรรมาอย่างดีของสิ่งที่ GPT-5 สามารถสร้างได้จากคำสั่งเพียงคำเดียว:

Espresso Lab website

Prompt: Please generate a beautiful, realistic landing page for a service that provides the ultimate coffee enthusiast a $200/month subscription that provides equipment rental and coaching for coffee roasting and creating the ultimate espresso. The target audience is a bay area middle-aged person who might work in tech and is educated, has disposable income, and is passionate about the art and science of coffee. Optimize for conversion for a 6 month signup. 

Audio step sequencer app

Prompt: Create a single-page app in a single HTML file with following requirements: 

Name: Audio Step Sequencer 
Stack: WebAudio API. 
Goal: 16-step drum grid. 
Features: Tempo, swing, patterns save/load, export WAV (render simple buffer). 
The UI should be futuristic and make the play fun! 

Outer space game

Prompt: Make a 2d space game, in which I can fly a ship, avoid and blow up asteroids, and dogfight with other computer-controlled AI. Be creative with the design of the ships. Ensure the gameplay works and is fun. Output code in a single next.js page.tsx file, which can be pasted directly into a next.js app created by create-next-app, alongside any context or instructions needed to run it. 

ดูตัวอย่างเพิ่มเติมของ GPT‑5 ได้ในแกลเลอรีของเราที่นี่ : Gallery

Coding Collaboration 

GPT‑5 เป็นคู่หูที่แข็งแกร่งขึ้น โดยเฉพาะในเครื่องมือโค้ดดิ้งเชิงตัวแทน (agentic coding tools) เช่น Cursor, Windsurf, GitHub Copilot และ Codex CLI มันสามารถทำงานที่ซับซ้อนได้โดยไม่ต้องรอการอนุมัติ พร้อมทั้งให้แผนงาน อัปเดต และสรุปผลระหว่างการเรียกใช้เครื่องมือต่าง

Agentic Tasks 

นอกจากงานโค้ดดิ้งแล้ว GPT‑5 ยังโดดเด่นในงานเชิงตัวแทนโดยรวม ทำลายสถิติใหม่ในการติดตามคำสั่ง (69.6% บน Scale MultiChallenge) และการเรียกใช้เครื่องมือ (96.7% บน τ2-bench telecom) ความฉลาดของเครื่องมือที่ได้รับการปรับปรุงช่วยให้ GPT‑5 สามารถเชื่อมโยงหลายขั้นตอนเพื่อทำงานจริงได้อย่างแม่นยำ

 

Instruction Following 

COLLIE, Scale MultiChallenge, and our internal instruction

GPT‑5 ทำงานได้ดีกว่าโมเดลก่อนหน้าในการปฏิบัติตามคำสั่งที่ซับซ้อน โดยทำคะแนนสูงในหลายเกณฑ์ เช่น COLLIE, Scale MultiChallenge และการประเมินภายในของ OpenAI มันเข้าใจการสนทนาหลายรอบและสามารถปฏิบัติตามข้อจำกัดที่ท้าทายได้อย่างแม่นยำ

 

Tool Calling 

τ2-bench

เราได้พัฒนาความสามารถในการเรียกใช้เครื่องมือของ GPT‑5 ให้สามารถปฏิบัติตามคำสั่ง จัดการข้อผิดพลาด และเรียกใช้เครื่องมือหลายตัวต่อเนื่องหรือแบบขนานได้อย่างราบรื่น นอกจากนี้ยังสามารถให้ข้อมูลความคืบหน้าในระหว่างงานที่ยาวนานได้ 

บนเกณฑ์ทดสอบ τ2-bench telecom ที่โมเดลก่อนหน้านี้ทำคะแนนเกิน 49% ไม่ได้ GPT‑5 ทำได้ถึง 97% และยังปรับปรุงประสิทธิภาพบริบทยาว (long-context) โดยเหนือกว่า o3 และ GPT‑4.1 บน OpenAI-MRCR โดยเฉพาะในอินพุตขนาดใหญ่ (สูงสุด 256k tokens) 

นอกจากนี้ GPT‑5 ยังทำคะแนนความถูกต้อง 89% บน BrowseComp Long Context benchmark สำหรับ Q&A กับรายการผลการค้นหายาวและสมจริง 

โมเดล GPT‑5 API ทั้งหมดรองรับอินพุตสูงสุด 272,000 tokens และเอาต์พุตสูงสุด 128,000 tokens ทำให้มีบริบทรวมสูงสุดถึง 400,000 tokens 

OpenAI MRCR, long context

Factuality 

Factuality

GPT‑5 มีความน่าเชื่อถือมากขึ้น ทำข้อผิดพลาดด้านข้อเท็จจริงลดลงประมาณ 80% เมื่อเทียบกับ o3 บนเกณฑ์ LongFact และ FactScore ทำให้เหมาะอย่างยิ่งสำหรับงานที่ต้องการความแม่นยำ เช่น โค้ดดิ้ง การจัดการข้อมูล และการตัดสินใจ 

โมเดลถูกฝึกให้ตระหนักถึงข้อจำกัดของตัวเองและจัดการอินพุตที่ไม่คาดคิดได้ดีขึ้น นอกจากนี้ยังปรับปรุงความแม่นยำในคำถามเกี่ยวกับสุขภาพด้วย ดังนั้นควรตรวจสอบผลลัพธ์ที่สำคัญเมื่อความเสี่ยงสูง

New Features 

Minimal reasoning effort 

New features

นักพัฒนาสามารถควบคุมเวลาคิดของ GPT‑5 ผ่านพารามิเตอร์ reasoning_effort นอกจากค่าต่ำ กลาง (ค่าเริ่มต้น) และสูง GPT‑5 ยังรองรับ minimal เพื่อลดการ reasoning และให้คำตอบรวดเร็วขึ้น ค่าที่สูงขึ้นเพิ่มคุณภาพ ค่าต่ำเพิ่มความเร็ว เราแนะนำให้ทดลองใช้งานเพื่อหาค่าที่เหมาะสมกับแต่ละงาน เช่น การ reasoning เพิ่มขึ้นเล็กน้อยสำหรับงานเรียกคืนง่าย แต่ช่วยงานซับซ้อนอย่าง visual reasoning benchmark

Verbosity 

Verbosity

พารามิเตอร์ verbosity ใหม่ใช้ควบคุมความยาวคำตอบเริ่มต้น โดยมีค่าต่ำ กลาง (ค่าเริ่มต้น) และสูง คำสั่งเฉพาะจะมีผลเหนือกว่าพารามิเตอร์ เช่นเขียนเรียงความ 5 ย่อหน้าจะได้ 5 ย่อหน้าเสมอ แต่ความยาวย่อหน้าอาจปรับตาม verbosity

Preamble messages before tool calls 

เมื่อเปิดใช้งาน GPT‑5 จะแสดงข้อความก่อนและระหว่างการเรียกใช้เครื่องมือ เพื่อสื่อสารแผนงานและความคืบหน้าให้ผู้ใช้เห็น เพิ่มความโปร่งใสในงานยาว

Custom tools 

GPT‑5 รองรับเครื่องมือชนิดใหม่ที่เรียกใช้แบบ plaintext แทน JSON นักพัฒนาสามารถจำกัดรูปแบบอินพุตด้วย regex หรือ context-free grammar เพื่อลดข้อผิดพลาดจากตัวอักษรพิเศษในเอาต์พุต JSON ขนาดใหญ่ ทำให้มีความน่าเชื่อถือสูงขึ้น บน SWE-bench Verified ผลลัพธ์เทียบเท่าการใช้ JSON

Safety 

GPT‑5 ปลอดภัยและเชื่อถือได้มากขึ้น ลดการ hallucinates อย่างมาก และสื่อสารความสามารถของตัวเองอย่างตรงไปตรงมา มุ่งให้คำตอบที่เป็นประโยชน์และแม่นยำที่สุดในขณะที่ปฏิบัติตามแนวทางความปลอดภัย

Availability & Pricing 

GPT‑5 มีให้ใช้งานแล้วใน 3 ขนาด: gpt-5, gpt-5-mini, และ gpt-5-nano ผ่าน Responses API, Chat Completions API และ Codex CLI 
ราคาดังนี้:

  • GPT‑5: $1.25 ต่อ 1M input tokens, $10 ต่อ 1M output tokens 
  • GPT‑5 mini: $0.25 ต่อ 1M input tokens, $2 ต่อ 1M output tokens 
  • GPT‑5 nano: $0.05 ต่อ 1M input tokens, $0.40 ต่อ 1M output tokens 

รองรับ reasoning_effort, verbosity, custom tools, การเรียกใช้เครื่องมือแบบขนาน, เครื่องมือ built-in (ค้นหาเว็บ, ค้นหาไฟล์, สร้างภาพ ฯลฯ) และฟีเจอร์ลดค่าใช้จ่าย เช่น prompt caching และ Batch API 

เวอร์ชัน ChatGPT ที่ไม่เน้น reasoning มีให้ใช้งานเป็น gpt-5-chat-latest ในราคาของ GPT‑5 

GPT‑5 ยังเปิดตัวบนผลิตภัณฑ์ของ Microsoft เช่น Microsoft 365 Copilot, GitHub Copilot และ Azure AI Foundry 

Check out the GPT‑5 documentation⁠(opens in a new window), pricing details⁠(opens in a new window), and prompting guide⁠(opens in a new window) to get started. 

สนใจผลิตภัณฑ์และบริการของ Microsoft หรือไม่ ส่งข้อความถึงเราที่นี่

สำรวจเครื่องมือดิจิทัลของเรา

หากคุณสนใจในการนำระบบจัดการความรู้มาใช้ในองค์กรของคุณ ติดต่อ SeedKM เพื่อขอข้อมูลเพิ่มเติมเกี่ยวกับระบบจัดการความรู้ภายในองค์กร หรือสำรวจผลิตภัณฑ์อื่นๆ เช่น Jarviz สำหรับการบันทึกเวลาทำงานออนไลน์, OPTIMISTIC สำหรับการจัดการบุคลากร HRM-Payroll, Veracity สำหรับการเซ็นเอกสารดิจิทัล, และ CloudAccount สำหรับการบัญชีออนไลน์

อ่านบทความเพิ่มเติมเกี่ยวกับระบบจัดการความรู้และเครื่องมือการจัดการอื่นๆ ได้ที่ Fusionsol BlogIP Phone BlogChat Framework Blog, และ OpenAI Blog.

New Gemini Tools For Educators: Empowering Teaching with AI 

ถ้าอยากติดตามข่าวเทคโนโลยีและข่าว AI ที่กำลังเป็นกระแสทุกวัน ลองเข้าไปดูที่ เว็บไซต์นี้ มีอัปเดตใหม่ๆ ให้ตามทุกวันเลย!

Fusionsol Blog in Vietnamese

Related Articles

Frequently Asked Questions (FAQ)

AI agent คือระบบอัจฉริยะที่สามารถรับข้อมูลจากสิ่งแวดล้อม ประมวลผล และตัดสินใจดำเนินการโดยอัตโนมัติ ซึ่งในบริบทของงานบริการลูกค้า AI agent มักทำหน้าที่เป็นผู้ช่วยเสมือน แชทบอท หรือระบบตอบกลับอัตโนมัติ

AI agent ใช้เทคโนโลยีปัญญาประดิษฐ์ขั้นสูง เช่น machine learning และ natural language processing เพื่อให้สามารถวิเคราะห์ พูดคุย และเรียนรู้จากข้อมูลได้ดีกว่าแชทบอททั่วไปที่ทำงานตามสคริปต์เท่านั้น

ธุรกิจทุกประเภทที่มีการให้บริการลูกค้า เช่น ค้าปลีก การเงิน การศึกษา หรือสาธารณสุข ล้วนสามารถใช้ AI agent เพื่อเพิ่มประสิทธิภาพในการให้บริการ ลดภาระงานของเจ้าหน้าที่ และยกระดับประสบการณ์ลูกค้า

ได้ AI agent สามารถเรียนรู้จากข้อมูลในอดีต การโต้ตอบกับผู้ใช้ และบริบทการใช้งาน เพื่อปรับปรุงความแม่นยำในการให้บริการอย่างต่อเนื่อง

AI agent ที่รวมอยู่ในแพลตฟอร์มเช่น Microsoft Dynamics 365 ได้รับการออกแบบให้ปลอดภัย มีการป้องกันข้อมูลตามมาตรฐานองค์กร และสามารถกำหนดขอบเขตการเข้าถึงข้อมูลเพื่อความเป็นส่วนตัว

Facebook
X
LinkedIn

Popular Blog posts