Table of Contents

Computer-using Agents: Microsoft ก้าวเข้าสู่ยุคของ Autonomous AI Workflows

Facebook
X
LinkedIn
Computer-using agents in Microsoft Copilot Studio

Microsoft Copilot Studio ได้เปิดให้ใช้งานความสามารถ Computer-using Agents อย่างเป็นทางการในระดับ General Availability แล้ว ซึ่งถือเป็นอีกก้าวสำคัญในวิสัยทัศน์ด้าน Agentic AI ของ Microsoft สำหรับองค์กร

การเปิดตัวครั้งนี้สะท้อนถึงการเปลี่ยนแปลงครั้งสำคัญที่กำลังเกิดขึ้นในอุตสาหกรรม AI ปัจจุบัน AI ไม่ได้จำกัดอยู่แค่การสร้างข้อความ สรุปข้อมูล หรือการตอบคำถามอีกต่อไป แต่กำลังก้าวสู่การโต้ตอบกับซอฟต์แวร์โดยตรง ทำงานแบบหลายขั้นตอน และใช้งานแอปพลิเคชันได้ในลักษณะเดียวกับพนักงานจริง

ด้วย Computer-using Agents ทาง Microsoft กำลังผลักดัน AI จาก “ผู้ช่วย” ไปสู่ “ผู้ลงมือทำงานจริง”

Computer-using Agents คืออะไร?

Computer-using Agents คือ AI Agent ที่สามารถโต้ตอบกับ Graphical User Interfaces (GUIs) ได้ เช่น เว็บไซต์ แอปพลิเคชันบนเดสก์ท็อป ระบบภายในองค์กร และซอฟต์แวร์แบบ Legacy ต่าง ๆ โดยแทนที่จะพึ่งพาเฉพาะ APIs หรือการเชื่อมต่อแบบกำหนดเอง Agent สามารถใช้งานซอฟต์แวร์ผ่านการมองเห็นหน้าจอเสมือนจริง ด้วย virtual mouse และ keyboard

ระบบนี้ผสานการทำงานของ:

  • Computer vision
  • Reasoning models
  • Workflow orchestration
  • Natural language instructions

สิ่งนี้ทำให้องค์กรสามารถอธิบายงานด้วยภาษาธรรมชาติ ในขณะที่ AI Agent จะเป็นผู้ดำเนินงานเชิงปฏิบัติการด้วยตัวเอง

Microsoft อธิบายว่าเทคโนโลยีนี้สามารถกดปุ่ม เลือกเมนู กรอกฟอร์ม ดึงข้อมูล และนำทางภายในแอปพลิเคชันได้ในลักษณะเดียวกับพนักงานมนุษย์

หนึ่งในจุดสำคัญที่สุดของแนวทางนี้คือ “ความยืดหยุ่น” เนื่องจาก Agent ทำงานผ่านชั้น Interface แบบ Visual จึงยังสามารถทำงานได้แม้ไม่มี API หรือในกรณีที่เป็นแอปพลิเคชัน Legacy รุ่นเก่า

Computer-using Agents

ก้าวข้าม Traditional Automation

ระบบ Robotic Process Automation (RPA) แบบดั้งเดิมมักต้องอาศัย Workflow ที่มีโครงสร้างตายตัว และสามารถล้มเหลวได้ง่ายเมื่อหน้าตา Interface เปลี่ยนแปลง

การเปลี่ยนแปลงเล็กน้อย เช่น Layout ใหม่ ปุ่มถูกเปลี่ยนชื่อ หรือเมนูย้ายตำแหน่ง มักทำให้ต้องกลับมา Configure ระบบใหม่อีกครั้ง

Computer-using Agents ถูกพัฒนาขึ้นมาเพื่อลดข้อจำกัดเหล่านี้

Microsoft ระบุว่า AI Model สามารถปรับตัวตามการเปลี่ยนแปลงของ Interface ได้แบบ Dynamic และยังทำงานต่อได้แม้ Layout หรือปุ่มจะเปลี่ยนตำแหน่ง ทำให้ระบบมีความยืดหยุ่นสูงกว่าเครื่องมือ Automation แบบเดิมจำนวนมาก

ความสามารถนี้ยังช่วยลดอุปสรรคด้านเทคนิคสำหรับการทำ Automation อีกด้วย แทนที่จะต้องสร้าง Workflow ผ่าน Code หรือ Scripting ที่ซับซ้อน ผู้ใช้สามารถอธิบายผลลัพธ์ที่ต้องการด้วยภาษาธรรมชาติได้โดยตรง

สิ่งนี้ถือเป็นวิวัฒนาการครั้งสำคัญ จากระบบที่เน้น Automation ไปสู่ระบบที่ขับเคลื่อนด้วย Intelligence ในการดำเนิน Workflow จริง

ออกแบบมาสำหรับ Enterprise Workflows จริง

Microsoft วางตำแหน่งให้ Computer-using Agents เหมาะอย่างยิ่งสำหรับงานเชิงปฏิบัติการที่ทำซ้ำและใช้เวลาของพนักงานจำนวนมาก

ตัวอย่างการใช้งาน เช่น:

  • Automated data entry
  • Invoice processing
  • Information extraction
  • Cross-system updates
  • Web portal interactions
  • Legacy application workflows

เนื่องจาก AI Agent สามารถโต้ตอบได้ทั้งเว็บไซต์และแอปพลิเคชันเดสก์ท็อป องค์กรจึงสามารถทำ Automation ได้แม้ระบบต่าง ๆ จะไม่ได้เชื่อมต่อกันโดยตรง

สิ่งนี้มีความสำคัญอย่างมากสำหรับองค์กรขนาดใหญ่ที่ยังคงพึ่งพาระบบซอฟต์แวร์ Legacy จำนวนมาก ซึ่งเดิมไม่ได้ถูกออกแบบมาให้รองรับการเชื่อมต่อกับ AI โดยตรง

Architecture of Graebel’s Power Automate flow and custom Service Order agent

ส่วนหนึ่งของกลยุทธ์ Agentic AI ขนาดใหญ่ของ Microsoft

การเปิดตัว Computer-using Agents สอดคล้องอย่างใกล้ชิดกับระบบนิเวศ Agentic AI ของ Microsoft ที่กำลังขยายตัวอย่างรวดเร็ว

ในช่วงหลายเดือนที่ผ่านมา Microsoft ได้เปิดตัว:

  • Agent 365 สำหรับ AI governance
  • Copilot Cowork สำหรับการทำงาน AI แบบหลายขั้นตอน
  • AI workflows ภายใน Microsoft 365
  • ความสามารถ orchestration ที่ขยายเพิ่มใน Copilot Studio

เมื่อรวมกัน เทคโนโลยีเหล่านี้สะท้อนถึงวิสัยทัศน์ที่ใหญ่ขึ้นของ Microsoft ซึ่ง AI จะเปลี่ยนจากผู้ช่วยแบบ Passive ไปสู่ผู้ร่วมงานอัตโนมัติที่สามารถทำงานต่อเนื่องภายในสภาพแวดล้อมขององค์กร

แทนที่จะรอรับคำสั่งโดยตรง AI Agent ในอนาคตจะถูกคาดหวังให้สามารถ:

  • เข้าใจ Workflows
  • ประสานงานข้ามระบบต่าง ๆ
  • ดำเนินงานเชิงปฏิบัติการ
  • มีส่วนร่วมใน Business Processes แบบอัตโนมัติ

Computer-using Agents คือหนึ่งในองค์ประกอบสำคัญของวิสัยทัศน์นี้

ทำไมสิ่งนี้จึงสำคัญสำหรับธุรกิจ

สำหรับหลายองค์กร หนึ่งในอุปสรรคสำคัญที่สุดของการนำ AI มาใช้งานคือ “ความซับซ้อนของการเชื่อมต่อระบบ”

แม้แพลตฟอร์ม SaaS สมัยใหม่จำนวนมากจะมี APIs ให้ใช้งาน แต่หลายธุรกิจยังคงพึ่งพา:

  • ระบบ Legacy ERP
  • แอปพลิเคชันเดสก์ท็อปภายในองค์กร
  • ซอฟต์แวร์เฉพาะทางในแต่ละอุตสาหกรรม
  • เครื่องมือปฏิบัติการรุ่นเก่าที่ไม่รองรับ Modern Integration

Computer-using Agents ช่วยลดความจำเป็นในการทำ Technical Integration เชิงลึก ด้วยการให้ AI โต้ตอบผ่าน User Interface โดยตรง

สิ่งนี้อาจช่วยเร่งการทำ Enterprise Automation ได้อย่างมาก พร้อมทั้งลดภาระด้านการพัฒนา

นอกจากนี้ยังเปิดโอกาสให้การทำ Automation ขยายออกไปนอกทีม IT เพราะ Workflow สามารถอธิบายด้วยภาษาธรรมชาติได้ ทำให้ผู้ใช้งานฝั่งธุรกิจอาจสามารถทำ Automation งานปฏิบัติการได้โดยไม่จำเป็นต้องมีความเชี่ยวชาญด้าน Coding มากนัก

Security และ Governance จะยิ่งมีความสำคัญมากขึ้น

เมื่อ AI Agent เริ่มมีความสามารถในการใช้งานสภาพแวดล้อมของซอฟต์แวร์โดยตรง Governance และ Security จะกลายเป็นเรื่องสำคัญมากขึ้นเรื่อย ๆ

Microsoft ได้เริ่มขยาย Enterprise Controls ครอบคลุมด้านต่าง ๆ เช่น:

  • Agent governance
  • Identity management
  • Security monitoring
  • Compliance workflows
  • Shadow AI detection

ผ่านแพลตฟอร์มอย่าง Agent 365 และบริการด้าน Security ของ Microsoft

สิ่งนี้มีความสำคัญอย่างยิ่ง เพราะในอนาคต Computer-using Agents อาจสามารถเข้าถึง:

  • Enterprise applications
  • Sensitive business systems
  • Financial workflows
  • Customer information
  • Operational infrastructure

องค์กรที่นำเทคโนโลยีเหล่านี้ไปใช้งานจึงจำเป็นต้องมี Governance Policies ระบบ Monitoring และ Permission Boundaries ที่ชัดเจน เพื่อให้มั่นใจว่า AI Agent จะทำงานได้อย่างปลอดภัยและมีความรับผิดชอบ

วิธีเริ่มต้นใช้งาน

พร้อมทดลองใช้ Computer-using Agents ใน Copilot Studio แล้วหรือยัง?

  1. สร้างหรือเปิด Agent ใน Microsoft Copilot Studio
  2. ไปที่ Tools → Add tool → Add new computer use
  3. อธิบายงานที่คุณต้องการให้ Agent ดำเนินการด้วยภาษาธรรมชาติ

หลังจากนั้น ประสบการณ์การใช้งานจะมีความเป็นธรรมชาติและเป็นแบบ Conversational มากขึ้นอย่างมาก แทนที่จะต้องสร้าง Automation Scripts ที่ซับซ้อน ผู้ใช้เพียงอธิบายงานที่ต้องการให้ Agent ทำด้วยภาษาทั่วไป AI Agent จะสามารถตีความคำสั่งเหล่านั้นและเริ่มโต้ตอบกับแอปพลิเคชัน เว็บไซต์ หรือ Workflows ต่าง ๆ แทนผู้ใช้งานได้ทันที

How to get started

วิวัฒนาการจาก Copilot ไปสู่ Autonomous Execution

การเปิดตัว Computer-using Agents แสดงให้เห็นว่า Enterprise AI กำลังพัฒนาอย่างรวดเร็วเพียงใด

AI Copilot รุ่นก่อนหน้าเน้นหลักไปที่:

  • Content generation
  • Summarization
  • Chat-based assistance
  • Productivity support

แต่ปัจจุบันอุตสาหกรรมกำลังเปลี่ยนไปสู่ AI Systems ที่เน้น “การลงมือทำงานจริง” และสามารถดำเนินงานได้โดยตรง

กลยุทธ์ระยะยาวของ Microsoft จึงมุ่งเปลี่ยน AI ให้กลายเป็น Operational Layer ภายใน Workplace มากกว่าการเป็นเพียง Conversational Interface

วิวัฒนาการนี้สะท้อนการเปลี่ยนผ่านของอุตสาหกรรม จาก “AI ที่ช่วยเหลือ” ไปสู่ “AI ที่ลงมือทำงาน”

Final Thoughts

การเปิดให้ใช้งาน Computer-using Agents ใน Microsoft Copilot Studio ระดับ General Availability ถือเป็นหนึ่งในก้าวสำคัญที่สุดของ Microsoft ในด้าน Autonomous AI Operations

ด้วยความสามารถที่ทำให้ AI สามารถโต้ตอบกับเว็บไซต์ แอปพลิเคชันเดสก์ท็อป และ Enterprise Workflows ได้โดยตรง Microsoft กำลังขยายบทบาทของ AI จากการช่วยให้ข้อมูล ไปสู่การดำเนินงานจริง ความสามารถในการทำ Automation ผ่าน GUI โดยไม่ต้องพึ่ง APIs ทั้งหมด อาจเพิ่มโอกาสในการทำ Automation ได้อย่างมหาศาลในหลากหลายอุตสาหกรรม

เมื่อองค์กรต่าง ๆ เดินหน้าสู่การใช้งาน Agentic AI มากขึ้น Computer-using Agents อาจกลายเป็นเทคโนโลยีพื้นฐานสำหรับโลกการทำงานดิจิทัลยุคใหม่ ที่ AI ไม่เพียงแค่เข้าใจ Workflow แต่ยังมีส่วนร่วมในการดำเนินงานให้เสร็จสมบูรณ์ด้วยตัวเอง

สนใจผลิตภัณฑ์และบริการของ Microsoft หรือไม่ ส่งข้อความถึงเราที่นี่

สำรวจเครื่องมือดิจิทัลของเรา

หากคุณสนใจในการนำระบบจัดการความรู้มาใช้ในองค์กรของคุณ ติดต่อ SeedKM เพื่อขอข้อมูลเพิ่มเติมเกี่ยวกับระบบจัดการความรู้ภายในองค์กร หรือสำรวจผลิตภัณฑ์อื่นๆ เช่น Jarviz สำหรับการบันทึกเวลาทำงานออนไลน์, OPTIMISTIC สำหรับการจัดการบุคลากร HRM-Payroll, Veracity สำหรับการเซ็นเอกสารดิจิทัล, และ CloudAccount สำหรับการบัญชีออนไลน์

อ่านบทความเพิ่มเติมเกี่ยวกับระบบจัดการความรู้และเครื่องมือการจัดการอื่นๆ ได้ที่ Fusionsol BlogIP Phone BlogChat Framework Blog, และ OpenAI Blog.

New Gemini Tools For Educators: Empowering Teaching with AI 

Digital Signature

E Signature

E Learning

Online Learning

ถ้าอยากติดตามข่าวเทคโนโลยีและข่าว AI ที่กำลังเป็นกระแสทุกวัน ลองเข้าไปดูที่ เว็บไซต์นี้ มีอัปเดตใหม่ๆ ให้ตามทุกวันเลย!

Fusionsol Blog in Vietnamese

Related Articles

Frequently Asked Questions (FAQ)

Microsoft Copilot คือฟีเจอร์ผู้ช่วยอัจฉริยะที่ใช้ AI เพื่อช่วยในการทำงานภายในแอปของ Microsoft 365 เช่น Word, Excel, PowerPoint, Outlook และ Teams โดยทำหน้าที่ช่วยสรุป เขียน วิเคราะห์ และจัดการข้อมูล

ปัจจุบัน Copilot รองรับ Microsoft Word, Excel, PowerPoint, Outlook, Teams, OneNote, และอื่น ๆ ในตระกูล Microsoft 365

จำเป็นต้องเชื่อมต่ออินเทอร์เน็ต เนื่องจาก Copilot ทำงานร่วมกับโมเดล AI บนคลาวด์เพื่อให้ผลลัพธ์ที่แม่นยำและอัปเดตข้อมูลล่าสุด

ผู้ใช้สามารถพิมพ์คำสั่ง เช่น “สรุปรายงานในย่อหน้าเดียว” หรือ “เขียนอีเมลตอบลูกค้าอย่างเป็นทางการ” และ Copilot จะสร้างข้อความให้ตามคำสั่ง

ใช่ Copilot ได้รับการออกแบบโดยยึดหลักความปลอดภัยและการปกป้องความเป็นส่วนตัว โดยข้อมูลของผู้ใช้จะไม่ถูกใช้ในการฝึกโมเดล AI และมีระบบการควบคุมสิทธิ์การเข้าถึงข้อมูลอย่างเข้มงวด

Facebook
X
LinkedIn

Popular Blog posts