OpenAI เปิดตัวฟีเจอร์ใหม่ ‘Operator’ ทำหน้าที่เป็นผู้ช่วย AI สำหรับเว็บไซต์ ซึ่งจะช่วยดำเนินการโต้ตอบกับเว็บไซต์ได้ เช่นเดียวกับผู้ใช้เป็นคนคลิกเอง เช่น ถ้าผู้ใช้ต้องการจองโรงแรมบนเว็บไซต์ เพียงแค่ป้อนคำสั่งผ่าน ChatGPT ผู้ช่วย AI ก็จะทำหน้าที่เลือก, พิมพ์, คลิก และเลื่อนหน้าผ่านบราวเซอร์ของเราเอง
ซึ่งฟีเจอร์ Operator ได้ใช้โมเดล CUA ย่อมากจาก Computer – Using Agent เป็นโมเดลพัฒนาใหม่ของ OpenAI โดยนำความสามารถของ GPT-4o มาใช้ในด้าน Visual ร่วมกับวิธีคิดผ่านการเรียนรู้ของ AI ทำให้ฟีเจอร์นี้สามารถทำงานเป็นผู้ช่วยในการโต้ตอบกับเว็บไซต์ได้ เช่นเดียวกับที่ตาเราเห็นผ่านการแคปเจอร์หน้าจอ และพิมพ์ข้อความได้เหมือนมือเราสั่งการ
โดยผู้ใช้สามารถกลับเข้ามาควบคุมเว็บไซต์ได้ หากเจอความผิดพลาดจาการใช้ AI หรือหน้าเว็บไซต์ต้องการให้กรอกข้อมูลสำคัญ เช่น การยืนยันตัวตน กรอกข้อมูลบัตรประชาชน หรือบัตรเครดิต เป็นต้น นอกจากนี้ Operator จะถามเพื่อรีเช็กเมื่อต้องยืนยันเนื้อหาอย่างการกดส่งอีเมล เพื่อให้สามารถใช้งานได้อย่างถูกต้อง และปลอดภัย
เนื่องจากฟีเจอร์นี้ยังอยู่ในขั้นทดลอง และกำลังพัฒนาให้ AI เรียนรู้ทำให้ต้องจำกัดการทำงานแค่บางเว็บไซต์ ซึ่งฟีเจอร์นี้จะเปิดใช้งานให้ผู้ใช้ในอเมริกาที่สมัครแพ็กเกจรายเดือนของ ChatGPT ก่อน ส่วนผู้ใช้ทั่วไปต้องรอติดตามจากทาง OpenAI ต่อไป
ที่มา: https://www.theverge.com/2025/1/23/24350395/openai-chatgpt-operator-agent-control-computer