Google เตรียมอัปเดตฟีเจอร์ใหม่บน Gemini Live เพื่อให้ผู้ใช้สามารถโต้ตอบกับ AI แบบเรียลไทม์ได้อย่างมีประสิทธิภาพมากขึ้น ทั้งความสามารถด้านการมองเห็น, รายละเอียดที่แม่นยำระหว่างการสนทนา และการสื่อสารด้วยเสียง โดยจะเริ่มเปิดให้ใช้งานบนอุปกรณ์ Android ตั้งแต่วันที่ 28 สิงหาคม ก่อนจะขยายสู่ iOS ต่อไป
หนึ่งในฟีเจอร์ที่โดดเด่น คือ ‘การไฮไลต์บนหน้าจอ’ เมื่อผู้ใช้หันโทรศัพท์ไปยังสิ่งของที่ต้องการ จากนั้นระบบจะแสดงผลกล่องสี่เหลี่ยมเน้นเฉพาะวัตถุ เช่น ระหว่างการเลือกสินค้า A กับ B เมื่อเราส่องไปที่สินค้าไหน AI จะทำการไฮไลต์เพื่อตอบคำถามเราทันที ซึ่งฟีเจอร์นี้จะทำให้คำตอบที่ได้รับตรงประเด็น และมีความถูกต้องมากขึ้น
นอกจากนี้ Google ยังได้เพิ่มให้ Gemini Live เชื่อมต่อกับแอปหลักบนเครื่อง โดยเริ่มจากข้อความ, โทรศัพท์ และนาฬิกา ยกตัวอย่างเช่น ในขณะที่ผู้ใช้กำลังป้อนคำสั่งกับ Gemini ให้หาเส้นทางที่ดีที่สุดในการเดินทาง แต่พึ่งรู้ตัวว่ากำลังจะสาย ก็สามารถสั่งให้ AI ส่งข้อความบอกเพื่อนได้ทันทีแบบไม่จำเป็นต้องออกจากหน้าจอ และดำเนินการสนทนาต่อเนื่องได้เลย
สุดท้ายนี้ Gemini Live ยังมีโมเดลเสียงเวอร์ชันใหม่ที่มีความเป็นมนุษย์มากขึ้น ทั้งองค์ประกอบด้านน้ำเสียง, จังหวะ และระดับเสียง โดยผู้ใช้จะได้ยิน AI เปลี่ยนน้ำเสียงให้สงบลงเมื่อเรากำลังพูดเรื่องเครียด ๆ หรือปรับความช้า – เร็วในการพูดตามที่ผู้ใช้ต้องการ เพื่อสร้างประสบการณ์ที่ดีในการใช้งานมากขึ้น
ที่มา: https://www.theverge.com/news/763114/google-gemini-live-ai-visual-guidance-speech-update