ChatGPT เก่งไปอีกขั้น จากการอัปเดตความสามารถรอบใหม่นี้ ChatGPT สามารถฟังคำสั่งเสียง และตอบกลับเรามาได้แล้ว แถมยังสามารถวิเคราะห์ภาพ และหาคำตอบให้เราได้จากภาพนั้น ๆ ด้วยเช่นกัน
การประกาศความสามารถใหม่ของ ChatGPT มีขึ้นเมื่อต้นสัปดาห์ที่ผ่านมา โดยทาง OpenAI ได้เผยความสามารถของ Gen AI ดังกล่าวด้วยการบอกให้มันหาทางปรับคันบังคับจักรยาน โดยมีการส่งภาพกล่องเครื่องมือ – อุปกรณ์ให้มันวิเคราะห์ว่าต้องใช้เครื่องมือตัวใดในการลดระดับแฮนด์จักรยานให้เตี้ยลง ซึ่งมันสามารถตอบได้
ส่วนการตอบกลับด้วยเสียงนั้น พบว่า ChatGPT มีโมเดลเสียงในการตอบกลับให้เลือกมากถึง 5 เสียง
อย่างไรก็ดี OpenAI เผยว่า การตอบกลับด้วยเสียงนั้นจะเปิดให้ผู้ที่จ่ายเงินรายเดือนได้ใช้งานกันในอีกสองสัปดาห์ข้างหน้านี้ แต่จำกัดการใช้งานเฉพาะบนแอปพลิเคชัน (iOS และแอนดรอยด์) ส่วนความสามารถในการวิเคราะห์ภาพสามารถใช้งานได้ทุกแพลตฟอร์ม
นอกจากเสียงชื่นชมในความสามารถของ Gen AI แล้ว อีกหนึ่งความกังวลก็คือเรื่องการนำเสียงไปใช้ในทางที่ผิด เช่น ใช้ในการหลอกลวงคนอื่น ซึ่งในการประกาศเปิดตัวฟีเจอร์ใหม่นี้ ทาง OpenAI เผยว่า เสียงที่ ChatGPT สร้างขึ้นและตอบกลับมานั้นเป็นการทำงานร่วมกับนักพากษ์ของบริษัทโดยตรง ไม่ใช่เสียงที่เก็บจากคนทั่วไป
ส่วนเสียงของผู้ใช้งานนั้น พบว่าทางบริษัทยังให้ข้อมูลน้อยมากว่าจะจัดเก็บคำสั่งเสียงที่ผู้ใช้งานสั่ง ChatGPT ไปอย่างไร โดยระบุไว้ใน Terms of Service แต่เพียงว่า ผู้บริโภคเป็นเจ้าของข้อมูล และ OpenAI จะไม่เก็บเสียงเหล่านั้นไว้ รวมถึงไม่ใช้เสียงเหล่านั้นในการปรับปรุงพัฒนาโมเดลด้วย แต่อาจมีการถอดเสียง (ทาง OpenAI ใช้คำว่า Transcription) นั้น เพื่อใช้ในการปรับปรุงระบบภาษา หรือ large-language models ก็เป็นได้