เรียกว่าขโมยซีนงาน Google I/O 2024 ที่จะจัดขึ้นในวันนี้ไปเต็ม ๆ กับการเปิดตัว “GPT-4o” Gen AI ระดับแฟลกชิปของ Sam Altman ที่มาพร้อมความสามารถในการฟัง-พูด-อ่าน-เขียนเต็มพิกัด
โมเดลตัวใหม่นี้มาพร้อมชื่อว่า GPT-4o ส่วนเหตุที่ใช้ตัวโอ (o) ในชื่อของมันนั้น ทาง OpenAI บอกว่าย่อมาจากคำว่า Omni ซึ่งสะท้อนว่า ความสามารถในการโต้ตอบของ AI ตัวนี้ได้รับการพัฒนาให้หลากหลายมากขึ้น โดยรองรับทั้งข้อความ เสียง และภาพ ขณะที่การตอบกลับก็สามารถทำได้ทั้งข้อความ เสียง และภาพเช่นกัน
ในวิดีโอสาธิต ได้มีการทดสอบการคุยกับ GPT-4o ซึ่งพบว่า ความเร็วในการโต้ตอบของ GPT-4o นั้น สามารถตอบได้เร็วสุดที่ 232 มิลลิวินาที ส่วนค่าเฉลี่ยความเร็วในการตอบอยู่ที่ 320 มิลลิวินาที ซึ่งใกล้เคียงกับการโต้ตอบของมนุษย์กันเลยทีเดียว
แต่ที่เหนือไปกว่านั้นคือการใส่อารมณ์ และความรู้สึกลงมาในการโต้ตอบที่ทำได้ใกล้เคียงกับมนุษย์ ซึ่งเชื่อว่าจะช่วยสร้างความประทับใจในการใช้งาน GPT-4o ขึ้นได้อีกมาก
OpenAI บอกด้วยว่า ความสามารถของ GPT-4o ในแง่ของการทำความเข้าใจภาพและเสียงนั้นทำได้ดีกว่าเวอร์ชันเดิม ส่วนเรื่องค่าใช้จ่าย พบว่า สามารถเชื่อมต่อ API กับ GPT-4o ได้เร็วขึ้น แต่คิดราคาถูกกว่าถึง 50% ด้วย โดยความสามารถทั้งหมดนั้น ทางค่ายระบุว่า GPT-4o สามารถทำงานได้ในระดับเดียวกับ GPT-4 Turbo ในด้านการวิเคราะห์ข้อความ การใช้เหตุผล แต่ในส่วนของความสามารถหลายภาษา การโต้ตอบด้วยเสียง และการมองเห็นนั้น GPT-4o มีประสิทธิภาพเหนือกว่าแล้วด้วยนั่นเอง
มีการวิเคราะห์กันด้วยว่า อาชีพที่จะตกที่นั่งลำบากจากการมาถึงของ GPT-4o อาจเป็นบรรดาติวเตอร์ออนไลน์แล้วก็เป็นได้