![]() |
หน้าจอโทรศัพท์แสดง GPT-4o |
ChatGPT-4o จะเปิดตัวให้กับผู้ทดสอบในอีกไม่กี่สัปดาห์ข้างหน้านี้
ChatGPT เวอร์ชันใหม่สามารถอ่านการแสดงออกทางสีหน้า เลียนแบบรูปแบบการพูดของมนุษย์ และสนทนาได้แบบเรียลไทม์ ผู้สร้างได้เปิดเผย
OpenAI ได้สาธิตแชทบอทปัญญาประดิษฐ์ (AI) เวอร์ชันใหม่ GPT-4o ในการนำเสนอแบบเรียลไทม์ แชทบอทที่พูดคุยกับผู้บรรยายทางโทรศัพท์นี้ดูเหมือนจะควบคุมการสนทนาของมนุษย์และแสดงอารมณ์ที่ละเอียดอ่อนได้อย่างน่าประหลาด ไม่ว่าจะเป็นการสลับระหว่างเสียงหุ่นยนต์และเสียงพูดตามคำสั่ง การปรับตัวตามการรบกวน และการประมวลผลสีหน้าและสภาพแวดล้อมได้อย่างเป็นธรรมชาติ
ระหว่างการสาธิต ผู้ช่วยเสียง AI ได้แสดงทักษะโดยการทำงานต่างๆ เช่น การแปลภาษาแบบเรียลไทม์ การแก้สมการคณิตศาสตร์ที่เขียนบนกระดาษ และการนำทางคนตาบอดบนท้องถนนในลอนดอน
แซม อัลท์แมน ซีอีโอของ OpenAI เขียนโพสต์สั้นๆ บนแพลตฟอร์มโซเชียลมีเดีย X หลังจบการนำเสนอ โดยโพสต์ดังกล่าวอ้างอิงถึงภาพยนตร์ปี 2013 ในชื่อเดียวกัน ซึ่งเล่าเรื่องราวของชายผู้โดดเดี่ยวคนหนึ่งที่ตกหลุมรักผู้ช่วย AI
เพื่อแสดงให้เห็นถึงความสามารถในการอ่านสัญญาณภาพ แชทบอทจึงใช้เลนส์กล้องโทรศัพท์เพื่ออ่านการแสดงออกทางสีหน้าของวิศวกร OpenAI และอธิบายอารมณ์ของพวกเขา
ความสามารถใหม่เหล่านี้ถือเป็นการปรับปรุงครั้งใหญ่เมื่อเทียบกับฟีเจอร์เสียงที่มีจำกัดในรุ่นก่อนหน้า ซึ่งไม่สามารถจัดการกับการขัดจังหวะหรือตอบสนองต่อข้อมูลภาพได้
“เรากำลังมองอนาคตของปฏิสัมพันธ์ระหว่างมนุษย์กับเครื่องจักร” มิรา มูราติ ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ OpenAI กล่าวในงานแถลงข่าว “เราคิดว่า GPT-4o กำลังเปลี่ยนแปลงกระบวนทัศน์ดังกล่าวอย่างแท้จริง”
คาดว่าผู้ช่วยเสียงใหม่จะเปิดตัวในรูปแบบจำกัดให้กับผู้ทดสอบอัลฟ่าในอีกไม่กี่สัปดาห์ข้างหน้า จากนั้นจะตามด้วยการเปิดตัวในวงกว้างขึ้น โดยจะเริ่มต้นด้วยผู้สมัครสมาชิก ChatGPT Plus ที่ชำระเงินแล้ว
ประกาศดังกล่าวยังตามมาด้วยรายงานของ Bloomberg ที่ว่าบริษัทใกล้จะบรรลุข้อตกลงกับ Apple เพื่อบูรณาการ ChatGPT ลงใน iPhone ซึ่งจะเปิดโอกาสให้ GPT-4o สามารถใช้อัพเกรด Siri ซึ่งเป็นผู้ช่วยเสียงของ iPhone ได้
อย่างไรก็ตาม เทคโนโลยีใหม่นี้ยังทำให้เกิดความกังวลเกี่ยวกับความปลอดภัยและการโทรฉ้อโกงอีกด้วย
การแสดงความคิดเห็น (0)