เมื่อ ChatGPT ไม่เพียงแต่ฟังได้แต่ยังสังเกตได้อีกด้วย
TechRadar รายงานว่า OpenAI กำลังพัฒนาฟีเจอร์ใหม่ที่ชื่อว่า “Live Camera” ซึ่งคาดว่าจะผสานรวมเข้ากับโหมดเสียงขั้นสูงของ ChatGPT ฟีเจอร์นี้จะช่วยให้ AI (ปัญญาประดิษฐ์) ไม่เพียงแต่สามารถแชทด้วยเสียงเท่านั้น แต่ยังสามารถจดจำและตอบสนองต่อภาพได้อีกด้วย
“Live Camera” เปิดตัวครั้งแรกในเดือนพฤษภาคม 2567 เมื่อ OpenAI สาธิตให้เห็นว่า AI สามารถดูภาพและให้ข้อมูลป้อนกลับอย่างละเอียดได้อย่างไร ในระหว่างการสาธิต AI สามารถระบุสุนัขได้อย่างถูกต้องและให้ข้อมูลเกี่ยวกับสายพันธุ์ ลักษณะเฉพาะ และชื่อของสุนัข อย่างไรก็ตาม OpenAI ยังไม่ได้เปิดเผยข้อมูลเพิ่มเติมเกี่ยวกับฟีเจอร์นี้อีกเลยนับตั้งแต่นั้นเป็นต้นมา
ฟีเจอร์เสียงที่ได้รับการปรับปรุงของ ChatGPT จะสามารถโต้ตอบกับผู้ใช้ผ่านทาง วิดีโอ คอลได้ในอนาคตอันใกล้นี้
เมื่อไม่นานนี้ ซอร์สโค้ดในเวอร์ชันเบต้า (v1.2024.317) ของ ChatGPT ได้เปิดเผยข้อมูลอ้างอิงที่มีชื่อว่า "กล้องถ่ายทอดสด" ซึ่งแสดงให้เห็นว่าฟีเจอร์นี้อาจจะเปิดตัวเป็นการทดสอบเบต้าในเร็วๆ นี้ ก่อนที่จะนำไปใช้งานอย่างแพร่หลาย
โหมดเสียงที่ได้รับการปรับปรุงของ ChatGPT ได้รับการทดสอบในเวอร์ชัน Alpha แล้ว และได้รับเสียงตอบรับที่ดีจากผู้ใช้ ผู้ทดสอบรายหนึ่งเปรียบเทียบประสบการณ์การใช้งานกับการโทร FaceTime กับ "เพื่อนที่ฉลาดมาก" โดยกล่าวว่าฟีเจอร์นี้มีประโยชน์ในการตอบคำถามแบบเรียลไทม์
การผสานรวมความสามารถในการจดจำภาพและวิดีโอคอลเข้าด้วยกันจะช่วยให้ ChatGPT ก้าวข้ามบทบาทการเป็นแชทบอททั่วไป ซึ่งอาจเป็นเครื่องมือที่มีประโยชน์สำหรับผู้พิการทางสายตา หรือช่วยให้ผู้ใช้รับมือกับสถานการณ์ที่ต้องใช้การจดจำภาพ
OpenAI ยังไม่ได้ประกาศวันเปิดตัวอย่างเป็นทางการหรือรายละเอียดสำหรับฟีเจอร์ "กล้องถ่ายทอดสด" แต่ข้อมูลใหม่จากโค้ดต้นทางเบต้าแสดงให้เห็นว่าฟีเจอร์ดังกล่าวอยู่ในระหว่างการพัฒนาและอาจพร้อมให้ผู้ใช้ใช้งานได้ในเร็วๆ นี้
ที่มา: https://thanhnien.vn/chatgpt-chuan-bi-ra-mat-tinh-nang-goi-video-cung-ai-185241119232904592.htm
การแสดงความคิดเห็น (0)