ChatGPT รองรับการป้อนคำสั่งด้วยเสียงและรูปภาพได้ฟรี

[โฆษณา_1]

การที่ Google ผสานรวม Bard เข้ากับแอปพลิเคชันต่างๆ มากมาย เช่น Gmail, YouTube, Google Maps และ Flights ถือเป็นข้อได้เปรียบที่สำคัญเหนือ ChatGPT ดังนั้น OpenAI จึงประกาศเมื่อเร็วๆ นี้ว่า ChatGPT เวอร์ชันฟรีจะรองรับการป้อนข้อมูลด้วยเสียงและรูปภาพในเร็วๆ นี้

นี่หมายความว่าผู้ใช้สามารถขอความช่วยเหลือจาก ChatGPT ได้อย่างเป็นธรรมชาติมากกว่าการพิมพ์บน iPhone และ Android หรือแม้แต่ใช้รูปภาพเพื่อให้ได้คำตอบที่ดีขึ้น ประเด็นสำคัญคือผู้ใช้ไม่จำเป็นต้องจ่ายเงินสำหรับ ChatGPT Plus เพื่อรับการอัปเดต แม้ว่าบัญชีแบบชำระเงินจะเป็นกลุ่มแรกที่ได้ทดลองใช้ก็ตาม

ผู้ใช้บัญชี Plus และ Enterprise จะได้รับการอัปเดตนี้ภายในสองสัปดาห์ข้างหน้า ตามด้วยกลุ่มผู้ใช้อื่นๆ รวมถึงนักพัฒนา การใช้รูปภาพเป็นข้อมูลป้อนเข้าใน ChatGPT เป็น วิธี การทำงานของโมเดล AI แบบมัลติโมดอล ซึ่งคล้ายกับวิธีที่ยักษ์ใหญ่ด้านการค้นหาใช้ Google Lens กับ AI

ChatGPT hỗ trợ nhập lệnh bằng giọng nói và hình ảnh miễn phí - Ảnh 1. — คาดว่าฟีเจอร์ใหม่สองอย่างใน ChatGPT จะดึงดูดผู้ใช้ได้มากกว่า Google Bard

ในขณะเดียวกัน ฟีเจอร์การพากย์เสียงจะใช้งานได้เฉพาะในแอป ChatGPT สำหรับ iPhone และ Android เท่านั้น ผู้ใช้เพียงแค่เปิดใช้งานในตั้งค่าของแอปหลังจากเปิดใช้งานฟีเจอร์แล้ว OpenAI กล่าวว่า ChatGPT ต้องการเพียงตัวอย่างเสียงพูดไม่กี่วินาทีเพื่อสร้างเสียงที่เหมือนมนุษย์จากข้อความ โดยใช้โมเดลแปลงข้อความเป็นเสียงพูดแบบใหม่เพื่อจุดประสงค์นี้

เทคโนโลยีนี้สามารถสร้างเสียงสังเคราะห์ที่สมจริงจากเสียงพูดจริงได้ภายในไม่กี่วินาที ซึ่งเปิดประตูสู่แอปพลิเคชันที่สร้างสรรค์และเข้าถึงได้ง่ายมากมาย อย่างไรก็ตาม มันก็ก่อให้เกิดความเสี่ยงใหม่ๆ เช่น ศักยภาพในการแอบอ้างเป็นบุคคลที่มีชื่อเสียง หรือการมีส่วนร่วมในกิจกรรมฉ้อโกง นอกจากนี้ OpenAI ยังระบุว่ากำลังร่วมมือกับ Spotify เพื่อทดสอบฟีเจอร์การแปลเสียงสำหรับพอดแคสต์ ซึ่งจะช่วยให้ผู้สร้างสามารถแปลเนื้อหาของตนเป็นภาษาอื่นๆ โดยใช้เสียงของตนเองได้

[โฆษณา_2]
ลิงก์แหล่งที่มา