การสร้างภาพโดยใช้เครื่องมือ AI
ในอดีต การสร้าง วิดีโอ ต้องใช้กล้อง ผู้กำกับ นักแสดง และการตัดต่อหลายชั่วโมง แต่ปัจจุบัน AI สามารถสร้างเฟรมภาพที่สมบูรณ์และมีชีวิตชีวาได้ เพียงพิมพ์คำไม่กี่คำบนแป้นพิมพ์ ตั้งแต่ฉาก แสง ไปจนถึงทุกการเคลื่อนไหวเล็กๆ น้อยๆ
เบื้องหลัง “ปาฏิหาริย์” นี้คือเทคโนโลยีอันซับซ้อนที่น้อยคนนักจะรู้จัก
จากข้อความสู่ภาพ: การเดินทางครั้งแรก
จากการวิจัยของ Tuoi Tre Online พบว่าเมื่อคุณพิมพ์ประโยคบรรยายสักสองสามประโยค ระบบ AI จะ "เข้าใจ" เนื้อหาก่อนโดยใช้เทคโนโลยีประมวลผลภาษาธรรมชาติ (NLP) AI ไม่เพียงแต่จดจำคำศัพท์แต่ละคำเท่านั้น แต่ยังวิเคราะห์บริบท อารมณ์ และความสัมพันธ์ระหว่างองค์ประกอบต่างๆ ในประโยคอีกด้วย
ตัวอย่างเช่น หากคุณเขียนว่า "ฝนช่วงบ่ายในเมืองเก่า" AI จะรู้ว่านี่คือฉากกลางแจ้ง มีองค์ประกอบของสภาพอากาศ แสงตอนบ่าย และทิวทัศน์สถาปัตยกรรมคลาสสิก
หลังจากเข้าใจเนื้อหาแล้ว AI จะเข้าสู่ขั้นตอนการสร้างภาพนิ่งเบื้องต้น เทคนิคที่นิยมใช้กันในขั้นตอนนี้คือแบบจำลองการกระจายแสง ซึ่ง AI จะ “ระบายสี” ภาพจากพื้นหลังสีขาวที่มีจุดรบกวนจนกระทั่งเห็นรายละเอียดทั้งหมด ทุกพิกเซลจะถูกคำนวณเพื่อให้แน่ใจว่าแสง สี องค์ประกอบ และสไตล์เป็นไปตามที่อธิบายไว้
คนเพียงไม่กี่คนเท่านั้นที่รู้ว่าในระยะนี้ AI สามารถสร้างเวอร์ชันทดสอบได้หลายสิบเวอร์ชัน และเลือกเวอร์ชันที่ดีที่สุดก่อนที่จะดำเนินการต่อ
“ความลับ” อีกอย่างหนึ่งคือ ระบบขั้นสูงยังผสานรวมฐานข้อมูลภาพขนาดใหญ่ที่ฝึกฝนมาจากหลายแหล่ง ซึ่งทำให้ AI สามารถจดจำรายละเอียดนับล้านรายการได้ ตั้งแต่ลักษณะการสะท้อนแสงของน้ำ ไปจนถึงลักษณะการเอียงของต้นไม้เมื่อต้องรับลม ทำให้เฟรมแรกดูเป็นธรรมชาติที่สุดเท่าที่จะเป็นไปได้
AI เปลี่ยนภาพให้เป็นภาพเคลื่อนไหวที่ราบรื่นได้อย่างไร
เมื่อเฟรมแรกเสร็จสมบูรณ์ ความท้าทายที่ใหญ่ที่สุดคือการทำให้ภาพเป็นลำดับภาพที่ให้ความรู้สึกเหมือนกำลังเคลื่อนไหว AI ใช้ แบบจำลองการทำนายการเคลื่อนที่ เพื่อแสดงภาพว่าวัตถุแต่ละชิ้นจะเปลี่ยนแปลงไปอย่างไรเมื่อเวลาผ่านไป นี่คือที่มาของอัลกอริทึมทางฟิสิกส์ที่จำลองสิ่งต่างๆ เช่น แรงโน้มถ่วง ลม น้ำ และการสั่นไหวของกล้องเสมือนจริง
เพื่อป้องกันไม่ให้ฉากสะดุด AI จะใช้ การแทรกเฟรมภาพ (frame interpolation ) โดยจะ “จินตนาการ” เฟรมภาพกลางระหว่างสองช่วงเวลา แล้วนำมารวมกันเป็นภาพเคลื่อนไหวที่ราบรื่น หากมีตัวละครอยู่ในวิดีโอ ระบบยังต้องประมวลผลการเคลื่อนไหวของร่างกาย การแสดงออกทางสีหน้า และการสบตาเพื่อให้สอดคล้องกับบริบทอีกด้วย
เคล็ดลับที่ไม่ค่อยมีใครรู้: ก่อนการแสดง ระบบ AI หลายระบบยังทำขั้นตอน "หลังการผลิต" อัตโนมัติอีกด้วย โดยจะปรับสี แสง เพิ่มเอฟเฟกต์เบลอหรือความลึก เพื่อให้วิดีโอดูเหมือนถ่ายโดยกล้องมืออาชีพ บางแพลตฟอร์มยังสร้างเสียงแวดล้อมและดนตรีประกอบที่เหมาะสม ทำให้ผลงานสุดท้ายดูเหมือนฉากจริง
ด้วยการผสมผสานเทคโนโลยีมากมาย ตั้งแต่การประมวลผลภาษา การเรนเดอร์ 3 มิติ การจำลองฟิสิกส์ ไปจนถึงการตัดต่อหลังการผลิต ผู้ใช้สามารถเป็นเจ้าของวิดีโอที่สมบูรณ์แบบได้เพียงแค่เขียนข้อความไม่กี่บรรทัด ความราบรื่นนี้ทำให้หลายคนคิดว่า AI กำลัง "ถ่ายทำ" อยู่ แต่ที่จริงแล้ว ทุกอย่างถูกสร้างขึ้นจากศูนย์ ทีละเฟรม ด้วยความเร็วที่มนุษย์ไม่สามารถเทียบเคียงได้
ที่มา: https://tuoitre.vn/hau-truong-ai-chuyen-van-ban-thanh-video-trong-vai-phut-20250815190549144.htm
การแสดงความคิดเห็น (0)