โมเดลแบบออมนิโมดอลที่เรียกว่า OmniHuman-1 สามารถสร้างวิดีโอแบบไดนามิกของตัวละครที่พูด ร้องเพลง และเคลื่อนไหวได้ด้วย "คุณภาพที่เหนือกว่าวิธีการสร้างวิดีโอในปัจจุบัน" ตามที่ทีมพัฒนาของ ByteDance กล่าว

เทคโนโลยี AI ที่สร้างภาพ วิดีโอ และเสียงที่สมจริง หรือที่รู้จักกันในชื่อ "ดีปเฟค" กำลังถูกนำไปใช้ในการหลอกลวงและความบันเทิงมากขึ้นเรื่อยๆ

ปัจจุบัน ByteDance เป็นหนึ่งในบริษัทด้านปัญญาประดิษฐ์ (AI) ที่มาแรงที่สุดในจีน แอปพลิเคชัน Doubao ของบริษัทเป็นที่นิยมมากที่สุดในหมู่ผู้ใช้ในจีนแผ่นดินใหญ่

แม้ว่า OmniHuman-1 ยังไม่ได้เปิดตัวสู่สาธารณะอย่างกว้างขวาง แต่คลิปวิดีโอตัวอย่างก็แพร่กระจายไปอย่างรวดเร็ว

หนึ่งในตัวอย่างที่โดดเด่นคือวิดีโอความยาว 23 วินาทีที่แสดงภาพอัลเบิร์ต ไอน์สไตน์กำลังกล่าวสุนทรพจน์ เว็บไซต์ TechCrunch บรรยายผลลัพธ์ของแอปนี้ว่า "น่าทึ่งอย่างน่าตกใจ" และ "เป็นวิดีโอ deepfake ที่สมจริงที่สุดเท่าที่เคยมีมา"

ผู้พัฒนาบอกว่า OmniHuman-1 ต้องการเพียงภาพนิ่งภาพเดียวเป็นข้อมูลอ้างอิง พร้อมกับข้อมูลเสียง เช่น เสียงพูดหรือเสียงร้องเพลง เพื่อสร้างวิดีโอที่มีความยาวเท่าใดก็ได้

สามารถปรับอัตราเฟรมของวิดีโอที่ส่งออกได้ เช่นเดียวกับ "สัดส่วนร่างกาย" ของตัวละครในวิดีโอ

d6a434e5a4dc974582b09c05b3646092afcf9490.jpeg
ปัจจุบัน ByteDance เป็นหนึ่งในบริษัทด้านปัญญาประดิษฐ์ (AI) ที่โดดเด่นที่สุดในประเทศจีน ภาพ: TechCrunch

นอกจากนี้ โมเดล AI ที่ได้รับการฝึกฝนด้วยเนื้อหาวิดีโอ 19,000 ชั่วโมงจากแหล่งที่ไม่เคยเผยแพร่มาก่อน สามารถแก้ไขวิดีโอที่มีอยู่และแม้กระทั่งเปลี่ยนแปลงการเคลื่อนไหวของมือและเท้าของมนุษย์ได้อย่างน่าเชื่อถือ

อย่างไรก็ตาม ByteDance ยอมรับว่า OmniHuman-1 ยังไม่สมบูรณ์แบบ เพราะยังคงมีปัญหาในการจัดท่าทางบางท่า และ "ภาพอ้างอิงคุณภาพต่ำ" จะไม่ทำให้ได้วิดีโอที่ดีที่สุด

โมเดล AI ใหม่ของ ByteDance แสดงให้เห็นถึงความก้าวหน้าของจีน แม้ว่าวอชิงตันจะพยายามจำกัดการส่งออกเทคโนโลยีก็ตาม

ข้อกังวล

ปีที่แล้ว วิดีโอปลอมแปลง ทางการเมือง แพร่กระจายไปทั่วโลก ในประเทศมอลโดวา วิดีโอปลอมแปลงเลียนแบบประธานาธิบดีมาเอีย ซานดู ขณะกล่าวสุนทรพจน์ลาออกจากตำแหน่ง

และในแอฟริกาใต้ คลิปวิดีโอปลอม (deepfake) ของแร็ปเปอร์ Eminem ที่แสดงการสนับสนุนพรรคฝ่ายค้านของแอฟริกาใต้ ได้แพร่กระจายไปทั่วโลกออนไลน์ก่อนการเลือกตั้งของประเทศ

เทคโนโลยี Deepfake กำลังถูกนำไปใช้ในการก่ออาชญากรรมทางการเงินมากขึ้นเรื่อยๆ ผู้บริโภคถูกหลอกลวงด้วย Deepfake ของคนดังที่แนะนำการลงทุนและเสนอโอกาสการลงทุนปลอม ในขณะที่บริษัทต่างๆ สูญเสียเงินหลายล้านดอลลาร์ให้กับผู้ที่แอบอ้างเป็นผู้บริหารระดับสูง

จากข้อมูลของ Deloitte เนื้อหาที่สร้างโดย AI ก่อให้เกิดความเสียหายจากการฉ้อโกงมากกว่า 12 พันล้านดอลลาร์ในปี 2023 และอาจสูงถึง 40 พันล้านดอลลาร์ในสหรัฐอเมริกาภายในปี 2027

เมื่อเดือนกุมภาพันธ์ที่ผ่านมา ผู้คนหลายร้อยคนในแวดวงปัญญาประดิษฐ์ได้ลงนามในจดหมายเรียกร้องให้มีการควบคุมที่เข้มงวดมากขึ้นเกี่ยวกับดีพเฟค (deepfakes) แม้ว่าในสหรัฐอเมริกาจะไม่มีกฎหมายของรัฐบาลกลางที่กำหนดให้ดีพเฟคเป็นอาชญากรรม แต่รัฐต่างๆ มากกว่า 10 รัฐได้ออกกฎหมายต่อต้านการปลอมแปลงโดยใช้ปัญญาประดิษฐ์แล้ว

อย่างไรก็ตาม การตรวจจับ deepfake นั้นไม่ใช่เรื่องง่าย แม้ว่าแพลตฟอร์มโซเชียลมีเดียและเครื่องมือค้นหาบางแห่งจะใช้มาตรการเพื่อจำกัดการแพร่กระจายแล้ว แต่ปริมาณเนื้อหา deepfake ออนไลน์ก็ยังคงเพิ่มขึ้นในอัตราที่น่าตกใจ

จากการสำรวจเมื่อเดือนพฤษภาคม 2024 โดยบริษัทตรวจสอบตัวตน Jumio ผู้เข้าร่วม 60% รายงานว่าเคยพบเจอ deepfake ในปีที่ผ่านมา 72% ของผู้ตอบแบบสอบถามกล่าวว่าพวกเขากังวลเกี่ยวกับการถูกหลอกลวงด้วย deepfake ในชีวิตประจำวัน ขณะที่ส่วนใหญ่สนับสนุนการออกกฎหมายเพื่อแก้ไขปัญหาการแพร่กระจายของวิดีโอปลอมที่สร้างโดย AI

Google 'อนุมัติ' การใช้ AI ในอาวุธและเทคโนโลยีการสอดแนม Google ได้ละเมิดคำมั่นสัญญาที่ว่าจะไม่ออกแบบและใช้งานเครื่องมือ AI ในอาวุธและเทคโนโลยีการสอดแนม