ตัวอย่างของอคติในภาพที่สร้างโดย AI

[โฆษณา_1]

โปรแกรมสร้างภาพด้วย AI ทำงานอย่างไร?

โปรแกรมสร้างภาพโดยใช้ปัญญาประดิษฐ์ (AI) ใช้โมเดลการเรียนรู้ของเครื่อง โดยใช้ข้อความที่ผู้ใช้ป้อนเพื่อสร้างภาพหนึ่งภาพหรือมากกว่านั้นที่ตรงกับคำอธิบาย การฝึกฝนโมเดลเหล่านี้ต้องใช้ชุดข้อมูลขนาดใหญ่ที่มีภาพนับล้านภาพ

ความคลาดเคลื่อนที่น่าเป็นห่วงในภาพนั้นเกิดจากผู้สร้างภาพ (ภาพที่ 1) — การสร้างภาพโดยใช้ AI กำลังกลายเป็นเรื่องง่ายมาก ภาพ: Ijnet

แม้ว่า Midjourney และ DALL-E 2 จะไม่ได้เปิดเผยกลไกการทำงานที่แท้จริงของอัลกอริทึมของตนอย่างเป็นทางการ แต่โดยทั่วไปแล้วโปรแกรมสร้างภาพด้วย AI ส่วนใหญ่จะใช้กระบวนการที่เรียกว่าการแพร่กระจาย (diffusion) โมเดลการแพร่กระจายทำงานโดยการเพิ่ม "สัญญาณรบกวน" แบบสุ่มลงในข้อมูลฝึกฝน จากนั้นเรียนรู้ที่จะสร้างข้อมูลขึ้นใหม่โดยการกำจัดสัญญาณรบกวน โมเดลจะทำซ้ำกระบวนการนี้จนกว่าจะสร้างภาพที่ตรงกับข้อมูลป้อนเข้า

สิ่งนี้แตกต่างจากโมเดลภาษาขนาดใหญ่ เช่น ChatGPT โมเดลภาษาขนาดใหญ่ได้รับการฝึกฝนด้วยข้อมูลข้อความที่ไม่มีป้ายกำกับ ซึ่งพวกมันจะวิเคราะห์เพื่อเรียนรู้รูปแบบภาษาและสร้างการตอบสนองที่คล้ายมนุษย์

โดยทั่วไปแล้ว ในปัญญาประดิษฐ์ (AI) ข้อมูลป้อนเข้ามีอิทธิพลต่อข้อมูลส่งออก หากผู้ใช้ระบุว่าต้องการให้ภาพแสดงเฉพาะบุคคลที่มีสีผิวหรือเพศที่ต้องการเท่านั้น โมเดลก็จะนำข้อมูลนี้ไปพิจารณาด้วย

อย่างไรก็ตาม นอกเหนือจากนี้แล้ว โมเดลยังมักจะเลือกส่งคืนภาพบางภาพเป็นค่าเริ่มต้น ซึ่งมักเป็นผลมาจากการขาดความหลากหลายในข้อมูลฝึกฝน

การศึกษาล่าสุด ได้สำรวจว่า Midjourney แสดงภาพคำศัพท์ที่ดูเหมือนจะเป็นคำทั่วไปอย่างไร รวมถึงอาชีพเฉพาะทางด้านสื่อ (เช่น "นักวิเคราะห์ข่าว" "ผู้แสดงความคิดเห็นข่าว" และ "ผู้ตรวจสอบข้อเท็จจริง") และอาชีพทั่วไป (เช่น "นักข่าว" "ผู้รายงานข่าว" และ "การทำหนังสือพิมพ์")

การวิจัยเริ่มต้นเมื่อเดือนสิงหาคมปีที่แล้ว และมีการประเมินผลลัพธ์อีกครั้งหลังจากหกเดือนเพื่อประเมินความก้าวหน้าของระบบในช่วงเวลานั้น โดยรวมแล้ว นักวิจัยได้วิเคราะห์ภาพที่สร้างโดย AI มากกว่า 100 ภาพในช่วงเวลานี้

การเลือกปฏิบัติทางอายุและการเลือกปฏิบัติทางเพศ

ความคลาดเคลื่อนที่น่าเป็นห่วงในภาพที่ 2 เกิดจากผู้สร้างภาพเหล่านั้น — สำหรับอาชีพเฉพาะบางอาชีพ ผู้ที่มีอายุมากกว่ามักจะเป็นผู้ชายเสมอ ภาพ: IJN

สำหรับตำแหน่งงานที่ไม่เจาะจง Midjourney จะแสดงภาพเฉพาะชายและหญิงวัยหนุ่มสาวเท่านั้น สำหรับบทบาทเฉพาะทาง จะแสดงภาพทั้งคนหนุ่มสาวและผู้สูงอายุ แต่ผู้สูงอายุจะเป็นผู้ชายเสมอ

ผลลัพธ์เหล่านี้ตอกย้ำแบบแผนความคิดหลายอย่างโดยปริยาย รวมถึงสมมติฐานที่ว่าผู้สูงอายุไม่ทำงานในตำแหน่งที่ไม่ต้องใช้ความเชี่ยวชาญเฉพาะด้าน ว่ามีเพียงผู้ชายสูงอายุเท่านั้นที่เหมาะสมกับงานเฉพาะทาง และว่างานที่ไม่ต้องใช้ความเชี่ยวชาญเฉพาะด้านมักสงวนไว้สำหรับผู้หญิง

นอกจากนี้ ยังมีความแตกต่างที่เห็นได้ชัดในการนำเสนอภาพลักษณ์ของผู้ชายและผู้หญิง ตัวอย่างเช่น ผู้หญิงมักดูอ่อนเยาว์และปราศจากริ้วรอย ในขณะที่ผู้ชาย "ได้รับอนุญาต" ให้มีริ้วรอยได้

นอกจากนี้ AI ยังแสดงเพศในรูปแบบไบนารี (ชาย/หญิง) แทนที่จะแสดงตัวอย่างการแสดงออกทางเพศที่ยืดหยุ่นกว่า

อคติทางเชื้อชาติ

ความคลาดเคลื่อนที่น่าเป็นห่วงในภาพที่ 3 นั้นเกิดจากฝีมือของบุคคลอื่น — ภาพที่จัดทำขึ้นสำหรับ "นักข่าว" หรือ "ผู้สื่อข่าว" มักจะมีแต่คนผิวขาวเท่านั้น ภาพ: IJN

รูปภาพทั้งหมดที่แสดงผลลัพธ์จากการค้นหาด้วยคำต่างๆ เช่น "นักข่าว" หรือ "ผู้สื่อข่าว" จะแสดงเฉพาะรูปภาพของคนผิวขาวเท่านั้น

นี่อาจสะท้อนให้เห็นถึงการขาดความหลากหลายและการเป็นตัวแทนในข้อมูลการฝึกอบรม AI พื้นฐาน

การแบ่งชนชั้นและการอนุรักษ์นิยม

ตัวละครทั้งหมดในภาพมีลักษณะ "อนุรักษ์นิยม" ตัวอย่างเช่น ไม่มีใครมีรอยสัก เจาะร่างกาย ทรงผมแปลก ๆ หรือคุณลักษณะอื่นใดที่จะทำให้พวกเขาแตกต่างจากภาพวาดแบบดั้งเดิม

หลายคนสวมใส่ชุดทางการ เช่น เสื้อเชิ้ตและสูท ซึ่งเป็นตัวบ่งชี้ถึงความคาดหวังทางชนชั้น แม้ว่าการแต่งกายเช่นนี้อาจเหมาะสมกับบางบทบาท เช่น พิธีกรรายการโทรทัศน์ แต่ก็ไม่ได้สะท้อนถึงระเบียบการแต่งกายสำหรับนักข่าวหรือผู้สื่อข่าวโดยทั่วไปเสมอไป

การวางผังเมือง

ความคลาดเคลื่อนที่น่าเป็นห่วงในภาพที่ 4 นั้นเกิดจากฝีมือของบุคคลอื่น — ภาพทั้งหมดถ่ายในเมือง แม้ว่าจะไม่มีการระบุพิกัดทางภูมิศาสตร์ก็ตาม ภาพโดย: IJN

แม้ว่าจะไม่ได้ระบุสถานที่ทางภูมิศาสตร์หรือบริบทที่เฉพาะเจาะจง แต่ภาพที่ได้จาก AI นั้นรวมถึงพื้นที่ในเมือง เช่น ตึกระฟ้าหรือย่านที่พลุกพล่าน ซึ่งไม่ถูกต้อง เนื่องจากประชากร โลก เพียงกว่าครึ่งเล็กน้อยเท่านั้นที่อาศัยอยู่ในเมือง

ล้าสมัย

ภาพลักษณ์ของคนทำงานด้านสื่อมักแสดงให้เห็นเทคโนโลยีที่ล้าสมัย เช่น เครื่องพิมพ์ดีด เครื่องพิมพ์ และกล้องถ่ายรูปโบราณ

เนื่องจากปัจจุบันผู้เชี่ยวชาญหลายคนมีหน้าตาคล้ายคลึงกัน ปัญญาประดิษฐ์จึงดูเหมือนจะพึ่งพาเทคโนโลยีที่แตกต่างกันมากขึ้น (รวมถึงเทคโนโลยีที่ล้าสมัยและไม่ได้ใช้งานแล้ว) เพื่อทำให้บทบาทที่อธิบายไว้มีความชัดเจนยิ่งขึ้น

ดังนั้น หากคุณกำลังสร้างภาพ AI ของตัวเอง โปรดพิจารณาอคติที่อาจเกิดขึ้นเมื่อเขียนคำอธิบาย มิเช่นนั้น คุณอาจกำลังเสริมสร้างภาพลักษณ์เหมารวมที่เป็นอันตรายซึ่งสังคมพยายามกำจัดมานานหลายทศวรรษโดยไม่รู้ตัว

ฮวาง ตัน (ตามข้อมูลของกองทัพเรือญี่ปุ่น)

[โฆษณา_2]
แหล่งที่มา