Hur fungerar en AI-bildgenerator?
AI-baserade bildgeneratorer använder maskininlärningsmodeller som tar användarinmatad text och genererar en eller flera bilder som matchar beskrivningen. Att träna dessa modeller kräver enorma datamängder med miljontals bilder.
Att skapa bilder med AI blir enklare. Foto: Ijnet
Även om varken Midjourney eller DALL-E 2 offentliggör hur deras algoritmer fungerar, använder de flesta AI-bildgeneratorer en process som kallas diffusion. Diffusionsmodeller fungerar genom att lägga till slumpmässigt "brus" till träningsdata och sedan lära sig att rekonstruera data genom att ta bort de brusiga delarna. Modellen upprepar denna process tills den har en bild som matchar indata.
Detta skiljer sig från stora språkmodeller som ChatGPT. Stora språkmodeller tränas på omärkt textdata, som de analyserar för att lära sig språkmönster och generera människoliknande svar.
I generativ AI påverkar indata utdata. Om en användare anger att de bara vill inkludera personer med en viss hudfärg eller kön i en bild, tar modellen hänsyn till det.
Utöver detta tenderar dock modellen också att returnera vissa bilder som standard. Detta beror ofta på bristande mångfald i träningsdata.
En nyligen genomförd studie undersökte hur Midjourney visualiserar till synes generiska termer, inklusive specialiserade medieyrken (som "nyhetsanalytiker", "nyhetskommentator" och "faktagranskare") och mer allmänna yrken (som "journalist", "reporter", "journalistik").
Studien genomfördes i augusti förra året, och resultaten gjordes om sex månader senare för att se hur systemet hade förbättrats under den tiden. Totalt analyserade forskarna mer än 100 AI-genererade bilder under den tiden.
Åldersdiskriminering och sexism
För specifika yrken är den äldre alltid man. Foto: IJN
För ospecifika jobbtitlar visar Midjourney endast bilder på yngre män och kvinnor. För specifika roller visas både yngre och äldre personer, men de äldre personerna är alltid män.
Dessa resultat förstärker implicit ett antal stereotyper, inklusive antagandet att äldre inte arbetar i icke-specialiserade positioner, att endast äldre män är lämpade för professionellt arbete och att mindre specialiserat arbete vanligtvis är reserverat för kvinnor.
Det finns också märkbara skillnader i hur män och kvinnor framställs. Till exempel är kvinnor yngre och rynkfria, medan män "får" ha rynkor.
AI verkar också representera kön som binärt, snarare än att visa exempel på mer flytande könsuttryck.
Rasfördomar
Bilder för "reportrar" eller "journalister" visar ofta bara vita personer. Foto: IJN
Alla bilder som returneras för termer som ”journalist” och ”reporter” visar endast bilder av vita personer.
Detta kan återspegla en brist på mångfald och underrepresentation i AI:s underliggande träningsdata.
Klassism och konservatism
Alla karaktärer på bilden har också ett "konservativt" utseende. Till exempel har ingen av dem tatueringar, piercingar, ovanliga frisyrer eller andra attribut som skulle skilja dem från traditionella avbildningar.
Många bär också formella kläder som skjortor och kostymer. Dessa är indikatorer på klassförväntningar. Även om detta kan vara lämpligt för vissa roller, som tv-presentatörer, är det inte nödvändigtvis en korrekt återspegling av hur reportrar eller journalister i allmänhet klär sig.
Urbanism
Bilderna är som standard inställda i staden, även om det inte finns någon geografisk referens. Foto: IJN
Trots att ingen plats eller geografisk kontext anges, inkluderar bilderna som AI returnerar urbana ytor som skyskrapor eller livliga gator. Detta stämmer inte eftersom drygt hälften av världens befolkning bor i städer.
Föråldrad
Bilder på mediearbetare inkluderar föråldrad teknik som skrivmaskiner, skrivare och vintagekameror.
Eftersom många yrkesverksamma ser likadana ut idag, verkar AI dra nytta av mer differentierade teknologier (inklusive föråldrade och oanvända) för att göra de beskrivna rollerna mer distinkta.
Så om du skapar dina egna AI-bilder, tänk på potentiella fördomar när du skriver beskrivningar. Annars kan du oavsiktligt förstärka skadliga stereotyper som samhället har ägnat årtionden åt att försöka skingra.
Hoang Ton (enligt IJN)
[annons_2]
Källa
Kommentar (0)