Vietnam.vn - Nền tảng quảng bá Việt Nam

Beispiele für Verzerrungen in KI-generierten Bildern

Công LuậnCông Luận13/07/2023


Wie funktionieren KI-gestützte Bildgeneratoren?

Bildgeneratoren auf Basis künstlicher Intelligenz nutzen Modelle des maschinellen Lernens und verwenden vom Benutzer eingegebenen Text, um ein oder mehrere Bilder zu erstellen, die der Beschreibung entsprechen. Das Training dieser Modelle erfordert riesige Datensätze mit Millionen von Bildern.

Die besorgniserregenden Ungenauigkeiten im Bild sind auf denjenigen zurückzuführen, der es erstellt hat (Bild 1).

Die Erstellung von Bildern mithilfe von KI wird immer einfacher. Foto: Ijnet

Obwohl Midjourney und DALL-E 2 die genaue Funktionsweise ihrer Algorithmen nicht öffentlich offengelegt haben, nutzen die meisten KI-Bildgeneratoren ein Verfahren namens Diffusion. Diffusionsmodelle funktionieren, indem sie den Trainingsdaten zufälliges „Rauschen“ hinzufügen und anschließend lernen, die Daten durch Entfernen des Rauschens zu rekonstruieren. Das Modell wiederholt diesen Prozess, bis es ein Bild erzeugt, das dem Eingabebild entspricht.

Dies unterscheidet sich von groß angelegten Sprachmodellen wie ChatGPT. Groß angelegte Sprachmodelle werden mit unbeschrifteten Textdaten trainiert, die sie analysieren, um Sprachmuster zu lernen und menschenähnliche Antworten zu generieren.

Im Allgemeinen gilt für KI: Die Eingabe beeinflusst die Ausgabe. Wenn der Benutzer angibt, dass nur Personen bestimmter Hautfarben oder Geschlechter im Bild enthalten sein sollen, berücksichtigt das Modell dies.

Darüber hinaus neigt das Modell jedoch dazu, standardmäßig bestimmte Bilder zurückzugeben. Dies ist häufig auf mangelnde Diversität in den Trainingsdaten zurückzuführen.

Eine aktuelle Studie untersuchte, wie Midjourney scheinbar allgemeine Begriffe visualisierte, darunter spezialisierte Medienberufe (wie „Nachrichtenanalyst“, „Nachrichtenkommentator“ und „Faktenchecker“) und allgemeinere Berufe (wie „Journalist“, „Reporter“ und „Zeitungswesen“).

Die Forschung begann im vergangenen August, und die Ergebnisse wurden nach sechs Monaten erneut ausgewertet, um die Fortschritte des Systems in diesem Zeitraum zu beurteilen. Insgesamt analysierten die Forscher in diesem Zeitraum über 100 KI-generierte Bilder.

Altersdiskriminierung und Geschlechterdiskriminierung

Die besorgniserregenden Diskrepanzen in Bild 2 sind darauf zurückzuführen, wer sie erstellt hat.

In bestimmten Berufen ist die ältere Person immer männlich. Foto: IJN

In Midjourney werden für nicht näher spezifizierte Berufsbezeichnungen ausschließlich jüngere Männer und Frauen dargestellt. Für spezialisierte Rollen kommen sowohl junge als auch ältere Personen vor, wobei die älteren jedoch stets männlich sind.

Diese Ergebnisse verstärken implizit mehrere Stereotypen, darunter die Annahme, dass ältere Menschen keine nicht spezialisierten Positionen bekleiden, dass nur ältere Männer für spezialisierte Arbeit geeignet sind und dass weniger spezialisierte Arbeit typischerweise Frauen vorbehalten ist.

Es gibt auch deutliche Unterschiede in der Darstellung von Männern und Frauen. Frauen werden beispielsweise als jünger und faltenfrei dargestellt, während Männern Falten „erlaubt“ werden.

Die KI scheint Geschlecht zudem in einem binären Format darzustellen, anstatt Beispiele für flexiblere Geschlechtsausdrücke aufzuzeigen.

Rassenvorurteile

Die besorgniserregenden Ungenauigkeiten in Bild 3 wurden von jemandem verursacht.

Bilder, die für „Reporter“ oder „Journalisten“ bestimmt sind, zeigen typischerweise nur weiße Menschen. Foto: IJN

Alle Suchergebnisse für Begriffe wie „Journalist“ oder „Reporter“ zeigen ausschließlich Bilder von weißen Menschen.

Dies könnte auf einen Mangel an Diversität und Repräsentativität in den zugrunde liegenden KI-Trainingsdaten hindeuten.

Klassismus und Konservatismus

Alle abgebildeten Personen haben zudem ein eher konservatives Erscheinungsbild. Beispielsweise weisen sie weder Tätowierungen noch Piercings, ungewöhnliche Frisuren oder andere Merkmale auf, die sie von traditionellen Darstellungen unterscheiden würden.

Viele tragen auch formelle Kleidung wie Hemden und Anzüge. Diese spiegeln die Erwartungen an die soziale Schicht wider. Zwar mag diese Kleidung für bestimmte Berufe, beispielsweise für Fernsehmoderatoren, angemessen sein, sie entspricht aber nicht unbedingt dem allgemeinen Dresscode für Reporter oder Journalisten.

Städtebau

Die besorgniserregenden Ungenauigkeiten in Bild 4 wurden von jemandem verursacht.

Die Aufnahmen entstanden alle in der Stadt, allerdings ohne geografische Angabe. Foto: IJN

Obwohl kein spezifischer geografischer Ort oder Kontext angegeben wird, zeigen die von der KI gelieferten Bilder städtische Räume wie Wolkenkratzer oder belebte Viertel. Dies ist falsch, da nur etwas mehr als die Hälfte der Weltbevölkerung in Städten lebt.

Veraltet

Auf Bildern von Medienschaffenden sind oft veraltete Technologien wie Schreibmaschinen, Drucker und Vintage-Kameras zu sehen.

Da viele Berufsgruppen heutzutage einander ähneln, scheint KI auf differenziertere Technologien zurückzugreifen (einschließlich solcher, die veraltet sind und nicht mehr verwendet werden), um die beschriebenen Rollen klarer zu definieren.

Wenn Sie also eigene KI-Bilder erstellen, sollten Sie beim Verfassen der Beschreibungen mögliche Verzerrungen berücksichtigen. Andernfalls verstärken Sie womöglich ungewollt schädliche Stereotype, die die Gesellschaft seit Jahrzehnten zu beseitigen versucht.

Hoang Ton (laut IJN)



Quelle

Etikett: Vorurteil

Kommentar (0)

Hinterlasse einen Kommentar, um deine Gefühle zu teilen!

Gleiches Thema

Gleiche Kategorie

Huynh Nhu schreibt bei den Südostasienspielen Geschichte: Ein Rekord, der nur sehr schwer zu brechen sein wird.
Die atemberaubende Kirche an der Highway 51 war zur Weihnachtszeit festlich beleuchtet und zog die Blicke aller Vorbeifahrenden auf sich.
Der Moment, als Nguyen Thi Oanh zum Ziel sprintete – eine Leistung, die in 5 Südostasienspielen ihresgleichen sucht.
Die Bauern im Blumendorf Sa Dec sind damit beschäftigt, ihre Blumen für das Festival und Tet (Mondneujahr) 2026 vorzubereiten.

Gleicher Autor

Erbe

Figur

Geschäft

Die Kirchen Hanois sind strahlend beleuchtet, und die Straßen sind von weihnachtlicher Stimmung erfüllt.

Aktuelles

Politisches System

Lokal

Produkt