Vietnam.vn - Nền tảng quảng bá Việt Nam

Exemples de biais dans les images générées par l'IA

Công LuậnCông Luận13/07/2023


Comment fonctionne le générateur d'images AI ?

Les générateurs d'images basés sur l'IA utilisent des modèles d'apprentissage automatique qui, à partir des textes saisis par l'utilisateur, génèrent une ou plusieurs images correspondant à la description. L'entraînement de ces modèles nécessite d'énormes ensembles de données contenant des millions d'images.

Qui a créé les étranges erreurs sur l'image ? Image 1

Créer des images avec l'IA devient plus facile. Photo : Ijnet

Bien que ni Midjourney ni DALL-E 2 ne divulguent publiquement le fonctionnement de leurs algorithmes, la plupart des générateurs d'images d'IA utilisent un processus appelé diffusion. Les modèles de diffusion fonctionnent en ajoutant du bruit aléatoire aux données d'entraînement, puis apprennent à reconstruire les données en supprimant les parties bruyantes. Le modèle répète ce processus jusqu'à obtenir une image correspondant à l'entrée.

Ceci diffère des grands modèles de langage comme ChatGPT. Ces grands modèles sont entraînés sur des données textuelles non étiquetées, qu'ils analysent pour apprendre des schémas linguistiques et générer des réponses de type humain.

En IA générative, l'entrée influence la sortie. Si un utilisateur précise qu'il souhaite uniquement inclure des personnes d'une certaine couleur de peau ou d'un certain sexe dans une image, le modèle en tiendra compte.

Cependant, le modèle aura également tendance à renvoyer par défaut certaines images. Cela résulte souvent d'un manque de diversité dans les données d'entraînement.

Une étude récente a exploré la manière dont Midjourney visualise des termes apparemment génériques, y compris des professions médiatiques spécialisées (telles que « analyste de nouvelles », « commentateur de nouvelles » et « vérificateur de faits ») et des professions plus générales (telles que « journaliste », « reporter », « journalisme »).

L'étude a été menée en août dernier et les résultats ont été réexaminés six mois plus tard pour évaluer les améliorations apportées au système. Au total, les chercheurs ont analysé plus de 100 images générées par l'IA durant cette période.

Âgisme et sexisme

Qui a créé les étranges erreurs dans l'image 2 ?

Pour certaines professions, l'aîné est toujours un homme. Photo : IJN

Pour les intitulés de poste non spécifiques, Midjourney ne présente que des images de jeunes hommes et de jeunes femmes. Pour des postes spécifiques, des personnes jeunes et plus âgées sont présentées, mais les plus âgées sont toujours des hommes.

Ces résultats renforcent implicitement un certain nombre de stéréotypes, notamment l’hypothèse selon laquelle les personnes âgées ne travaillent pas dans des postes non spécialisés, que seuls les hommes âgés sont aptes au travail professionnel et que le travail moins spécialisé est généralement réservé aux femmes.

On observe également des différences notables dans la façon dont les hommes et les femmes sont représentés. Par exemple, les femmes sont plus jeunes et sans rides, tandis que les hommes ont le droit d'en avoir.

L’IA semble également représenter le genre comme binaire, plutôt que de montrer des exemples d’expression de genre plus fluide.

Préjugés raciaux

Qui a créé les étranges erreurs dans l'image 3 ?

Les images de « reporters » ou de « journalistes » ne montrent souvent que des personnes blanches. Photo : IJN

Toutes les images renvoyées pour des termes tels que « journaliste », « reporter » ne montrent que des images de personnes blanches.

Cela peut refléter un manque de diversité et une sous-représentation dans les données de formation sous-jacentes de l'IA.

Classisme et conservatisme

Tous les personnages de l'image ont également une apparence « conservatrice ». Par exemple, aucun d'entre eux ne porte de tatouages, de piercings, de coiffures inhabituelles ou tout autre attribut qui les distinguerait des représentations traditionnelles.

De nombreuses personnes portent également des vêtements formels, tels que des chemises et des costumes. Ces vêtements reflètent les attentes sociales. Si cela peut convenir à certains rôles, comme celui de présentateur de télévision, cela ne reflète pas nécessairement la tenue vestimentaire habituelle des reporters ou des journalistes.

Urbanisme

Qui a créé les étranges erreurs sur l'image ? Image 4

Les images sont toutes situées en ville par défaut, sans aucune référence géographique. Photo : IJN

Bien qu'aucun lieu ni contexte géographique ne soit spécifié, les images renvoyées par l'IA incluent des espaces urbains tels que des gratte-ciel ou des rues animées. C'est faux, car un peu plus de la moitié de la population mondiale vit en ville.

Dépassé

Les images des travailleurs des médias incluent des technologies obsolètes telles que des machines à écrire, des imprimantes et des appareils photo vintage.

Étant donné que de nombreux professionnels se ressemblent aujourd’hui, l’IA semble s’appuyer sur des technologies plus différenciées (y compris des technologies obsolètes et inutilisées) pour rendre les rôles décrits plus distincts.

Si vous créez vos propres images d'IA, tenez compte des biais potentiels lors de la rédaction des descriptions. Sinon, vous risquez de renforcer par inadvertance des stéréotypes néfastes que la société s'efforce de dissiper depuis des décennies.

Hoang Ton (selon IJN)



Source

Comment (0)

No data
No data

Même sujet

Même catégorie

Des champs en terrasses d'une beauté époustouflante dans la vallée de Luc Hon
Les fleurs « Rich » coûtant 1 million de VND chacune sont toujours populaires le 20 octobre
Les films vietnamiens et le parcours vers les Oscars
Les jeunes se rendent dans le Nord-Ouest pour s'enregistrer pendant la plus belle saison du riz de l'année

Même auteur

Patrimoine

Chiffre

Entreprise

Les jeunes se rendent dans le Nord-Ouest pour s'enregistrer pendant la plus belle saison du riz de l'année

Événements actuels

Système politique

Locale

Produit