Vietnam.vn - Nền tảng quảng bá Việt Nam

Ejemplos de sesgo en imágenes generadas por IA

Công LuậnCông Luận13/07/2023

[anuncio_1]

¿Cómo funciona el generador de imágenes de IA?

Los generadores de imágenes basados ​​en IA utilizan modelos de aprendizaje automático que toman el texto introducido por el usuario y generan una o más imágenes que coinciden con la descripción. El entrenamiento de estos modelos requiere enormes conjuntos de datos con millones de imágenes.

¿Quién creó los extraños errores en la imagen? Imagen 1

Crear imágenes con IA es cada vez más fácil. Foto: Ijnet

Aunque ni Midjourney ni DALL-E 2 revelan públicamente el funcionamiento de sus algoritmos, la mayoría de los generadores de imágenes de IA utilizan un proceso llamado difusión. Los modelos de difusión funcionan añadiendo ruido aleatorio a los datos de entrenamiento y luego aprenden a reconstruir los datos eliminando las partes ruidosas. El modelo repite este proceso hasta generar una imagen que coincida con la entrada.

Esto difiere de los modelos de lenguaje grandes como ChatGPT. Estos se entrenan con datos de texto sin etiquetar, que analizan para aprender patrones lingüísticos y generar respuestas similares a las humanas.

En la IA generativa, la entrada afecta la salida. Si un usuario especifica que solo quiere incluir personas con un determinado color de piel o género en una imagen, el modelo lo tendrá en cuenta.

Sin embargo, además de esto, el modelo también tenderá a devolver ciertas imágenes por defecto. Esto suele deberse a la falta de diversidad en los datos de entrenamiento.

Un estudio recienteexploró cómo Midjourney visualiza términos aparentemente genéricos, incluidas ocupaciones de medios especializados (como “analista de noticias”, “comentarista de noticias” y “verificador de hechos”) y ocupaciones más generales (como “periodista”, “reportero”, “periodismo”).

El estudio comenzó en agosto pasado y los resultados se analizaron seis meses después para comprobar cómo había mejorado el sistema durante ese tiempo. En total, los investigadores analizaron más de 100 imágenes generadas por IA durante ese periodo.

Edadismo y sexismo

¿Quién creó los extraños errores en la imagen? Imagen 2

En ciertas ocupaciones, los ancianos siempre son hombres. Foto: IJN

Para puestos de trabajo no específicos, Midjourney solo muestra imágenes de hombres y mujeres jóvenes. Para puestos específicos, se muestran tanto personas jóvenes como mayores, pero estas últimas siempre son hombres.

Estos resultados refuerzan implícitamente una serie de estereotipos, incluida la suposición de que las personas mayores no trabajan en puestos no especializados, que sólo los hombres mayores son aptos para el trabajo profesional y que el trabajo menos especializado suele estar reservado para las mujeres.

También hay diferencias notables en la imagen de hombres y mujeres. Por ejemplo, las mujeres son más jóvenes y sin arrugas, mientras que a los hombres se les permite tenerlas.

La IA también parece representar el género como binario, en lugar de mostrar ejemplos de expresión de género más fluida.

prejuicio racial

¿Quién creó los extraños errores en la imagen? Imagen 3

Las imágenes de "reporteros" o "periodistas" suelen mostrar solo personas blancas. Foto: IJN

Todas las imágenes devueltas para términos como “periodista” o “reportero” solo muestran imágenes de personas blancas.

Esto puede reflejar una falta de diversidad y subrepresentación en los datos de entrenamiento subyacentes de la IA.

Clasismo y conservadurismo

Todos los personajes de la imagen también tienen una apariencia conservadora. Por ejemplo, ninguno tiene tatuajes, piercings, peinados inusuales ni ningún otro atributo que los distinga de las representaciones tradicionales.

Mucha gente también usa ropa formal, como camisas y trajes. Estos son indicadores de las expectativas de clase. Si bien esto puede ser apropiado para ciertos roles, como los presentadores de televisión, no necesariamente refleja fielmente cómo se visten generalmente los reporteros o periodistas.

Urbanismo

¿Quién creó los extraños errores en la imagen? Imagen 4

Las imágenes se ambientan en la ciudad por defecto, aunque no hay referencia geográfica. Foto: IJN

A pesar de no especificar ubicación ni contexto geográfico, las imágenes devueltas por la IA incluían espacios urbanos como rascacielos o calles concurridas. Esto no es cierto, ya que poco más de la mitad de la población mundial vive en ciudades.

Anticuado

Las imágenes de trabajadores de los medios incluyen tecnologías obsoletas como máquinas de escribir, impresoras y cámaras antiguas.

Como hoy en día muchos profesionales parecen iguales, la IA parece estar recurriendo a tecnologías más diferenciadas (incluidas otras obsoletas y en desuso) para hacer que los roles descritos sean más distintos.

Así que, si creas tus propias imágenes de IA, ten en cuenta los posibles sesgos al escribir las descripciones. De lo contrario, podrías estar reforzando sin darte cuenta estereotipos dañinos que la sociedad lleva décadas intentando disipar.

Hoang Ton (según la IJN)


[anuncio_2]
Fuente

Etikett: prejuicio

Kommentar (0)

No data
No data
Contemple la brillante ciudad costera de Quy Nhon, Gia Lai, por la noche.
Imagen de campos en terrazas en Phu Tho, con suave pendiente, brillantes y hermosos como espejos antes de la temporada de siembra.
La fábrica Z121 está lista para la Noche Final Internacional de Fuegos Artificiales
La famosa revista de viajes elogia la cueva Son Doong como "la más magnífica del planeta"
Una cueva misteriosa atrae a turistas occidentales, comparada con la "cueva Phong Nha" en Thanh Hoa
Descubra la belleza poética de la bahía de Vinh Hy
¿Cómo se procesa el té más caro de Hanoi, cuyo precio supera los 10 millones de VND/kg?
Sabor de la región del río
Hermoso amanecer sobre los mares de Vietnam
El majestuoso arco de la cueva en Tu Lan

Herencia

Cifra

Negocio

No videos available

Noticias

Sistema político

Local

Producto