¿Cómo funciona el generador de imágenes de IA?
Los generadores de imágenes basados en IA utilizan modelos de aprendizaje automático que toman el texto introducido por el usuario y generan una o más imágenes que coinciden con la descripción. El entrenamiento de estos modelos requiere enormes conjuntos de datos con millones de imágenes.
Crear imágenes con IA es cada vez más fácil. Foto: Ijnet
Aunque ni Midjourney ni DALL-E 2 revelan públicamente el funcionamiento de sus algoritmos, la mayoría de los generadores de imágenes de IA utilizan un proceso llamado difusión. Los modelos de difusión funcionan añadiendo ruido aleatorio a los datos de entrenamiento y luego aprenden a reconstruir los datos eliminando las partes ruidosas. El modelo repite este proceso hasta generar una imagen que coincida con la entrada.
Esto difiere de los modelos de lenguaje grandes como ChatGPT. Estos se entrenan con datos de texto sin etiquetar, que analizan para aprender patrones lingüísticos y generar respuestas similares a las humanas.
En la IA generativa, la entrada afecta la salida. Si un usuario especifica que solo quiere incluir personas con un determinado color de piel o género en una imagen, el modelo lo tendrá en cuenta.
Sin embargo, además de esto, el modelo también tenderá a devolver ciertas imágenes por defecto. Esto suele deberse a la falta de diversidad en los datos de entrenamiento.
Un estudio recienteexploró cómo Midjourney visualiza términos aparentemente genéricos, incluidas ocupaciones de medios especializados (como “analista de noticias”, “comentarista de noticias” y “verificador de hechos”) y ocupaciones más generales (como “periodista”, “reportero”, “periodismo”).
El estudio comenzó en agosto pasado y los resultados se analizaron seis meses después para comprobar cómo había mejorado el sistema durante ese tiempo. En total, los investigadores analizaron más de 100 imágenes generadas por IA durante ese periodo.
Edadismo y sexismo
En ciertas ocupaciones, los ancianos siempre son hombres. Foto: IJN
Para puestos de trabajo no específicos, Midjourney solo muestra imágenes de hombres y mujeres jóvenes. Para puestos específicos, se muestran tanto personas jóvenes como mayores, pero estas últimas siempre son hombres.
Estos resultados refuerzan implícitamente una serie de estereotipos, incluida la suposición de que las personas mayores no trabajan en puestos no especializados, que sólo los hombres mayores son aptos para el trabajo profesional y que el trabajo menos especializado suele estar reservado para las mujeres.
También hay diferencias notables en la imagen de hombres y mujeres. Por ejemplo, las mujeres son más jóvenes y sin arrugas, mientras que a los hombres se les permite tenerlas.
La IA también parece representar el género como binario, en lugar de mostrar ejemplos de expresión de género más fluida.
prejuicio racial
Las imágenes de "reporteros" o "periodistas" suelen mostrar solo personas blancas. Foto: IJN
Todas las imágenes devueltas para términos como “periodista” o “reportero” solo muestran imágenes de personas blancas.
Esto puede reflejar una falta de diversidad y subrepresentación en los datos de entrenamiento subyacentes de la IA.
Clasismo y conservadurismo
Todos los personajes de la imagen también tienen una apariencia conservadora. Por ejemplo, ninguno tiene tatuajes, piercings, peinados inusuales ni ningún otro atributo que los distinga de las representaciones tradicionales.
Mucha gente también usa ropa formal, como camisas y trajes. Estos son indicadores de las expectativas de clase. Si bien esto puede ser apropiado para ciertos roles, como los presentadores de televisión, no necesariamente refleja fielmente cómo se visten generalmente los reporteros o periodistas.
Urbanismo
Las imágenes se ambientan en la ciudad por defecto, aunque no hay referencia geográfica. Foto: IJN
A pesar de no especificar ubicación ni contexto geográfico, las imágenes devueltas por la IA incluían espacios urbanos como rascacielos o calles concurridas. Esto no es cierto, ya que poco más de la mitad de la población mundial vive en ciudades.
Anticuado
Las imágenes de trabajadores de los medios incluyen tecnologías obsoletas como máquinas de escribir, impresoras y cámaras antiguas.
Como hoy en día muchos profesionales parecen iguales, la IA parece estar recurriendo a tecnologías más diferenciadas (incluidas otras obsoletas y en desuso) para hacer que los roles descritos sean más distintos.
Así que, si creas tus propias imágenes de IA, ten en cuenta los posibles sesgos al escribir las descripciones. De lo contrario, podrías estar reforzando sin darte cuenta estereotipos dañinos que la sociedad lleva décadas intentando disipar.
Hoang Ton (según la IJN)
[anuncio_2]
Fuente
Kommentar (0)