ChatGPT "dibuja como una foto"
El 26 de marzo, la comunidad de usuarios de IA (inteligencia artificial) de todo el mundo , incluyendo Vietnam, se mostró entusiasmada con el lanzamiento oficial de la función Imágenes en ChatGPT por parte de OpenAI, que amplía las capacidades de creación de imágenes para los usuarios del modelo inteligente de la compañía. Anteriormente, ChatGPT también podía crear imágenes, pero de forma limitada y requería el uso de DALL-E, otro conocido modelo de conversión de texto a imagen.
La capacidad de la herramienta para convertir texto en dibujos y «combinar imágenes como en Photoshop» atrajo rápidamente la atención. Muchos afirmaron que la calidad de imagen resultante era «increíble» y la mayoría la calificó de «superior» a la de los modelos de IA más populares del mercado.
ChatGPT crea tazas de café realistas con un simple comando.
Según Gabriel Goh, líder de un equipo de investigación en OpenAI, la mejora significativa en las capacidades de generación de imágenes de ChatGPT gracias al modelo GPT-4o radica en el "enlace" (Binding), término que describe el grado en que el generador de imágenes de IA mantiene la relación entre atributos y objetos. Goh afirmó que GPT-4o puede enlazar con precisión los atributos de entre 15 y 20 objetos diferentes sin confusión, lo que mejora notablemente la precisión y la fiabilidad del contenido generado.
Además de destacar por su capacidad para crear imágenes, Images in ChatGPT también resuelve la principal debilidad de otras herramientas de IA para la generación de imágenes: la visualización de texto dentro de la imagen. De hecho, muchas imágenes con texto se muestran correctamente, lo que dificulta distinguir entre imágenes falsas y reales.
La desventaja de esta herramienta es que tarda bastante en generar imágenes, pero se considera razonable, ya que la demora se debe a que obtener imágenes de buena calidad, con detalles precisos y que coincidan con la descripción del usuario siempre requiere paciencia. El equipo de investigación afirmó que este problema se solucionará en el futuro.
Muchas dudas sobre la capacidad de combinar fotos
Además de la diversión que ChatGPT y OpenAI ofrecen a los usuarios en su experiencia inicial, la cuestión de la seguridad de la información, la privacidad y el riesgo de explotación vuelve a ser prioritaria. «En un futuro próximo, las imágenes que veas en línea no necesariamente serán reales», expresó con preocupación un usuario de Facebook en Vietnam, quien pudo pedirle a ChatGPT que creara imágenes completamente irreales pero con una apariencia tan realista como las fotografías. Por ejemplo, una foto del actor y exluchador Dwayne Johnson (La Roca) anunciando una marca de chicles, o una imagen de una gata calicó sentada en la estufa que parece una fotografía.
Gracias a las instrucciones detalladas que se proporcionan, los usuarios pueden crear resultados sorprendentes sin necesidad de tener un conocimiento profundo del uso de las herramientas de edición fotográfica tradicionales.
Mucha gente incluso ha probado la función de "desnudo" de la nueva herramienta. TN ( Hanói ) comentó que usó una foto de una modelo descargada de internet para pedirle a ChatGPT que cambiara de ropa según lo solicitado, y casi todos los comandos se ejecutaron con gran precisión. "Sin embargo, hubo algunos rechazos, principalmente por infringir las normas del sistema sobre la creación de imágenes con derechos de autor o contenido demasiado subido de tono", añadió TN.
En las pruebas de Thanh Nien , ChatGPT se negó a crear imágenes relacionadas con personajes famosos o con derechos de autor, ya sean reales o de películas o historias. «No puedo crear la imagen solicitada porque la imagen de referencia que enviaste muestra claramente al personaje Doctor Strange, un personaje con derechos de autor de Marvel, lo cual infringe la política de contenido vigente», respondió el sistema al pedírsele que creara una imagen del Doctor Strange sentado... bebiendo té helado en Vietnam.
Jackie Shannon, responsable de productos multimodales en ChatGPT, confirmó que las imágenes en ChatGPT cuentan con una sólida protección contra deepfakes, contenido pornográfico o fraudulento. Cabe destacar que las imágenes generadas integrarán metadatos estándar C2PA para identificarlas como productos de IA, pero requieren herramientas específicas para su verificación.
Sin embargo, todavía hay muchas personas que logran burlar la ley y usar imágenes de personas famosas con fines de entretenimiento. Por ejemplo, la imagen del director ejecutivo Tim Cook sosteniendo un teléfono Samsung en lugar de un iPhone, la imagen del actor Robert Downey Jr. masticando un caramelo de verduras, o la fotografía de Cristiano Ronaldo disputando un balón con Lionel Messi en un callejón de Vietnam frente a mucha gente...
Fuente: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






Kommentar (0)