El modelo de generación de imágenes de IA es mejor que ChatGPT.

Se dice que el V7, el modelo de MidJourney, es capaz de reproducir detalles como las manecillas con mayor consistencia. Foto: Xeophon .

Midjourney, una de las primeras herramientas de creación de imágenes impulsadas por inteligencia artificial en la web, acaba de lanzar su primer modelo nuevo en casi un año.

El modelo, llamado V7, se lanzó en fase beta a la medianoche del 4 de abril (hora de EE. UU.). Una semana antes, OpenAI también había lanzado una función similar con ChatGPT, que rápidamente se convirtió en un fenómeno en redes sociales, creando una nueva tendencia: crear fotos al estilo Ghibli.

Si eres nuevo en Midjourney, primero deberás evaluar las 200 imágenes que la herramienta sugiere según tus preferencias. Después, la herramienta creará un perfil personalizado para producir imágenes que se ajusten a tu estilo. V7 es el primer modelo de Midjourney que tiene la personalización activada por defecto.

Puedes activar o desactivar la versión 7 haciendo clic en la barra de herramientas "Versión" del sitio web. Además, este modelo se puede usar en el servidor de Discord de Midjourney.

El director ejecutivo de Midjourney, David Holz, describió V7 como una “arquitectura completamente diferente” en una publicación en X. “V7 es mucho más inteligente cuando se trata de manejar declaraciones de texto”, anunció Holz en Discord.

Comentó que el modelo también se adapta bastante bien a las imágenes originales. La calidad de la imagen ha mejorado notablemente gracias a un alto nivel de detalle. Desde partes del cuerpo como manos y pies hasta pecas y patrones cerámicos, todo es consistente hasta el más mínimo detalle.

Se crearon algunas imágenes de muestra con el modelo V7. Foto: X/MidJourney.

Además de los dos modos: Turbo (más caro) y Relax, V7 admite una nueva herramienta llamada Modo Borrador, que permite crear imágenes hasta 10 veces más rápido y a la mitad del costo del modo estándar. Las imágenes en modo Borrador tendrán menor calidad, pero los usuarios pueden ampliarlas y recrearlas con un solo clic.

Según Holz, algunas funciones estándar de Midjourney no están disponibles actualmente en la versión V7, como el escalado y la retexturización. Afirmó que estas funciones se añadirán próximamente, posiblemente en los próximos dos meses.

"Este es un modelo completamente nuevo con sus propias fortalezas, y quizás también algunas debilidades", escribió Holz en Discord. Señaló que la V7 podría requerir un nuevo estilo de escritura en línea de comandos y animó a todos a probar la versión para brindar comentarios constructivos.

El reportero de Techcrunch, Kyle Wiggers, comentó que el V7 ejecutaba bien sus comandos básicos. «El modelo de Midjourney no está específicamente optimizado para el estilo Ghibli, al menos no oficialmente, pero aun así puede producir obras estéticamente atractivas», añadió.

Según expertos en IA de Vietnam, la función de generación de imágenes de ChatGPT puede ser más sencilla y práctica que herramientas anteriores como MidJourney y Stable Diffusion. Sin embargo, el modelo de OpenAI aún no ha logrado un avance significativo en la calidad de imagen y podría ser inferior a la de herramientas anteriores.

Midjourney es una empresa bastante singular. Fundada en 2022 por Holz, cofundador del fabricante de periféricos para PC Leap Motion, Midjourney nunca ha recibido inversión externa.

La empresa tampoco revela su rendimiento comercial, pero CBInsights estimó que los ingresos de Midjourney a finales de 2023 rondarían los 200 millones de dólares . Recientemente, la empresa declaró que está formando un equipo de hardware para trabajar en varios proyectos no revelados y que continúa entrenando modelos previamente anunciados para crear vídeos y objetos 3D.

Al igual que ChatGPT, MidJourney enfrenta varias demandas que alegan violaciones de los derechos de millones de artistas al entrenar herramientas de IA en imágenes recopiladas de la web sin el consentimiento de los creadores de las imágenes.

Kommentar (0)