(CLO) Google acaba de lanzar una nueva herramienta de inteligencia artificial (IA) llamada "Whist", que permite a los usuarios cargar fotos para recuperar imágenes compuestas generadas por IA, incluso sin ingresar ningún texto.
Whisk utiliza IA para combinar el sujeto, el fondo y el estilo de una foto cargada, creando así una imagen fresca y única.
Google describe Whisk como una "herramienta creativa" que ayuda a los usuarios a generar rápidamente nuevas ideas visuales sin necesidad de conocimientos profesionales de edición fotográfica. Según Google, esta herramienta no es un editor de imágenes tradicional, sino una emocionante herramienta de inteligencia artificial diseñada para estimular la creatividad y el descubrimiento rápido.
Cuando un usuario carga una imagen, Whisk utiliza una combinación del servicio de inteligencia artificial de Google, Gemini, y la tecnología Imagen 3, una herramienta de creación de texto a imagen que Google adquirió de DeepMind.
Gemini analizará la imagen y generará un título, luego Imagen 3 combinará creativamente elementos de esa imagen, preservando la "esencia" del tema en lugar de una copia exacta.
Interfaz de la herramienta Batir. Captura de pantalla.
Esto significa que el resultado final podría no ser 100 % idéntico a la imagen original. Por ejemplo, la altura, el peinado o el tono de piel de los sujetos de la nueva imagen podrían diferir de los originales. Sin embargo, los usuarios aún pueden ajustar la información de entrada, cambiar el fondo, el estilo o combinar varios temas para crear imágenes diferentes.
Whisk puede generar imágenes no solo a partir de texto, sino también de imágenes originales, ampliando así las posibilidades creativas sin necesidad de experiencia en edición fotográfica. Thomas Iljic, director de gestión de productos de Google Labs, afirmó: «Whisk está diseñado para ayudar a los usuarios a combinar creativamente sujetos, fondos y estilos, permitiéndoles explorar visualmente en lugar de editar meticulosamente cada píxel».
Aunque Whisk todavía se encuentra en sus primeras etapas de desarrollo, la herramienta se ha lanzado como un sitio web en Google Labs y ahora está disponible para los usuarios en EE. UU.
Dan Ives, director general y analista senior de Wedbush Securities, dijo que Whisk marca otro "momento de fortaleza" para Google en la carrera tecnológica.
Ives también señaló que DeepMind, el laboratorio de IA que Google adquirió en 2014, es un activo crucial que le ayuda a Google a mantener su posición en el campo de la IA. Los productos de IA, como Whisk, son una parte clave de la estrategia de desarrollo de productos de Google para los próximos años, y se espera el lanzamiento de muchos nuevos productos en 2025.
Las herramientas de Whisk abren nuevas vías para el uso de la IA y la creación de productos innovadores con mínima intervención del usuario. Esto demuestra el progreso de la IA en la comprensión y la combinación creativa de elementos visuales.
Whisk forma parte de una fuerte tendencia entre las principales empresas tecnológicas, como Google y OpenAI, de desarrollar herramientas de IA para los consumidores. Estas herramientas buscan ofrecer experiencias creativas innovadoras, desde la creación de imágenes y texto hasta vídeo . Recientemente, OpenAI también presentó Sora, una herramienta de creación de texto a vídeo, competidora directa de Whisk.
Ngoc Anh (según CNN, The Verge, ZDNET)
[anuncio_2]
Fuente: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html






Kommentar (0)