(CLO) Google щойно запустив новий інструмент штучного інтелекту (ШІ) під назвою «Whisk», який дозволяє користувачам завантажувати фотографії для отримання об’єднаних зображень, згенерованих ШІ, навіть якщо користувач не вводить жодного тексту.
Whisk використовує штучний інтелект для поєднання теми, контексту та стилю завантаженої фотографії, створюючи нове та більш унікальне зображення.
Google описує Whisk як «креативний інструмент», який допомагає користувачам швидко генерувати нові візуальні ідеї без необхідності професійних навичок редагування фотографій. За словами Google, цей інструмент не є традиційним редактором зображень, а радше цікавим інструментом штучного інтелекту, метою якого є стимулювання креативності та швидких відкриттів .
Коли користувач завантажує фотографію, Whisk використовує комбінацію сервісу штучного інтелекту Google, Gemini, та технології Imagen 3 – інструменту, який створює зображення з тексту, отриманого Google від DeepMind.
Gemini проаналізує фотографію та створить підпис, потім Imagen 3 креативно поєднає елементи цієї фотографії, зберігаючи «сутність» об’єкта, а не копіюючи його точно.
Інтерфейс інструмента «Віск». Знімок екрана.
Це означає, що кінцевий результат може бути не на 100% ідентичним оригінальному зображенню. Наприклад, зріст, зачіска або тон шкіри об’єктів на новому зображенні можуть відрізнятися від оригіналу. Однак користувачі все ще можуть коригувати вхідну інформацію, змінювати контекст, стиль або поєднувати кілька об’єктів для створення різних зображень.
Whisk може створювати зображення не лише з тексту, а й зі стокових зображень, розширюючи творчі можливості без необхідності мати досвід редагування фотографій від користувачів. «Whisk розроблений, щоб допомогти користувачам творчо поєднувати теми, контексти та стилі, дозволяючи їм візуально досліджувати, а не ретельно редагувати кожен піксель», – сказав Томас Ілліч, директор з управління продуктами в Google Labs.
Хоча Whisk перебуває на ранніх стадіях розробки, інструмент було запущено як вебсайт у Google Labs і тепер доступний для користувачів у США.
Ден Айвз, керуючий директор і старший аналітик Wedbush Securities, сказав, що Whisk знаменує собою ще один «момент демонстрації сили» для Google у технологічній гонці.
Айвз також зазначив, що DeepMind, лабораторія штучного інтелекту, яку Google придбала у 2014 році, є ключовим активом, який допомагає Google зберегти свої позиції в галузі штучного інтелекту. Продукти штучного інтелекту, включаючи Whisk, є ключовою частиною стратегії розвитку продуктів Google у найближчі роки, і очікується, що до 2025 року буде запущено кілька нових продуктів.
Інструмент Whisk відкриває нові можливості використання штучного інтелекту для створення креативних продуктів з мінімальним втручанням користувача. Це демонструє прогрес штучного інтелекту в розумінні та творчому поєднанні візуальних елементів.
Whisk є частиною зростаючої тенденції серед великих технологічних компаній, включаючи Google та OpenAI, щодо розробки орієнтованих на споживача інструментів штучного інтелекту, спрямованих на створення нових творчих вражень, від створення зображень, тексту та відео . OpenAI нещодавно представила генератор тексту у відео під назвою Sora, який безпосередньо конкурує з Whisk.
Нгок Ань (за даними CNN, The Verge, ZDNET)
Джерело: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html






Коментар (0)