(CLO) Компания Google только что запустила новый инструмент искусственного интеллекта (ИИ) под названием "Whist", который позволяет пользователям загружать фотографии для получения составных изображений, сгенерированных ИИ, даже без ввода текста.
Whisk использует ИИ для объединения темы, контекста и стиля загруженной фотографии, создавая новое и более уникальное изображение.
Google описывает Whisk как «креативный инструмент», который помогает пользователям быстро генерировать новые визуальные идеи, не требуя профессиональных навыков редактирования фотографий. По словам Google, это не традиционный редактор изображений, а скорее увлекательный инструмент на основе искусственного интеллекта, призванный стимулировать творческие способности и быстро находить новые идеи .
Когда пользователь загружает фотографию, Whisk использует комбинацию сервиса искусственного интеллекта Google, Gemini и технологии Imagen 3 — инструмента, создающего изображения из текста, который Google приобрела у DeepMind.
Gemini проанализирует фотографию и создаст подпись, затем Imagen 3 творчески объединит элементы этой фотографии, сохраняя «суть» объекта, а не копируя его в точности.
Интерфейс инструмента «Веер». Скриншот.
Это означает, что конечный результат может быть не на 100% идентичен исходному изображению. Например, рост, прическа или тон кожи людей на новом изображении могут отличаться от оригинала. Однако пользователи по-прежнему могут корректировать входную информацию, изменять фон, стиль или комбинировать несколько тем для создания различных изображений.
Whisk может создавать изображения не только из текста, но и из оригинальных изображений, расширяя творческие возможности без необходимости обладать опытом редактирования фотографий. Томас Ильич, директор по управлению продуктами в Google Labs, заявил: «Whisk разработан, чтобы помочь пользователям творчески переосмысливать объекты, фоны и стили, позволяя им исследовать их визуально, а не кропотливо редактировать каждый пиксель».
Хотя Whisk находится еще на ранних стадиях разработки, инструмент был запущен в виде веб-сайта на платформе Google Labs и теперь доступен пользователям в США.
Дэн Айвз, управляющий директор и старший аналитик Wedbush Securities, заявил, что Whisk знаменует собой еще один «момент силы» для Google в гонке технологических компаний.
Айвс также отметил, что DeepMind, лаборатория искусственного интеллекта, приобретенная Google в 2014 году, является важнейшим активом, помогающим Google поддерживать свои позиции в области ИИ. Продукты на основе ИИ, включая Whisk, являются ключевой частью стратегии разработки продуктов Google на ближайшие годы, и ожидается, что многие новые продукты будут запущены в 2025 году.
Инструменты Whisk открывают новые возможности для использования ИИ в создании инновационных продуктов с минимальным участием пользователя. Это демонстрирует прогресс ИИ в понимании и творческом сочетании визуальных элементов.
Whisk является частью устойчивой тенденции среди крупных технологических компаний, включая Google и OpenAI, к разработке инструментов искусственного интеллекта для потребителей. Эти инструменты призваны предоставлять инновационные возможности для творчества, от создания изображений и текста до видео . Недавно OpenAI также представила инструмент для создания видео из текста под названием Sora, прямого конкурента Whisk.
Нгок Ань (по данным CNN, The Verge, ZDNET)
Источник: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html










Комментарий (0)