(CLO) Společnost Google právě spustila nový nástroj umělé inteligence (AI) s názvem „Whist“, který uživatelům umožňuje nahrávat fotografie a načítat kompozitní snímky generované umělou inteligencí, a to i bez zadávání jakéhokoli textu.
Whisk využívá umělou inteligenci ke kombinaci objektu, kontextu a stylu nahrané fotografie a vytváří tak nový a jedinečnější obrázek.
Google popisuje Whisk jako „kreativní nástroj“, který pomáhá uživatelům rychle generovat nové vizuální nápady bez nutnosti profesionálních dovedností v úpravě fotografií. Podle Googlu se nejedná o tradiční editor obrázků, ale spíše o zábavný nástroj s umělou inteligencí, jehož cílem je podnítit kreativitu a rychlé objevování .
Když uživatel nahraje fotografii, Whisk použije kombinaci služby umělé inteligence od Googlu, Gemini, a technologie Imagen 3 – nástroje, který vytváří obrázky z textu, který Google získal od DeepMind.
Gemini fotografii analyzuje a vytvoří popisek, poté Imagen 3 kreativním způsobem zkombinuje prvky této fotografie, přičemž zachovává „podstatu“ objektu, spíše než aby jej přesně kopíroval.
Rozhraní nástroje Whisk. Snímek obrazovky.
To znamená, že konečný výsledek nemusí být 100% identický s původním obrázkem. Například výška, účes nebo tón pleti osob na novém obrázku se mohou lišit od originálu. Uživatelé však stále mohou upravovat vstupní informace, měnit pozadí, styl nebo kombinovat více motivů a vytvářet tak různé obrázky.
Whisk dokáže generovat obrázky nejen z textu, ale i z originálních obrázků, čímž rozšiřuje tvůrčí možnosti, aniž by uživatelé museli mít zkušenosti s úpravou fotografií. Thomas Iljic, ředitel produktového managementu v Google Labs, uvedl: „Whisk je navržen tak, aby uživatelům pomohl kreativně remixovat objekty, pozadí a styly a umožnil jim vizuálně prozkoumávat prostředí, spíše než pečlivě upravovat každý jednotlivý pixel.“
Přestože je Whisk stále v rané fázi vývoje, nástroj byl spuštěn jako webová stránka v Google Labs a nyní je k dispozici uživatelům v USA.
Dan Ives, výkonný ředitel a hlavní analytik společnosti Wedbush Securities, uvedl, že Whisk představuje pro Google další „moment síly“ v technologickém závodě.
Ives také poznamenal, že DeepMind, laboratoř umělé inteligence, kterou Google získal v roce 2014, je klíčovým aktivem, které Googlu pomáhá udržet si pozici v oblasti umělé inteligence. Produkty umělé inteligence, včetně Whisk, jsou klíčovou součástí strategie vývoje produktů Googlu pro nadcházející roky, přičemž se očekává, že v roce 2025 bude uvedeno na trh mnoho nových produktů.
Nástroje společnosti Whisk otevírají nové možnosti využití umělé inteligence k vytváření inovativních produktů s minimálním zásahem uživatele. To demonstruje pokrok umělé inteligence v porozumění a kreativním kombinování vizuálních prvků.
Whisk je součástí silného trendu mezi velkými technologickými společnostmi, včetně Googlu a OpenAI, vyvíjet nástroje umělé inteligence pro spotřebitele. Tyto nástroje si kladou za cíl poskytovat inovativní kreativní zážitky, od tvorby obrázků a textu až po video . OpenAI nedávno také představila nástroj pro tvorbu textu na video s názvem Sora, přímého konkurenta Whisk.
Ngoc Anh (podle CNN, The Verge, ZDNET)
Zdroj: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html










Komentář (0)