(CLO) Google har nettopp lansert et nytt verktøy for kunstig intelligens (KI) kalt «Whist», som lar brukere laste opp bilder for å hente frem KI-genererte sammensatte bilder, selv uten å skrive inn tekst.
Whisk bruker AI til å kombinere motivet, bakgrunnen og stilen til et opplastet bilde, og dermed skape et friskt og unikt bilde.
Whisk beskrives av Google som et «kreativt verktøy» som hjelper brukere med å raskt generere nye visuelle ideer uten å kreve profesjonelle fotoredigeringsferdigheter. Ifølge Google er ikke dette verktøyet et tradisjonelt bilderedigeringsverktøy, men snarere et spennende AI-verktøy designet for å vekke kreativitet og rask oppdagelse .
Når en bruker laster opp et bilde, bruker Whisk en kombinasjon av Googles AI-tjeneste, Gemini, og Imagen 3-teknologi – et verktøy for tekst-til-bilde-oppretting som Google kjøpte fra DeepMind.
Gemini vil analysere bildet og generere en bildetekst, deretter vil Imagen 3 kreativt kombinere elementer fra bildet, og bevare «essensen» av motivet i stedet for en eksakt kopi.
Skjermbilde av vispverktøyets grensesnitt.
Dette betyr at det endelige resultatet kanskje ikke er 100 % identisk med det originale bildet. For eksempel kan høyden, frisyren eller hudtonen til motivene i det nye bildet avvike fra originalen. Brukere kan imidlertid fortsatt justere inndatainformasjonen, endre bakgrunn, stil eller kombinere flere temaer for å lage forskjellige bilder.
Whisk kan generere bilder ikke bare fra tekst, men også fra originalbilder, noe som utvider de kreative mulighetene uten at brukerne trenger å ha erfaring med fotoredigering. Thomas Iljic, produktsjef hos Google Labs, uttalte: «Whisk er utviklet for å hjelpe brukere med å remikse motiver, bakgrunner og stiler kreativt, slik at de kan utforske visuelt i stedet for å redigere hver eneste piksel omhyggelig.»
Selv om Whisk fortsatt er i en tidlig utviklingsfase, har verktøyet blitt lansert som et nettsted på Google Labs og er nå tilgjengelig for brukere i USA.
Dan Ives, administrerende direktør og senioranalytiker hos Wedbush Securities, sa at Whisk markerer nok et «styrkeøyeblikk» for Google i teknologikappløpet.
Ives bemerket også at DeepMind, AI-laboratoriet som Google kjøpte opp i 2014, er en avgjørende ressurs som hjelper Google med å opprettholde sin posisjon innen AI-feltet. AI-produkter, inkludert Whisk, er en sentral del av Googles produktutviklingsstrategi for de kommende årene, med mange nye produkter som forventes å lanseres i 2025.
Whisks verktøy åpner for nye muligheter for bruk av kunstig intelligens til å lage innovative produkter med minimal brukerinnblanding. Dette demonstrerer fremgangen til kunstig intelligens i å forstå og kreativt kombinere visuelle elementer.
Whisk er en del av en sterk trend blant store teknologiselskaper, inkludert Google og OpenAI, for å utvikle AI-verktøy for forbrukere. Disse verktøyene har som mål å levere innovative kreative opplevelser, fra bilde- og tekstproduksjon til video . Nylig introduserte OpenAI også et tekst-til-video-produksjonsverktøy kalt Sora, en direkte konkurrent til Whisk.
Ngoc Anh (ifølge CNN, The Verge, ZDNET)
[annonse_2]
Kilde: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html






Kommentar (0)