(CLO) Google hat soeben ein neues Tool für künstliche Intelligenz (KI) namens „Whist“ auf den Markt gebracht, mit dem Benutzer Fotos hochladen können, um KI-generierte zusammengesetzte Bilder zu erhalten, sogar ohne Text eingeben zu müssen.
Whisk nutzt KI, um Motiv, Kontext und Stil des hochgeladenen Fotos zu kombinieren und so ein neues und einzigartigeres Bild zu schaffen.
Whisk wird von Google als „Kreativwerkzeug“ beschrieben, das Nutzern hilft, schnell neue visuelle Ideen zu entwickeln, ohne dass professionelle Bildbearbeitungskenntnisse erforderlich sind. Laut Google handelt es sich dabei nicht um einen herkömmlichen Bildeditor, sondern um ein spielerisches KI-Tool, das Kreativität und schnelle Entdeckungen fördern soll.
Wenn ein Benutzer ein Foto hochlädt, verwendet Whisk eine Kombination aus Googles KI-Dienst Gemini und der Imagen 3-Technologie – einem Tool, das aus Text Bilder erstellt und das Google von DeepMind erworben hat.
Gemini analysiert das Foto und erstellt eine Bildunterschrift. Imagen 3 kombiniert dann Elemente dieses Fotos auf kreative Weise, wobei die „Essenz“ des Motivs erhalten bleibt, anstatt es exakt zu kopieren.
Benutzeroberfläche des Schneebesen-Werkzeugs. Screenshot.
Das bedeutet, dass das Endergebnis möglicherweise nicht hundertprozentig mit dem Originalbild übereinstimmt. Beispielsweise können Größe, Frisur oder Hautton der abgebildeten Personen vom Original abweichen. Nutzer können jedoch weiterhin die Eingabeinformationen anpassen, den Hintergrund und den Stil ändern oder verschiedene Stile kombinieren, um unterschiedliche Bilder zu erstellen.
Whisk kann Bilder nicht nur aus Text, sondern auch aus Originalbildern generieren und erweitert so die kreativen Möglichkeiten, ohne dass Nutzer Erfahrung in der Bildbearbeitung haben müssen. Thomas Iljic, Produktmanagement-Direktor bei Google Labs, erklärte: „Whisk wurde entwickelt, um Nutzern zu helfen, Motive, Hintergründe und Stile kreativ neu zu kombinieren und ihnen so ein visuelles Erkunden zu ermöglichen, anstatt jedes einzelne Pixel akribisch bearbeiten zu müssen.“
Obwohl sich Whisk noch in einem frühen Entwicklungsstadium befindet, wurde das Tool als Website auf Google Labs veröffentlicht und steht Nutzern in den USA nun zur Verfügung.
Dan Ives, Geschäftsführer und leitender Analyst bei Wedbush Securities, sagte, Whisk markiere einen weiteren „Moment der Stärke“ für Google im Technologie-Wettlauf.
Ives hob außerdem hervor, dass DeepMind, das KI-Labor, das Google 2014 übernommen hat, ein entscheidender Faktor für Googles Position im KI-Bereich ist. KI-Produkte wie Whisk sind ein zentraler Bestandteil von Googles Produktentwicklungsstrategie für die kommenden Jahre; zahlreiche neue Produkte sollen 2025 auf den Markt kommen.
Die Tools von Whisk eröffnen neue Wege für den Einsatz von KI zur Entwicklung innovativer Produkte mit minimalem Benutzereingriff. Dies verdeutlicht die Fortschritte der KI beim Verständnis und der kreativen Kombination visueller Elemente.
Whisk ist Teil eines starken Trends unter großen Technologieunternehmen wie Google und OpenAI, KI-Tools für Endverbraucher zu entwickeln. Diese Tools zielen darauf ab, innovative kreative Erlebnisse zu ermöglichen – von der Bild- und Texterstellung bis hin zu Videos . Kürzlich hat OpenAI mit Sora ein Tool zur Text-zu-Video-Erstellung vorgestellt, das ein direkter Konkurrent von Whisk ist.
Ngoc Anh (laut CNN, The Verge, ZDNET)
Quelle: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html










Kommentar (0)