(CLO) Google は「Whisk」と呼ばれる新しい人工知能 (AI) ツールをリリースしました。これにより、ユーザーは写真をアップロードして、テキストを入力しなくても AI が生成した合成画像を取得できるようになります。
Whisk は AI を使用して、アップロードされた写真の主題、コンテキスト、スタイルを組み合わせ、新しい、よりユニークな画像を作成します。
Google は Whisk を、専門的な写真編集スキルを必要とせずにユーザーが新しい視覚的なアイデアをすばやく生み出せる「クリエイティブ ツール」と説明しています。 Google によれば、このツールは従来の画像エディタではなく、創造性を刺激し、迅速な発見を促すことを目的とした楽しい AI ツールです。
ユーザーが写真をアップロードすると、Whisk は Google の AI サービスである Gemini と、Google が DeepMind から取得したテキストから画像を作成するツールである Imagen 3 テクノロジーを組み合わせて使用します。
Gemini が写真を分析してキャプションを作成し、その後 Imagen 3 がその写真の要素をクリエイティブな方法で組み合わせ、被写体の「本質」をそのままコピーするのではなく保持します。
泡立てツールのインターフェース。スクリーンショット
つまり、最終結果は元の画像と 100% 同一にならない可能性があります。たとえば、新しい画像の被写体の身長、髪型、肌の色合いなどが元の画像と異なる場合があります。ただし、ユーザーは入力情報を調整したり、コンテキストやスタイルを変更したり、複数のテーマを組み合わせて異なる画像を作成したりすることは可能です。
Whisk はテキストだけでなくオリジナルの画像からも画像を作成できるため、写真編集の経験がなくてもクリエイティブな可能性が広がります。 「Whisk は、ユーザーが主題、コンテキスト、スタイルをクリエイティブな方法でリミックスできるように設計されており、各ピクセルを細かく編集するのではなく、視覚的に探索することができます」と、Google Labs のプロダクト管理ディレクターのトーマス・イリジック氏は述べています。
Whisk はまだ開発の初期段階ですが、このツールは Google Labs のウェブサイトとして公開されており、現在は米国のユーザーが利用できます。
ウェドブッシュ・セキュリティーズのマネージングディレクター兼シニアアナリストのダン・アイブス氏は、ウィスクはテクノロジー競争におけるグーグルのもう一つの「力の誇示」となると述べた。
アイブス氏はまた、Googleが2014年に買収したAI研究所DeepMindが、GoogleがAI分野での地位を維持する上で重要な資産であると指摘した。 Whisk を含む AI 製品は、今後数年間の Google の製品開発戦略の重要な部分を占めており、2025 年までにいくつかの新製品が発売される予定です。
Whisk ツールは、ユーザーの介入をほとんど必要とせずに AI を使用して革新的な製品を作成するための新しい道を開きます。これは、視覚要素を理解し、創造的に組み合わせる AI の進歩を示しています。
Whisk は、Google や OpenAI など大手テクノロジー企業の間で広がりつつある、消費者向け AI ツールの開発トレンドの一環です。これらのツールは、画像、テキスト、ビデオの作成に至るまで、新鮮なクリエイティブ体験を提供することを目的としています。最近、OpenAI は、Whisk と直接競合する Sora と呼ばれるテキストからビデオへのジェネレーターも導入しました。
ゴック・アン(CNN、The Verge、ZDNETによる)
[広告2]
出典: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html
コメント (0)