گوگل به تازگی ابزار هوش مصنوعی جدیدی به نام «ویسک» (Whisk) راهاندازی کرده است که به کاربران امکان میدهد عکسهای خود را آپلود کنند تا تصاویر ترکیبی تولید شده توسط هوش مصنوعی را بازیابی کنند، حتی اگر کاربر هیچ متنی وارد نکند.
ویسِک از هوش مصنوعی برای ترکیب موضوع، زمینه و سبک عکس آپلود شده استفاده میکند و تصویری جدید و منحصر به فردتر خلق میکند.
گوگل، Whisk را به عنوان یک «ابزار خلاقانه» توصیف میکند که به کاربران کمک میکند تا بدون نیاز به مهارتهای حرفهای ویرایش عکس، به سرعت ایدههای بصری جدیدی خلق کنند. به گفته گوگل، این ابزار یک ویرایشگر تصویر سنتی نیست، بلکه یک ابزار هوش مصنوعی سرگرمکننده است که هدف آن برانگیختن خلاقیت و کشف سریع است.
وقتی کاربری عکسی را آپلود میکند، Whisk از ترکیبی از سرویس هوش مصنوعی گوگل، Gemini و فناوری Imagen 3 استفاده میکند - ابزاری که از متنهایی که گوگل از DeepMind به دست آورده، تصاویر ایجاد میکند.
جمینی عکس را تجزیه و تحلیل کرده و یک عنوان برای آن ایجاد میکند، سپس ایمیجن ۳ عناصر آن عکس را به شیوهای خلاقانه ترکیب میکند و به جای کپی کردن دقیق، «جوهر» سوژه را حفظ میکند.
رابط ابزار همزن. تصویر صفحه
این یعنی نتیجه نهایی ممکن است ۱۰۰٪ با تصویر اصلی یکسان نباشد. برای مثال، قد، مدل مو یا رنگ پوست سوژهها در تصویر جدید ممکن است با تصویر اصلی متفاوت باشد. با این حال، کاربران همچنان میتوانند اطلاعات ورودی را تنظیم کنند، زمینه، سبک را تغییر دهند یا چندین سوژه را برای ایجاد تصاویر مختلف ترکیب کنند.
ویسک میتواند نه تنها از متن، بلکه از تصاویر آماده نیز تصاویر ایجاد کند و امکانات خلاقانه را بدون نیاز به تجربه ویرایش عکس توسط کاربران، گسترش دهد. توماس ایلجیک، مدیر مدیریت محصول در آزمایشگاههای گوگل، گفت: «ویسک به گونهای طراحی شده است که به کاربران کمک کند موضوعات، زمینهها و سبکها را به روشهای خلاقانه با هم ترکیب کنند و به آنها اجازه میدهد به جای ویرایش دقیق هر پیکسل، به صورت بصری کاوش کنند.»
در حالی که Whisk در مراحل اولیه توسعه خود است، این ابزار به عنوان یک وبسایت در Google Labs راهاندازی شده و اکنون برای کاربران در ایالات متحده در دسترس است.
دن ایوز، مدیر عامل و تحلیلگر ارشد Wedbush Securities، گفت که Whisk یک «نمایش قدرت» دیگر برای گوگل در رقابت فناوری است.
ایوز همچنین خاطرنشان کرد که DeepMind، آزمایشگاه هوش مصنوعی که گوگل در سال ۲۰۱۴ خریداری کرد، یک دارایی کلیدی در کمک به گوگل برای حفظ جایگاه خود در حوزه هوش مصنوعی است. محصولات هوش مصنوعی، از جمله Whisk، بخش کلیدی استراتژی توسعه محصول گوگل در سالهای آینده هستند و انتظار میرود چندین محصول جدید تا سال ۲۰۲۵ عرضه شوند.
ابزار Whisk راههای جدیدی را برای استفاده از هوش مصنوعی جهت خلق محصولات خلاقانه با حداقل دخالت کاربر باز میکند. این نشان دهنده پیشرفت هوش مصنوعی در درک و ترکیب خلاقانه عناصر بصری است.
ویسک بخشی از یک روند رو به رشد در میان شرکتهای بزرگ فناوری، از جمله گوگل و OpenAI، برای توسعه ابزارهای هوش مصنوعی برای مصرفکنندگان است که هدف آنها ایجاد تجربیات خلاقانه جدید، از تولید تصاویر، متن و ویدیو ، است. OpenAI اخیراً یک مولد متن به ویدیو به نام Sora معرفی کرده است که مستقیماً با ویسک رقابت میکند.
نگوک آنه (طبق گزارشهای CNN، The Verge، ZDNET)
منبع: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html






نظر (0)