گوگل به تازگی ابزار هوش مصنوعی جدیدی به نام «Whist» راهاندازی کرده است که به کاربران امکان میدهد بدون وارد کردن هیچ متنی، عکسهای خود را آپلود کرده و تصاویر ترکیبی تولید شده توسط هوش مصنوعی را بازیابی کنند.
ویسِک از هوش مصنوعی برای ترکیب موضوع، زمینه و سبک عکس آپلود شده استفاده میکند و تصویری جدید و منحصر به فردتر خلق میکند.
گوگل، Whisk را به عنوان یک «ابزار خلاقانه» توصیف میکند که به کاربران کمک میکند تا بدون نیاز به مهارتهای حرفهای ویرایش عکس، به سرعت ایدههای بصری جدیدی خلق کنند. به گفته گوگل، این ابزار یک ویرایشگر تصویر سنتی نیست، بلکه یک ابزار هوش مصنوعی هیجانانگیز است که برای برانگیختن خلاقیت و کشف سریع طراحی شده است.
وقتی کاربری تصویری را آپلود میکند، Whisk از ترکیبی از سرویس هوش مصنوعی گوگل، Gemini و فناوری Imagen 3 - ابزاری برای تبدیل متن به تصویر که گوگل از DeepMind خریداری کرده است - استفاده میکند.
جمینی عکس را تجزیه و تحلیل کرده و یک عنوان برای آن ایجاد میکند، سپس ایمیجن ۳ عناصر آن عکس را به شیوهای خلاقانه ترکیب میکند و به جای کپی کردن دقیق، «جوهر» سوژه را حفظ میکند.
رابط ابزار همزن. تصویر از صفحه.
این یعنی نتیجه نهایی ممکن است ۱۰۰٪ با تصویر اصلی یکسان نباشد. برای مثال، قد، مدل مو یا رنگ پوست سوژهها در تصویر جدید ممکن است با تصویر اصلی متفاوت باشد. با این حال، کاربران همچنان میتوانند اطلاعات ورودی را تنظیم کنند، پسزمینه و سبک را تغییر دهند یا چندین تم را برای ایجاد تصاویر مختلف ترکیب کنند.
ویسک میتواند نه تنها از متن، بلکه از تصاویر اصلی نیز تصاویر تولید کند و امکانات خلاقانه را بدون نیاز به تجربه ویرایش عکس توسط کاربران، گسترش دهد. توماس ایلجیک، مدیر مدیریت محصول در آزمایشگاههای گوگل، اظهار داشت: «ویسک به گونهای طراحی شده است که به کاربران کمک کند تا موضوعات، پسزمینهها و سبکها را به صورت خلاقانه با هم ترکیب کنند و به آنها اجازه میدهد تا به جای ویرایش دقیق تک تک پیکسلها، به صورت بصری کاوش کنند.»
اگرچه Whisk هنوز در مراحل اولیه توسعه خود است، اما این ابزار به عنوان یک وبسایت در Google Labs راهاندازی شده و اکنون برای کاربران در ایالات متحده در دسترس است.
دن ایوز، مدیر عامل و تحلیلگر ارشد Wedbush Securities، گفت که Whisk «لحظه قدرت» دیگری را برای گوگل در رقابت فناوری رقم میزند.
ایوز همچنین خاطرنشان کرد که DeepMind، آزمایشگاه هوش مصنوعی که گوگل در سال ۲۰۱۴ خریداری کرد، یک دارایی حیاتی است که به گوگل کمک میکند تا جایگاه خود را در حوزه هوش مصنوعی حفظ کند. محصولات هوش مصنوعی، از جمله Whisk، بخش کلیدی استراتژی توسعه محصول گوگل برای سالهای آینده هستند و انتظار میرود بسیاری از محصولات جدید در سال ۲۰۲۵ عرضه شوند.
ابزارهای Whisk مسیرهای جدیدی را برای استفاده از هوش مصنوعی جهت خلق محصولات نوآورانه با حداقل دخالت کاربر باز میکنند. این موضوع پیشرفت هوش مصنوعی در درک و ترکیب خلاقانه عناصر بصری را نشان میدهد.
ویسک بخشی از یک روند قوی در میان شرکتهای بزرگ فناوری، از جمله گوگل و OpenAI، برای توسعه ابزارهای هوش مصنوعی برای مصرفکنندگان است. هدف این ابزارها ارائه تجربیات خلاقانه و نوآورانه، از ایجاد تصویر و متن گرفته تا ویدیو است. اخیراً، OpenAI همچنین ابزاری برای ایجاد متن به ویدیو به نام Sora معرفی کرده است که رقیب مستقیم ویسک است.
نگوک آنه (طبق گزارشهای CNN، The Verge، ZDNET)
منبع: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html










نظر (0)