گوگل رسماً Imagen 4، آخرین نسخه از مدل تبدیل متن به تصویر خود را معرفی کرد که پیشرفتهای چشمگیری در کیفیت تصویر، درک زبان طبیعی و به ویژه توانایی رندر متن در تصاویر به طور چشمگیر به ارمغان میآورد. این ابزاری قدرتمند برای تولیدکنندگان محتوا، طراحان و هر کسی است که میخواهد ایدهها را به سرعت و با دقت به تصاویر تبدیل کند.
این مقاله مروری بر ویژگیهای برجستهی Imagen 4 و دستورالعملهای دقیقی در مورد نحوهی نوشتن «راهنماها» برای ایجاد رضایتبخشترین تصاویر ارائه میدهد.
تصویر ۴: کیفیت برتر، خلاقیت نامحدود
در مقایسه با مدلهای قبلی و سایر مدلهای هوش مصنوعی تصویربرداری، Imagen 4 مزایای زیر را دارد:
کیفیت تصویر برتر: Imagen 4 تصاویری با جزئیات فوقالعاده، واضح و واقعی تولید میکند. جزئیات پیچیده مانند خز، بافت پارچه و نور طبیعی با دقت بازتولید میشوند و به طور قابل توجهی از مصنوعات موجود در مدلهای قبلی میکاهند.
درک عمیق از زبان و بافت: توانایی Imagen 4 در درک دستورات طولانی و پیچیده به میزان قابل توجهی بهبود یافته است. این مدل میتواند روابط مکانی، کمیتها و الزامات طرحبندی دقیق را با دقت بیشتری ثبت کند.
رندر متن چشمگیر: این یکی از ارزشمندترین ارتقاها است. Imagen 4 میتواند تصاویری حاوی متن واضح و خوانا با سبکهای فونت مختلف ایجاد کند. این امر پتانسیل زیادی را برای طراحی پوسترها، دعوتنامهها، لوگوها و نشریات حاوی متن ایجاد میکند. با این حال، طبق آزمایش VietNamNet ، قابلیت رندر ویتنامی Imagen 4 هنوز ناقص است.
Imagen 4 گوگل جمینی هنوز نمیتواند متن ویتنامی را با موفقیت پردازش کند.
پشتیبانی از نسبتهای ابعاد مختلف: کاربران میتوانند به راحتی عکسهایی با نسبتهای رایج مانند ۱:۱، ۱۶:۹، ۹:۱۶، ۴:۳ و ۳:۴ ایجاد کنند که برای پلتفرمها و اهداف مختلف مناسب است.
کاهش خطاها و اعوجاجها: Imagen 4 برای ایجاد تصاویر آناتومیکی طبیعیتر و با اعوجاج کمتر (مثلاً دستها، صورتها) بهبود یافته است، که چالش بزرگی برای نسلهای قبلی هوش مصنوعی تولید تصویر بود.
راهنمای جامع نوشتن سریع برای Imagen 4
برای استفاده از ویژگی Imagen 4، به برنامه Google Gemini در برنامه دسترسی پیدا میکنید یا در مرورگر وب به gemini.google.com میروید.
نوشتن طرحهای پیشنهادی مؤثر، کلید اصلی برای بهرهبرداری هرچه بیشتر از Imagen 4 است. یک طرح پیشنهادی خوب مانند یک دفترچه راهنمای دقیق برای هنرمند هوش مصنوعی است. در اینجا چند نکته و ساختار برای کمک به شما در نوشتن طرحهای پیشنهادی «با کیفیت» آورده شده است:
۱. ساختار یک درخواست مؤثر
یک درخواست قوی معمولاً شامل اجزای زیر است:
موضوع: سوژه اصلی عکس. آن را تا حد امکان واضح و مشخص توصیف کنید.
عمل: سوژه چه کاری انجام میدهد؟
محیط/موقعیت: سوژه کجاست؟ فضای اطراف را توصیف کنید.
نورپردازی: نور در عکس چگونه است (مثلاً نور ملایم صبح، نور نئونهای روشن، نور گرم غروب آفتاب).
سبک هنری: میخواهید تصویر چه سبکی داشته باشد (مثلاً عکاسی، نقاشی رنگ روغن، انیمیشن، هنر دیجیتال، سایبرپانک).
نما و ترکیببندی دوربین: پرسپکتیو دوربین (کلوزآپ، زاویه باز، بالا به پایین) و چیدمان عناصر در عکس.
جزئیات تکمیلی: رنگهای اصلی، احساسات، بافتها و سایر جزئیات کوچک که به عکس جان میبخشند.
۲. قوانین طلایی هنگام نوشتن سوالات
هر چه جزئیات بیشتر، دقیقتر: به جای نوشتن «یک سگ»، بنویسید «یک سگ کورگی مو طلایی که در یک روز آفتابی با خوشحالی در چمنزار سبز میدود».
از صفتهای قوی استفاده کنید: صفتهای توصیفی به Imagen 4 کمک میکنند تا ایده شما را واضحتر «تصویر» کند. برای مثال: «آسمانخراش باشکوه»، «جنگل اسرارآمیز»، «لبخند گرم».
سبک را مشخص کنید: این عاملی است که «روح» عکس را تعیین میکند.
عکاسی: «واقعگرایانه»، «عکس ماکرو»، «نوردهی طولانی»، «عکاسی در ساعت طلایی».
نقاشی: «نقاشی رنگ روغن اثر ون گوگ»، «تصویرسازی آبرنگ»، «سبک اوکییوئه ژاپنی».
دیجیتال: «شهر سایبرپانک»، «هنر فانتزی»، «رندر سهبعدی»، «هنر پیکسلی».
آزمایش زاویه دوربین:
«عکس از نمای نزدیک از چشم گربه»
«عکس زاویه باز از یک رشته کوه»
«نمای پهپادی از یک تقاطع شلوغ شهری»
۳. «دستورالعمل» برای نوشتن سوالات در Imagen 4
در اینجا چند "دستور غذا" وجود دارد که میتوانید اعمال کنید:
فرمول پایه:
[موضوع] [انجام چه کاری]، [سبک هنری]
برای مثال: «شیر باشکوه با یالهای بلند، اثر هنری دیجیتال»
فرمول دقیق:
[سبک]، [سوژه] در [پسزمینه]، [جزئیات پسزمینه]، [نورپردازی]، [زاویه دوربین]
برای مثال: «عکس واقعی، پیرمردی که روی نیمکت چوبی در یک پارک آرام پاییزی نشسته، اطرافش پر از برگهای ریخته شده، نور ملایم صبحگاهی، نمای همسطح چشم.»
فرمولهای حاوی متن:
تصویری از [موضوع] با متن "[محتوای متن]" که روی آن نوشته شده است، [سبک متن را شرح دهید]
برای مثال: «پوستر سینمایی برای فیلمی به نام «طلوع سایبرنتیک» که یک سایبورگ را نشان میدهد که در شب به شهری آیندهنگر نگاه میکند. متن «طلوع سایبرنتیک» با فونت نئونی پررنگ و درخشان نوشته شده است.»
۴. چند مثال پیشرفته
طراحی شخصیت: «طرح مفهومی یک دزد دریایی فضایی زن، با زرهای آیندهنگرانه با تزئینات آبی درخشان، در دست داشتن یک تپانچه لیزری، چهرهای مصمم، ایستاده روی عرشه یک سفینه فضایی، نورپردازی سینمایی.»
منظره: «یک نقاشی منظره نفسگیر از خلیج هالونگ، ویتنام، در غروب آفتاب. صخرههای آهکی که از آب زمردین سر بر میآورند، قایقهای سنتی کهنه که با آرامش در حال حرکت هستند. آسمان ترکیبی از رنگهای نارنجی، صورتی و بنفش است. سبک نقاشی رمانتیسم.»
یک تصویر تبلیغاتی ایجاد کنید: «یک عکس با کیفیت بالا از یک برند جدید دانههای قهوه در یک بستهبندی مینیمالیستی. بستهبندی به رنگ قهوهای تیره با تایپوگرافی طلایی زیبا است که روی آن نوشته شده «مراسم صبحگاهی». کیسه قهوه در کنار یک فنجان قهوه داغ روی یک میز چوبی روستیک قرار گرفته است.»
با تسلط بر تکنیکهای نوشتن سریع فوق، میتوانید Imagen 4 را به یک دستیار قدرتمند تبدیل کنید، خلاقیت خود را آزاد کنید و آثار بصری منحصر به فرد، چشمگیر و حرفهای خلق کنید. شروع به آزمایش کنید و پتانسیل نامحدود این ابزار قدرتمند هوش مصنوعی را کشف کنید .
اگر نمیخواهید بیکار بمانید، هوش مصنوعی را بپذیرید و همین حالا اقدام کنید. پیتر کایل، وزیر فناوری بریتانیا، از کارگران و کسبوکارها خواست اگر نمیخواهند بیکار و عقبمانده بمانند، همین حالا برای پذیرش فناوری هوش مصنوعی اقدام کنند.
منبع: https://vietnamnet.vn/3-cong-thuc-prompt-tao-anh-dinh-cao-nhung-hoan-toan-mien-phi-voi-google-2411854.html
نظر (0)