گفته میشود V7، مدل MidJourney، میتواند جزئیاتی مانند دستها را با ثبات بیشتری ایجاد کند. عکس: Xeophon . |
میدجورنی، یکی از اولین تولیدکنندگان تصویر مبتنی بر هوش مصنوعی در وب، به تازگی اولین مدل جدید خود را تقریباً پس از یک سال منتشر کرده است.
این مدل که V7 نام دارد، نیمهشب ۴ آوریل (به وقت آمریکا) به صورت بتا منتشر شد. یک هفته قبل از آن، OpenAI نیز ویژگی مشابهی را با ChatGPT راهاندازی کرده بود و به سرعت با روند جدید ایجاد عکسهایی به سبک گیبلی، در شبکههای اجتماعی سر و صدا به پا کرد.
اگر قبلاً از Midjourney استفاده نکردهاید، ابتدا باید ۲۰۰ تصویری که این ابزار پیشنهاد میدهد را بر اساس ترجیحات خود امتیاز دهید. سپس این ابزار یک پروفایل شخصیسازیشده ایجاد میکند که عکسهایی مطابق با سلیقه شما ایجاد میکند. V7 اولین مدل Midjourney است که شخصیسازی آن بهطور پیشفرض فعال است.
شما میتوانید V7 را با کلیک روی نوار ابزار «نسخه» در وبسایت فعال یا غیرفعال کنید. علاوه بر این، این مدل را میتوان در سرور Midjourney Discord استفاده کرد.
دیوید هولز، مدیرعامل میدجورنی، در پستی در X، V7 را به عنوان «معماری کاملاً متفاوت» توصیف کرد. هولز در Discord ادامه داد: «V7 در مدیریت دستورات متنی بسیار هوشمندتر است.»
او اظهار داشت که این مدل همچنین توانایی پردازش تصویر اصلی را به خوبی دارد. کیفیت تصویر به طور قابل توجهی با کمال بالا بهبود یافته است. از اعضای بدن مانند دستها، پاها گرفته تا کک و مک، الگوهای سرامیکی با هر جزئیاتی سازگار هستند.
![]() |
چند نمونه تصویر ایجاد شده از مدل V7. عکس: X/MidJourney. |
علاوه بر دو حالت: توربو (که هزینه بیشتری دارد) و ریلکس، V7 از ابزار جدیدی به نام حالت پیشنویس (Draft Mode) پشتیبانی میکند که امکان ایجاد تصویر با سرعتی ۱۰ برابر بیشتر و تنها با نصف هزینه حالت استاندارد را فراهم میکند. تصاویر در حالت پیشنویس کیفیت پایینتری خواهند داشت، اما کاربران میتوانند تصویر را تنها با یک کلیک ارتقا داده و از نو بسازند.
به گفته هولز، برخی از ویژگیهای استاندارد Midjourney هنوز با V7 در دسترس نیستند، از جمله ارتقاء کیفیت و تغییر بافت. او گفت که این ویژگیها در آینده نزدیک، احتمالاً ظرف دو ماه آینده، اضافه خواهند شد.
هولز در دیسکورد نوشت: «این یک مدل کاملاً جدید با نقاط قوت و شاید برخی نقاط ضعف خاص خود است.» او خاطرنشان کرد که نسخه ۷ احتمالاً به سبک جدیدی از نوشتن نیاز دارد و مردم را تشویق کرد تا این نسخه را امتحان کنند تا به ارائه بازخورد کمک کنند.
کایل ویگرز، خبرنگار تککرانچ، خاطرنشان کرد که V7 در دستورات اولیه او عملکرد خوبی داشت. او افزود: «مدل Midjourney بهطور خاص برای گیبلی بهینه نشده است، حداقل نه بهطور رسمی، اما همچنان میتواند از نظر زیباییشناسی، کارهای دلپذیری تولید کند.»
به گفته کارشناسان هوش مصنوعی در ویتنام، ویژگی تولید تصویر ChatGPT میتواند آسانتر و راحتتر از مولدهای تصویر اولیه مانند MidJourney و Stable Diffusion باشد. با این حال، مدل OpenAI هنوز در کیفیت تصویر پیشرفت چشمگیری نداشته است، که ممکن است از ابزارهای قبلی بدتر باشد.
میدجورنی یک شرکت نسبتاً غیرمعمول است. میدجورنی که در سال ۲۰۲۲ توسط هولز، یکی از بنیانگذاران شرکت تولیدکننده لوازم جانبی کامپیوتر Leap Motion، تأسیس شد، هرگز هیچ سرمایهگذاری خارجی دریافت نکرده است.
این شرکت همچنین درآمد خود را فاش نمیکند، اما CBInsights تخمین میزند که Midjourney تا پایان سال ۲۰۲۳ حدود ۲۰۰ میلیون دلار درآمد خواهد داشت. این شرکت اخیراً اعلام کرده است که در حال تشکیل یک تیم سختافزاری برای کار بر روی برخی پروژههای فاش نشده و ادامه آموزش مدلهای قبلاً اعلام شده برای ایجاد ویدیوها و اشیاء سهبعدی است.
همانند ChatGPT، MidJourney نیز با چندین پروندهی حقوقی مواجه است که ادعا میکنند با آموزش ابزارهای هوش مصنوعی بر روی تصاویر استخراجشده از وب بدون رضایت سازندگان آن تصاویر، حقوق میلیونها هنرمند را نقض کردهاند.
منبع: https://znews.vn/mo-hinh-tao-anh-ai-tot-hon-chatgpt-post1543472.html
نظر (0)