گفته میشود V7، مدل MidJourney، قادر به تولید جزئیاتی مانند دستها با دقت بیشتری است. عکس: Xeophon . |
میدجورنی، یکی از اولین ابزارهای خلق تصویر مبتنی بر هوش مصنوعی در وب، به تازگی اولین مدل جدید خود را تقریباً پس از یک سال عرضه کرده است.
این مدل که V7 نام دارد، نیمهشب ۴ آوریل (به وقت آمریکا) در مرحلهی آزمایش بتا منتشر شد. یک هفته قبل از آن، OpenAI ویژگی مشابهی را با ChatGPT راهاندازی کرده بود که به سرعت به یک پدیده در رسانههای اجتماعی تبدیل شد و روند جدیدی را در ایجاد عکسهایی به سبک گیبلی ایجاد کرد.
اگر در استفاده از Midjourney تازهکار هستید، ابتدا باید ۲۰۰ تصویری که این ابزار پیشنهاد میدهد را بر اساس ترجیحات خود ارزیابی کنید. سپس، این ابزار یک پروفایل شخصیسازیشده ایجاد میکند تا تصاویری تولید کند که با سلیقه شما مطابقت داشته باشند. V7 اولین مدل Midjourney است که شخصیسازی به طور پیشفرض در آن فعال است.
شما میتوانید V7 را با کلیک روی نوار ابزار «نسخه» در وبسایت فعال یا غیرفعال کنید. علاوه بر این، این مدل را میتوان در سرور Discord شرکت Midjourney نیز استفاده کرد.
دیوید هولز، مدیرعامل میدجورنی، در پستی در X، V7 را به عنوان «معماری کاملاً متفاوت» توصیف کرد. هولز در Discord همچنین اعلام کرد: «V7 در مدیریت عبارات متنی بسیار هوشمندانهتر عمل میکند.»
او اظهار داشت که این مدل همچنین تصاویر اصلی را به خوبی مدیریت میکند. کیفیت تصویر به طور قابل توجهی بهبود یافته و جزئیات بالایی دارد. از اعضای بدن مانند دست و پا گرفته تا کک و مک و الگوهای سرامیکی، همه چیز تا کوچکترین جزئیات ثابت است.
![]() |
برخی از تصاویر نمونه با استفاده از مدل V7 ایجاد شدهاند. عکس: X/MidJourney. |
علاوه بر دو حالت: توربو (گرانتر) و ریلکس، V7 از ابزار جدیدی به نام حالت پیشنویس (Draft Mode) پشتیبانی میکند که امکان ایجاد تصویر را تا 10 برابر سریعتر و با نصف هزینه حالت استاندارد فراهم میکند. تصاویر در حالت پیشنویس کیفیت پایینتری خواهند داشت، اما کاربران میتوانند تصاویر را تنها با یک کلیک ارتقا داده و از نو بسازند.
به گفته هولز، برخی از ویژگیهای استاندارد Midjourney در حال حاضر با V7 در دسترس نیستند، از جمله ارتقاء مقیاس و تغییر بافت. او اظهار داشت که این ویژگیها در آینده نزدیک، احتمالاً ظرف دو ماه آینده، اضافه خواهند شد.
هولز در دیسکورد نوشت: «این یک مدل کاملاً جدید با نقاط قوت خاص خود و شاید چند نقطه ضعف نیز هست.» او خاطرنشان کرد که نسخه ۷ ممکن است به یک سبک نوشتاری خط فرمان جدید نیاز داشته باشد و همه را تشویق کرد تا این نسخه را امتحان کنند تا به ارائه بازخورد سازنده کمک کنند.
کایل ویگرز، خبرنگار تککرانچ ، اظهار داشت که V7 میتواند دستورات اولیه او را به خوبی اجرا کند. او افزود: «مدل میدجورنی به طور خاص برای سبک گیبلی بهینه نشده است، حداقل نه رسماً، اما همچنان میتواند آثار زیباییشناختی دلپذیری تولید کند.»
به گفته کارشناسان هوش مصنوعی در ویتنام، ویژگی تولید تصویر ChatGPT ممکن است آسانتر و راحتتر از ابزارهای تولید تصویر قبلی مانند MidJourney و Stable Diffusion باشد. با این حال، مدل OpenAI هنوز در کیفیت تصویر پیشرفت چشمگیری نداشته و ممکن است نسبت به ابزارهای قبلی پایینتر باشد.
میدجورنی یک شرکت نسبتاً منحصر به فرد است. میدجورنی که در سال ۲۰۲۲ توسط هولز، یکی از بنیانگذاران تولیدکننده لوازم جانبی کامپیوتر Leap Motion، تأسیس شد، هرگز هیچ سرمایهگذاری خارجی دریافت نکرده است.
این شرکت همچنین عملکرد تجاری خود را فاش نمیکند، اما CBInsights درآمد Midjourney را در پایان سال 2023 حدود 200 میلیون دلار تخمین زده است. اخیراً، این شرکت اعلام کرده است که در حال تشکیل یک تیم سختافزاری برای کار بر روی چندین پروژه فاش نشده است و به آموزش مدلهای قبلاً اعلام شده برای ایجاد ویدیوها و اشیاء سهبعدی ادامه میدهد.
همانند ChatGPT، MidJourney نیز با چندین پروندهی حقوقی مواجه است که ادعا میکنند با آموزش ابزارهای هوش مصنوعی بر روی تصاویر جمعآوریشده از وب بدون رضایت خالقان تصویر، حقوق میلیونها هنرمند را نقض کردهاند.
منبع: https://znews.vn/mo-hinh-tao-anh-ai-tot-hon-chatgpt-post1543472.html







نظر (0)