মিডজার্নির মডেল V7, আরও ধারাবাহিকভাবে হাতের মতো বিবরণ তৈরি করতে সক্ষম বলে জানা গেছে। ছবি: জিওফোন । |
মিডজার্নি, ওয়েবে প্রথম এআই-চালিত ইমেজ জেনারেটরগুলির মধ্যে একটি, প্রায় এক বছরের মধ্যে তার প্রথম নতুন মডেল প্রকাশ করেছে।
V7 নামক মডেলটি ৪ এপ্রিল (মার্কিন সময়) মধ্যরাতে বিটা সংস্করণে প্রকাশিত হয়েছিল। এক সপ্তাহ আগে, OpenAIও ChatGPT-এর সাথে একই ধরণের একটি বৈশিষ্ট্য চালু করেছিল এবং ঘিবলি-স্টাইলের ছবি তৈরির নতুন ট্রেন্ডের মাধ্যমে সামাজিক নেটওয়ার্কগুলিতে দ্রুত আলোড়ন সৃষ্টি করেছিল।
যদি আপনি আগে কখনও মিডজার্নি ব্যবহার না করে থাকেন, তাহলে প্রথমে আপনার পছন্দের উপর ভিত্তি করে এটির প্রস্তাবিত ২০০টি ছবির রেটিং দিতে হবে। এরপর টুলটি একটি ব্যক্তিগতকৃত প্রোফাইল তৈরি করবে যা আপনার সৌন্দর্যের সাথে মেলে এমন ছবি তৈরি করবে। V7 হল মিডজার্নির প্রথম মডেল যেখানে ডিফল্টরূপে ব্যক্তিগতকরণ সক্ষম করা আছে।
আপনি ওয়েবসাইটের "সংস্করণ" টুলবারে ক্লিক করে V7 সক্ষম বা অক্ষম করতে পারেন। এছাড়াও, এই মডেলটি মিডজার্নি ডিসকর্ড সার্ভারেও ব্যবহার করা যেতে পারে।
মিডজার্নির সিইও ডেভিড হোলজ X-এর একটি পোস্টে V7-কে "সম্পূর্ণ ভিন্ন স্থাপত্য" হিসেবে বর্ণনা করেছেন। "টেক্সট কমান্ড পরিচালনার ক্ষেত্রে V7 অনেক বেশি স্মার্ট," হোলজ ডিসকর্ডে আরও বলেন।
তিনি মন্তব্য করেন যে মডেলটি মূল ছবিটি বেশ ভালোভাবে প্রক্রিয়া করার ক্ষমতা রাখে। উচ্চ নিখুঁততার সাথে ছবির মান উল্লেখযোগ্যভাবে উন্নত হয়েছে। হাত, পায়ের মতো শরীরের অংশ থেকে শুরু করে ফ্রেকল পর্যন্ত, সিরামিক প্যাটার্নগুলি প্রতিটি বিবরণের সাথে সামঞ্জস্যপূর্ণ।
![]() |
V7 মডেল থেকে তৈরি কিছু নমুনা ছবি। ছবি: X/MidJourney। |
দুটি মোড ছাড়াও: টার্বো (যার দাম বেশি) এবং রিলাক্স, V7 ড্রাফ্ট মোড নামে একটি নতুন টুল সমর্থন করে, যা ১০ গুণ দ্রুত গতিতে ছবি তৈরির অনুমতি দেয় এবং স্ট্যান্ডার্ড মোডের তুলনায় মাত্র অর্ধেক খরচ হয়। ড্রাফ্ট মোডে ছবিগুলির মান কম হবে, তবে ব্যবহারকারীরা মাত্র এক ক্লিকেই ছবি আপগ্রেড এবং পুনরায় তৈরি করতে পারবেন।
হোলজের মতে, মিডজার্নির কিছু স্ট্যান্ডার্ড বৈশিষ্ট্য এখনও V7-এর সাথে উপলব্ধ নয়, যার মধ্যে রয়েছে আপস্কেলিং এবং রিটেক্সচারিং। তিনি বলেন, এই বৈশিষ্ট্যগুলি নিকট ভবিষ্যতে, সম্ভবত আগামী দুই মাসের মধ্যে যোগ করা হবে।
"এটি সম্পূর্ণ নতুন মডেল যার নিজস্ব শক্তি এবং সম্ভবত কিছু দুর্বলতা রয়েছে," হোলজ ডিসকর্ডে লিখেছেন। তিনি উল্লেখ করেছেন যে V7 এর জন্য সম্ভবত একটি নতুন ধরণের লেখার প্রয়োজন হবে এবং প্রতিক্রিয়া প্রদানে সহায়তা করার জন্য লোকেদের সংস্করণটি চেষ্টা করে দেখার জন্য উৎসাহিত করেছেন।
টেকক্রাঞ্চের প্রতিবেদক কাইল উইগার্স উল্লেখ করেছেন যে V7 তার মৌলিক কমান্ডগুলিতে ভাল পারফর্ম করেছে। "মিডজর্নির মডেলটি বিশেষভাবে ঘিবলির জন্য অপ্টিমাইজ করা হয়নি, অন্তত আনুষ্ঠানিকভাবে নয়, তবে এটি এখনও নান্দনিকভাবে আনন্দদায়ক কাজ তৈরি করতে পারে," তিনি যোগ করেন।
ভিয়েতনামের এআই বিশেষজ্ঞদের মতে, চ্যাটজিপিটির ইমেজ জেনারেশন ফিচারটি ব্যবহার করা সহজ এবং মিডজার্নি এবং স্টেবল ডিফিউশনের মতো প্রাথমিক ইমেজ জেনারেটরের তুলনায় আরও সুবিধাজনক হতে পারে। তবে, ওপেনএআই-এর মডেলটি এখনও ছবির মানের ক্ষেত্রে কোনও অগ্রগতি তৈরি করতে পারেনি, যা পূর্ববর্তী সরঞ্জামগুলির চেয়ে খারাপ হতে পারে।
মিডজার্নি একটি অস্বাভাবিক কোম্পানি। ২০২২ সালে হোলজ কর্তৃক প্রতিষ্ঠিত, যিনি পিসি পেরিফেরাল নির্মাতা লিপ মোশনের সহ-প্রতিষ্ঠাতা ছিলেন, মিডজার্নি কখনও কোনও বাইরের বিনিয়োগ পায়নি।
কোম্পানিটি তার রাজস্ব প্রকাশ করে না, তবে CBInsights অনুমান করে যে ২০২৩ সালের শেষ নাগাদ মিডজার্নির প্রায় ২০০ মিলিয়ন ডলার আয় হবে। কোম্পানিটি সম্প্রতি বলেছে যে তারা কিছু অপ্রকাশিত প্রকল্পে কাজ করার জন্য একটি হার্ডওয়্যার দল তৈরি করছে এবং ভিডিও এবং 3D বস্তু তৈরির জন্য পূর্বে ঘোষিত মডেলদের প্রশিক্ষণ অব্যাহত রাখছে।
ChatGPT-এর মতো, MidJourney-এর বিরুদ্ধেও বেশ কয়েকটি মামলা চলছে, যেখানে অভিযোগ করা হয়েছে যে তারা ছবি নির্মাতাদের সম্মতি ছাড়াই ওয়েব থেকে স্ক্র্যাপ করা ছবিগুলিতে AI সরঞ্জাম প্রশিক্ষণ দিয়ে লক্ষ লক্ষ শিল্পীর অধিকার লঙ্ঘন করেছে।
সূত্র: https://znews.vn/mo-hinh-tao-anh-ai-tot-hon-chatgpt-post1543472.html
মন্তব্য (0)