মিডজার্নির মডেল V7, হাতের মতো বিবরণ আরও ধারাবাহিকভাবে তৈরি করতে সক্ষম বলে জানা গেছে। ছবি: জিওফোন । |
ওয়েবে প্রথম AI-চালিত ছবি তৈরির সরঞ্জামগুলির মধ্যে একটি, মিডজার্নি, প্রায় এক বছরের মধ্যে তার প্রথম নতুন মডেল চালু করেছে।
V7 নামের এই মডেলটি ৪ঠা এপ্রিল (মার্কিন সময়) মধ্যরাতে বিটা টেস্টিংয়ে প্রকাশিত হয়েছিল। এক সপ্তাহ আগে, OpenAI ChatGPT-এর সাথে একই ধরণের একটি বৈশিষ্ট্য চালু করেছিল, যা দ্রুত সোশ্যাল মিডিয়া সেনসেশন হয়ে ওঠে, ঘিবলি-স্টাইলের ছবি তৈরির একটি নতুন ট্রেন্ড তৈরি করে।
আপনি যদি মিডজার্নিতে নতুন হন, তাহলে প্রথমে আপনার পছন্দের উপর ভিত্তি করে টুলটি যে ২০০টি ছবি প্রস্তাব করে তা মূল্যায়ন করতে হবে। তারপর, টুলটি আপনার সৌন্দর্যের সাথে মেলে এমন ছবি তৈরি করার জন্য একটি ব্যক্তিগতকৃত প্রোফাইল তৈরি করবে। V7 হল প্রথম মিডজার্ন মডেল যেখানে ডিফল্টরূপে ব্যক্তিগতকরণ সক্ষম করা আছে।
ওয়েবসাইটের "সংস্করণ" টুলবারে ক্লিক করে আপনি V7 সক্ষম বা অক্ষম করতে পারেন। এছাড়াও, এই মডেলটি মিডজার্নির ডিসকর্ড সার্ভারেও ব্যবহার করা যেতে পারে।
মিডজার্নির সিইও ডেভিড হোলজ X-এর একটি পোস্টে V7-কে "সম্পূর্ণ ভিন্ন স্থাপত্য" হিসেবে বর্ণনা করেছেন। "টেক্সট স্টেটমেন্ট পরিচালনার ক্ষেত্রে V7 অনেক বেশি স্মার্ট," হোলজ ডিসকর্ডে আরও ঘোষণা করেছেন।
তিনি মন্তব্য করেন যে মডেলটি আসল ছবিগুলিও বেশ ভালোভাবে পরিচালনা করে। উচ্চ মাত্রার বিশদ বিবরণের সাথে ছবির মান লক্ষণীয়ভাবে উন্নত হয়েছে। হাত ও পায়ের মতো শরীরের অংশ থেকে শুরু করে ফ্রেকল এবং সিরামিক প্যাটার্ন, সবকিছুই ক্ষুদ্রতম বিশদ পর্যন্ত সামঞ্জস্যপূর্ণ।
![]() |
V7 মডেল ব্যবহার করে কিছু নমুনা ছবি তৈরি করা হয়েছে। ছবি: X/MidJourney। |
টার্বো (আরও ব্যয়বহুল) এবং রিলাক্স এই দুটি মোড ছাড়াও, V7 ড্রাফ্ট মোড নামে একটি নতুন টুল সমর্থন করে, যা দশ গুণ দ্রুত এবং স্ট্যান্ডার্ড মোডের অর্ধেক খরচে ছবি তৈরি করতে দেয়। ড্রাফ্ট মোডে ছবিগুলির মান কম হবে, তবে ব্যবহারকারীরা মাত্র এক ক্লিকেই ছবিগুলিকে আপস্কেল এবং পুনঃনির্মাণ করতে পারবেন।
হোলজের মতে, V7-তে বর্তমানে কিছু স্ট্যান্ডার্ড মিডজার্নি বৈশিষ্ট্য অনুপলব্ধ, যার মধ্যে রয়েছে আপস্কেলিং এবং রিটেক্সচারিং। তিনি বলেন যে এই বৈশিষ্ট্যগুলি নিকট ভবিষ্যতে, সম্ভবত আগামী দুই মাসের মধ্যে যোগ করা হবে।
"এটি সম্পূর্ণ নতুন মডেল যার নিজস্ব শক্তি রয়েছে, এবং সম্ভবত কিছু দুর্বলতাও রয়েছে," হোলজ ডিসকর্ডে লিখেছেন। তিনি উল্লেখ করেছেন যে V7 এর জন্য একটি নতুন কমান্ড-লাইন লেখার শৈলীর প্রয়োজন হতে পারে এবং গঠনমূলক প্রতিক্রিয়া প্রদানে সহায়তা করার জন্য সকলকে সংস্করণটি চেষ্টা করে দেখার জন্য উৎসাহিত করেছেন।
টেকক্রাঞ্চের প্রতিবেদক কাইল উইগার্স মন্তব্য করেছেন যে V7 তার মৌলিক কমান্ডগুলি ভালভাবে কার্যকর করতে পারে। "মিডজর্নির মডেলটি ঘিবলি স্টাইলের জন্য বিশেষভাবে অপ্টিমাইজ করা হয়নি, অন্তত আনুষ্ঠানিকভাবে নয়, তবে এটি এখনও নান্দনিকভাবে মনোরম কাজ তৈরি করতে পারে," তিনি যোগ করেছেন।
ভিয়েতনামের এআই বিশেষজ্ঞদের মতে, চ্যাটজিপিটির ইমেজ জেনারেশন ফিচারটি মিডজার্নি এবং স্টেবল ডিফিউশনের মতো পূর্ববর্তী ইমেজ জেনারেশন টুলের তুলনায় ব্যবহার করা সহজ এবং আরও সুবিধাজনক হতে পারে। তবে, ওপেনএআই-এর মডেলটি এখনও ছবির মানের ক্ষেত্রে কোনও অগ্রগতি তৈরি করতে পারেনি এবং পূর্ববর্তী টুলের তুলনায় নিম্নমানের হতে পারে।
মিডজার্নি একটি অনন্য কোম্পানি। পিসি পেরিফেরাল প্রস্তুতকারক লিপ মোশনের সহ-প্রতিষ্ঠাতা হোলজ কর্তৃক ২০২২ সালে প্রতিষ্ঠিত মিডজার্নি কখনও কোনও বাইরের বিনিয়োগ পায়নি।
কোম্পানিটি তার ব্যবসায়িক কর্মক্ষমতা প্রকাশ করে না, তবে CBInsights অনুমান করেছে যে ২০২৩ সালের শেষে মিডজার্নির আয় প্রায় ২০০ মিলিয়ন ডলার হবে। সম্প্রতি, কোম্পানিটি জানিয়েছে যে তারা বেশ কয়েকটি অপ্রকাশিত প্রকল্পে কাজ করার জন্য একটি হার্ডওয়্যার দল গঠন করছে এবং পূর্বে ঘোষিত মডেলদের 3D ভিডিও এবং বস্তু তৈরির জন্য প্রশিক্ষণ অব্যাহত রাখছে।
ChatGPT-এর মতো, MidJourney-ও বেশ কয়েকটি মামলার মুখোমুখি হচ্ছে যেখানে ছবি নির্মাতাদের সম্মতি ছাড়াই ওয়েব থেকে সংগৃহীত ছবিগুলিতে AI সরঞ্জাম প্রশিক্ষণ দিয়ে লক্ষ লক্ষ শিল্পীর অধিকার লঙ্ঘনের অভিযোগ রয়েছে।
সূত্র: https://znews.vn/mo-hinh-tao-anh-ai-tot-hon-chatgpt-post1543472.html







মন্তব্য (0)