![]() |
জেমা ৪ হলো গুগল ডিপমাইন্ড দ্বারা তৈরি একটি বৃহৎ মডেল ভাষা (এলএলএম)। এটি একটি ওপেন-সোর্স মডেল ফ্যামিলি যা ইন্টারনেট সংযোগ ছাড়াই অন-প্রিমিসেস প্রসেসিং সমর্থন করে। ব্যবহারকারীরা এটি তাদের কম্পিউটার বা মোবাইল ডিভাইসে ডাউনলোড, কাস্টমাইজ এবং স্থাপন করতে পারেন। |
![]() |
জেমা ৪ সিরিজটি চারটি সংস্করণে পাওয়া যায়: E2B, E4B, 31B, এবং 26B A4B। E2B এবং E4B সংস্করণগুলো চালানোর জন্য ন্যূনতম ৪-৬ জিবি (৪-বিট) অথবা ১০-১৬ জিবি (১৬-বিট) র্যাম প্রয়োজন, যা মোবাইল ডিভাইস এবং মাঝারি মানের কনফিগারেশনের কম্পিউটারে চালানোর জন্য উপযুক্ত। অন্যদিকে, 26B A4B সংস্করণটির জন্য ন্যূনতম ১৮ জিবি র্যাম এবং 31B সংস্করণটির জন্য কমপক্ষে ২০ জিবি র্যাম প্রয়োজন। |
![]() |
মাইন্ডস্টুডিও- এর মতে, স্থানীয়ভাবে এআই মডেল চালানোর অন্যতম সুবিধা হলো নিরাপত্তা এবং কোনো অতিরিক্ত খরচ না থাকা। তবে, এই মডেলগুলোর পারফরম্যান্স ডিভাইসের হার্ডওয়্যারের ওপর নির্ভর করে। মোবাইল ব্যবহারকারীরা গুগল এআই এজ গ্যালারি অ্যাপ (ছবিতে দেখানো) ইনস্টল করতে পারেন, অন্যদিকে কম্পিউটারের জন্য এলএম স্টুডিও বা ওলামার মতো টুলের প্রয়োজন হয়। ছবি: গুগল । |
![]() |
পিসিতে এলএম স্টুডিও আপনাকে প্রথমবার চালানোর সময় জেমা ৪ নির্বাচন ও লোড করার সুযোগ দেয়। এর E4B সংস্করণটির আকার প্রায় ৬.৩ জিবি এবং এটি ইমেজ ইনফারেন্স ও বিশ্লেষণ সমর্থন করে। গুগল এআই এজ গ্যালারি ব্যবহার করে ডাউনলোড করা হলে মোবাইলের জন্য জেমা ৪ E4B-এর আকার হয় ৩.৬ জিবি। |
![]() |
ডাউনলোড সম্পন্ন হলে, ব্যবহারকারীকে একটি চ্যাটবট-সদৃশ ইন্টারফেসে নিয়ে যাওয়া হয়। নিচের মডেল নির্বাচন বিভাগে, Gemma 4 E4B- তে ক্লিক করুন। পরবর্তী উইন্ডোতে, 'Load Model' নির্বাচন করুন এবং মডেলটি চালু হওয়ার জন্য প্রায় এক মিনিট অপেক্ষা করুন। |
![]() |
অন্যান্য জনপ্রিয় মডেলের মতোই, জেমা ৪ ই৪বি ভিয়েতনামী ভাষায় কথোপকথন সমর্থন করে। একটি ম্যাক মিনি এম৪ (১৬ জিবি র্যাম)-এ "হ্যালো" কমান্ড দিয়ে পরীক্ষা করে দেখা গেছে, মডেলটি তথ্য অনুধাবন করে সাড়া দিতে প্রায় ৮ সেকেন্ড সময় নিয়েছে। |
![]() |
"তুমি কী করতে পারো?" জিজ্ঞাসা করা হলে, জেমা ৪ ই৪বি প্রায় ১৩ সেকেন্ডের মধ্যে নির্দেশটি বুঝতে ও সঙ্গে সঙ্গে ইংরেজিতে অনুবাদ করতে এবং তারপর ধীরে ধীরে উত্তরটি লিখে ফেলতে সক্ষম হয়। |
![]() |
যেহেতু এটি সরাসরি ডিভাইসে চলে, তাই হার্ডওয়্যারের উপর নির্ভর করে মডেলটির প্রতিক্রিয়া সময় ভিন্ন হতে পারে। একই প্রশ্ন, "আপনি কী করতে পারেন?", এর ক্ষেত্রে একটি iPhone 15 Pro-তে মডেলটি সম্পূর্ণ প্রতিক্রিয়া জানাতে প্রায় ৪৫ সেকেন্ড সময় নিয়েছিল। |
![]() |
আরেকটি যুক্তিমূলক প্রশ্ন যার উত্তর দ্রুত এবং নির্ভুলভাবে দেওয়া হয়েছিল, যেমন, "একটি ট্রেন সকাল ৮:১৫ মিনিটে ছেড়ে সকাল ১১:৪৭ মিনিটে পৌঁছায়। যাত্রাটিতে কতক্ষণ সময় লেগেছিল?"। সাধারণভাবে, এই ধরনের সহজ যুক্তিমূলক প্রশ্নগুলো নতুন প্রজন্মের এলএলএম শিক্ষার্থীদের জন্য খুব বেশি জটিল নয়। |
![]() |
"'strawberry' শব্দটিতে কয়টি 'r' আছে?"-এর মতো একটি যুক্তিভিত্তিক প্রশ্ন দিয়ে পরীক্ষা করা হয়েছিল। এই প্রশ্নটি এর আগে অনেক এলএলএম শিক্ষার্থীকে ধাঁধায় ফেলেছিল, কিন্তু জেমা ৪ ই৪বি মাত্র ৩ সেকেন্ডের মধ্যে এর সঠিক উত্তর দেন। |
![]() ![]() |
আরও জটিল একটি প্রশ্নের ক্ষেত্রে, বেশ কিছু পুঙ্খানুপুঙ্খ যুক্তির পর জেমা ৪ সঠিকভাবে উত্তর দিয়েছিল। মোট চিন্তা করার সময় লেগেছিল ১ মিনিট ৬ সেকেন্ড, যা একটি অফলাইন মডেলের জন্য খুব বেশি নয়। তুলনা করলে, জেমিনি ৩-এর চিন্তা করতে প্রায় ১৫ সেকেন্ড এবং জিপিটি-৫.৫-এরও প্রায় একই পরিমাণ সময় লেগেছিল। |
![]() |
জেমা ৪ ই৪বি-এর প্রধান আকর্ষণ হলো এর মাল্টিমোডাল সক্ষমতা, যা ইমেজ ইনপুট সমর্থন করে। উদাহরণস্বরূপ, এলএলএম ছবি বিশ্লেষণ করে ছবির ল্যান্ডমার্ক, গুরুত্বপূর্ণ বিবরণ এবং আবহাওয়া ও জলবায়ু পরিস্থিতি সম্পর্কে প্রশ্নের উত্তর দিতে পারে। |
![]() |
একটি ম্যাগাজিনের পাতার ছবি থেকে সমস্ত লেখা বের করতে বলা হলে, জেমা ৪ ফলাফল দেখাতে ৩০ সেকেন্ডের কিছু বেশি সময় নেয়। এই সময়সীমাটি ব্যবহারকারীদের পরিচিত অন্যান্য অনলাইন সার্চ ইঞ্জিনগুলোর থেকে উল্লেখযোগ্যভাবে ভিন্ন নয়। |
![]() |
স্মার্টফোন অ্যাপে, ব্যবহারকারীদের মূল ইন্টারফেস থেকে একটি ফিচার (এআই চ্যাট, আস্ক ইমেজ, ইত্যাদি) নির্বাচন করতে হবে, তারপর ব্যবহারের জন্য একটি মডেল বেছে নিতে হবে। যেহেতু এটি জিপিইউ-এর উপর ভিত্তি করে কাজ করে, তাই এআই ইনফারেন্স প্রক্রিয়ার সময় ডিভাইসটি গরম হয়ে যেতে পারে। |
![]() |
ব্যবহারকারীরা DOCX বা PDF ফরম্যাটে ডকুমেন্ট ফাইলও আপলোড করতে পারেন এবং তারপর টেক্সট বিশ্লেষণ বা সারসংক্ষেপের জন্য অনুরোধ করতে পারেন। গুগল প্রতিনিধিদের মতে, নতুন প্রজন্মের মডেলগুলো কার্যকরভাবে ক্যারেক্টার স্ট্রিং তৈরি নিয়ন্ত্রণ করে। এই মডেল অপ্রয়োজনীয় চিন্তাভাবনা সীমিত করে, যার ফলে গ্রাফিক্স কার্ড এবং কম্পিউটার মেমরির উপর গণনার চাপ কমে যায়। |
![]() |
জেমা ৪ প্রোগ্রামযোগ্যও বটে। একটি পরীক্ষায়, মডেলটিকে এইচটিএমএল, সিএসএস এবং জাভাস্ক্রিপ্ট ব্যবহার করে এমন একটি অপারেটিং সিস্টেম তৈরি করার দায়িত্ব দেওয়া হয়েছিল যা সরাসরি ব্রাউজারে চলে। মডেলটি যাতে একটি সম্পূর্ণ উত্তর দেয়, তা নিশ্চিত করার জন্য ব্যবহারকারীদের চালু করার আগে ‘কনটেক্সট লেংথ’ বাড়াতে হতো। তা সত্ত্বেও, এইচটিএমএল ফাইলটি অসম্পূর্ণ থাকলে এআই-টি ভুল করতে পারত এবং অ্যাপ্লিকেশনের কিছু অংশ কাজ নাও করতে পারত। |
![]() |
সাধারণত, একাধিক ধাপ বা জটিল ডেটার প্রয়োজন হয় এমন কমান্ডগুলো জেমা ৪-এর জন্য চ্যালেঞ্জিং হতে পারে। কিছু কমান্ড প্রচুর পরিমাণে প্রসেসিং টোকেন ব্যবহার করতে পারে। টোকেনের সীমা অত্যধিক বাড়িয়ে দিলে তা প্রচুর র্যাম বা ভিআর্যাম খরচ করতে পারে। |
উৎস: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























মন্তব্য (0)