![]() |
जेम्मा 4, गूगल डीपमाइंड द्वारा विकसित एक लार्ज मॉडल लैंग्वेज (एलएलएम) है। यह एक ओपन-सोर्स मॉडल फैमिली है जो इंटरनेट कनेक्शन के बिना ऑन-प्रिमाइसेस प्रोसेसिंग को सपोर्ट करती है। उपयोगकर्ता इसे डाउनलोड कर सकते हैं, कस्टमाइज़ कर सकते हैं और अपने कंप्यूटर या मोबाइल डिवाइस पर डिप्लॉय कर सकते हैं। |
![]() |
जेम्मा 4 सीरीज़ चार संस्करणों में उपलब्ध है: E2B, E4B, 31B और 26B A4B। E2B और E4B संस्करणों के लिए न्यूनतम 4-6 GB (4-बिट) या 10-16 GB (16-बिट) RAM की आवश्यकता होती है, जो मोबाइल उपकरणों और सामान्य कॉन्फ़िगरेशन वाले कंप्यूटरों पर चलने के लिए उपयुक्त हैं। वहीं, 26B A4B संस्करण के लिए न्यूनतम 18 GB RAM और 31B संस्करण के लिए कम से कम 20 GB RAM की आवश्यकता होती है। |
![]() |
MindStudio के अनुसार, स्थानीय स्तर पर AI मॉडल चलाने का एक लाभ सुरक्षा और अतिरिक्त लागतों की अनुपस्थिति है। हालांकि, इन मॉडलों का प्रदर्शन डिवाइस के हार्डवेयर पर निर्भर करता है। मोबाइल उपयोगकर्ता Google AI Edge Gallery ऐप (चित्र में दिखाया गया है) इंस्टॉल कर सकते हैं, जबकि कंप्यूटरों को LM Studio या Ollama जैसे टूल की आवश्यकता होती है। फोटो: Google । |
![]() |
पीसी पर LM Studio आपको पहली बार चलाने पर Gemma 4 को चुनने और लोड करने की सुविधा देता है। E4B संस्करण का आकार लगभग 6.3 GB है और यह इमेज इन्फरेंस और विश्लेषण का समर्थन करता है। मोबाइल पर Gemma 4 E4B का आकार Google AI Edge Gallery का उपयोग करके डाउनलोड करने पर 3.6 GB होता है। |
![]() |
डाउनलोड पूरा होने के बाद, उपयोगकर्ता को चैटबॉट-शैली के इंटरफ़ेस पर रीडायरेक्ट कर दिया जाएगा। नीचे दिए गए मॉडल चयन अनुभाग में, Gemma 4 E4B पर क्लिक करें। अगली विंडो में, Load Model चुनें और मॉडल के शुरू होने के लिए लगभग एक मिनट प्रतीक्षा करें। |
![]() |
अन्य लोकप्रिय मॉडलों की तरह, जेम्मा 4 E4B वियतनामी भाषा में बातचीत का समर्थन करता है। मैक मिनी एम4 (16 जीबी रैम) पर "हैलो" कमांड के साथ परीक्षण करने पर, मॉडल को समझने और प्रतिक्रिया देने में लगभग 8 सेकंड का समय लगा। |
![]() |
जब जेम्मा 4 E4B से पूछा गया "आप क्या कर सकते हैं?", तो उसे आदेश को समझने और तुरंत अंग्रेजी में अनुवाद करने में लगभग 13 सेकंड का समय लगा, और फिर उसने धीरे-धीरे उत्तर लिख दिया। |
![]() |
क्योंकि यह सीधे डिवाइस पर चलता है, इसलिए हार्डवेयर के आधार पर मॉडल का प्रतिक्रिया समय भिन्न हो सकता है। "आप क्या कर सकते हैं?" जैसे समान प्रश्न के साथ, मॉडल ने iPhone 15 Pro पर पूर्ण प्रतिक्रिया देने में लगभग 45 सेकंड का समय लिया। |
![]() |
एक और तर्क-आधारित प्रश्न जिसका उत्तर जल्दी और सटीक रूप से दिया गया, उदाहरण के लिए, "एक ट्रेन सुबह 8:15 बजे प्रस्थान करती है और 11:47 बजे पहुँचती है। यात्रा में कितना समय लगा?"। सामान्य तौर पर, इस तरह के सरल तर्क-आधारित प्रश्न नई पीढ़ी के एलएलएम छात्रों के लिए बहुत जटिल नहीं होते हैं। |
![]() |
एक तर्क-आधारित प्रश्न से परीक्षा ली गई, जैसे "स्ट्रॉबेरी शब्द में कितने 'r' हैं?"। इस प्रश्न ने पहले के कई एलएलएम छात्रों को उलझन में डाल दिया था, लेकिन जेम्मा 4 ई4बी ने इसका सही उत्तर देने में केवल 3 सेकंड का समय लिया। |
![]() ![]() |
एक अधिक जटिल प्रश्न के उत्तर में, गहन विचार-विमर्श के बाद, जेम्मा 4 ने सही उत्तर दिया। कुल विचार-विमर्श का समय 1 मिनट और 6 सेकंड था, जो एक ऑफ़लाइन मॉडल के लिए बहुत अधिक नहीं है। तुलना के लिए, जेमिनी 3 थिंकिंग ने लगभग 15 सेकंड का समय लिया, और जीपीटी-5.5 ने भी लगभग इतना ही समय लिया। |
![]() |
जेम्मा 4 E4B की सबसे बड़ी खूबी इसकी मल्टीमॉडल क्षमताएं हैं, जो इमेज इनपुट को सपोर्ट करती हैं। उदाहरण के लिए, LLM इमेज का विश्लेषण कर सकता है और इमेज में मौजूद लैंडमार्क, प्रमुख विवरण और मौसम व जलवायु की स्थितियों के बारे में सवालों के जवाब दे सकता है। |
![]() |
जब जेम्मा 4 को किसी पत्रिका के पृष्ठ की छवि से पूरा पाठ निकालने के लिए कहा गया, तो उसने परिणाम देने में 30 सेकंड से थोड़ा अधिक समय लिया। यह समय सीमा अन्य ऑनलाइन खोज इंजनों से बहुत अलग नहीं है जिनसे उपयोगकर्ता परिचित हैं। |
![]() |
स्मार्टफोन ऐप पर, उपयोगकर्ताओं को मुख्य इंटरफ़ेस से एक फ़ीचर (एआई चैट, इमेज पूछें, आदि) का चयन करना होगा, फिर उपयोग करने के लिए एक मॉडल चुनना होगा। चूंकि यह जीपीयू पर आधारित है, इसलिए एआई अनुमान प्रक्रिया के दौरान डिवाइस गर्म हो सकता है। |
![]() |
उपयोगकर्ता DOCX या PDF फॉर्मेट में दस्तावेज़ फ़ाइलें अपलोड कर सकते हैं और फिर टेक्स्ट विश्लेषण या सारांश का अनुरोध कर सकते हैं। Google के प्रतिनिधियों के अनुसार, नई पीढ़ी के मॉडल प्रभावी रूप से कैरेक्टर स्ट्रिंग जनरेशन को नियंत्रित करते हैं। यह मॉडल अनावश्यक विचार प्रक्रियाओं को सीमित करता है, जिससे ग्राफ़िक्स कार्ड और कंप्यूटर मेमोरी पर कम्प्यूटेशनल दबाव कम होता है। |
![]() |
जेम्मा 4 प्रोग्रामेबल भी है। एक प्रयोग में, मॉडल को HTML, CSS और JavaScript का उपयोग करके एक ऑपरेटिंग सिस्टम बनाने का कार्य सौंपा गया था जो सीधे ब्राउज़र में चलता है। उपयोगकर्ताओं को स्टार्टअप से पहले कॉन्टेक्स्ट लेंथ बढ़ाने की आवश्यकता थी ताकि यह सुनिश्चित हो सके कि मॉडल एक पूर्ण उत्तर दे। फिर भी, यदि HTML फ़ाइल अपूर्ण थी, तो AI से गलतियाँ हो सकती थीं और कुछ एप्लिकेशन घटक काम नहीं कर सकते थे। |
![]() |
सामान्य तौर पर, कई चरणों या जटिल डेटा की आवश्यकता वाले कमांड Gemma 4 के लिए चुनौतीपूर्ण हो सकते हैं। कुछ कमांड बड़ी संख्या में प्रोसेसिंग टोकन का उपयोग कर सकते हैं। अत्यधिक बड़ी टोकन सीमा निर्धारित करने से बहुत अधिक RAM या VRAM की खपत हो सकती है। |
स्रोत: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























टिप्पणी (0)