![]() |
Gemma 4 ایک بڑی ماڈل زبان (LLM) ہے جسے Google DeepMind نے تیار کیا ہے۔ یہ ایک اوپن سورس ماڈل فیملی ہے جو انٹرنیٹ کنکشن کے بغیر آن پریمیسس پروسیسنگ کو سپورٹ کرتی ہے۔ صارفین اسے اپنے کمپیوٹر یا موبائل آلات پر ڈاؤن لوڈ، حسب ضرورت، اور تعینات کر سکتے ہیں۔ |
![]() |
Gemma 4 سیریز کو چار ورژن میں تقسیم کیا گیا ہے: E2B، E4B، 31B، اور 26B A4B۔ E2B اور E4B ورژن کے لیے کم از کم 4-6 GB (4-bit) یا 10-16 GB (16-bit) RAM کی ضرورت ہوتی ہے، جو موبائل آلات اور اعتدال سے ترتیب شدہ کمپیوٹرز پر چلانے کے لیے موزوں ہے۔ دریں اثنا، 26B A4B ورژن کے لیے کم از کم 18 GB RAM کی ضرورت ہے، اور 31B کے لیے کم از کم 20 GB درکار ہے۔ |
![]() |
MindStudio کے مطابق، AI ماڈلز کو مقامی طور پر چلانے کا ایک فائدہ سیکیورٹی ہے اور کوئی اضافی اخراجات نہیں ہیں۔ تاہم، ان ماڈلز کی کارکردگی کا انحصار ڈیوائس کے ہارڈ ویئر پر ہے۔ موبائل صارفین گوگل اے آئی ایج گیلری ایپ (تصویر میں) انسٹال کر سکتے ہیں، جبکہ کمپیوٹرز کو ایل ایم اسٹوڈیو یا اولاما جیسے ٹولز کی ضرورت ہوتی ہے۔ تصویر: گوگل ۔ |
![]() |
پی سی پر ایل ایم اسٹوڈیو آپ کو پہلی بار Gemma 4 کو منتخب کرنے اور لوڈ کرنے کی اجازت دیتا ہے۔ E4B ورژن تقریباً 6.3 GB سائز کا ہے اور تصویری تخمینہ اور تجزیہ کو سپورٹ کرتا ہے۔ موبائل پر Gemma 4 E4B کا سائز 3.6 GB ہے جب Google AI Edge گیلری کا استعمال کرتے ہوئے ڈاؤن لوڈ کیا جائے۔ |
![]() |
ڈاؤن لوڈ مکمل ہونے کے بعد، صارف کو چیٹ بوٹ طرز کے انٹرفیس پر بھیج دیا جاتا ہے۔ ذیل میں ماڈل سلیکشن سیکشن میں، Gemma 4 E4B پر کلک کریں۔ اگلی ونڈو میں، لوڈ ماڈل کو منتخب کریں اور ماڈل کے شروع ہونے کے لیے تقریباً ایک منٹ انتظار کریں۔ |
![]() |
دوسرے مشہور ماڈلز کی طرح، Gemma 4 E4B ویتنامی زبان کے تعامل کو سپورٹ کرتا ہے۔ "Hello" کمانڈ کے ساتھ Mac mini M4 (16 GB RAM) پر ٹیسٹ کرنے میں ماڈل کو اندازہ لگانے اور جواب دینے میں تقریباً 8 سیکنڈ لگے۔ |
![]() |
جب پوچھا گیا کہ "آپ کیا کر سکتے ہیں؟"، Gemma 4 E4B نے کمانڈ کو سمجھنے اور فوری طور پر انگریزی میں ترجمہ کرنے میں تقریباً 13 سیکنڈ کا وقت لیا، پھر آہستہ آہستہ جواب لکھیں۔ |
![]() |
چونکہ یہ براہ راست ڈیوائس پر چلتا ہے، اس لیے ہارڈ ویئر کے لحاظ سے ماڈل کا ردعمل کا وقت مختلف ہو سکتا ہے۔ اسی سوال کے ساتھ، "آپ کیا کر سکتے ہیں؟"، ماڈل کو آئی فون 15 پرو پر مکمل جواب دینے میں تقریباً 45 سیکنڈ لگے۔ |
![]() |
ایک اور استدلال والا سوال جس کا فوری اور درست جواب دیا گیا، مثال کے طور پر، "ایک ٹرین صبح 8:15 پر روانہ ہوتی ہے اور صبح 11:47 پر پہنچتی ہے۔ سفر میں کتنا وقت لگا؟"۔ عام طور پر، اس طرح کے سادہ استدلال بیانات ایل ایل ایم کی نئی نسل کے لیے زیادہ پیچیدہ نہیں ہیں۔ |
![]() |
منطق پر مبنی سوال کے ساتھ تجربہ کیا گیا جیسے "لفظ 'اسٹرابیری' میں کتنے 'r' ہیں؟"۔ اس سوال نے پچھلے کئی LLMs کو روک دیا تھا، لیکن Gemma 4 E4B نے صحیح جواب دینے میں صرف 3 سیکنڈ کا وقت لیا۔ |
![]() ![]() |
ایک زیادہ پیچیدہ سوال کے ساتھ، پیچیدہ استدلال کی ایک سیریز کے بعد، Gemma 4 نے صحیح جواب دیا۔ سوچنے کا کل وقت 1 منٹ اور 6 سیکنڈ تھا، آف لائن ماڈل کے لیے زیادہ لمبا نہیں۔ مقابلے کے لیے، Gemini 3 Thinking میں تقریباً 15 سیکنڈ لگے، اور GPT-5.5 نے اتنا ہی وقت لیا۔ |
![]() |
Gemma 4 E4B کی خاص بات اس کی ملٹی موڈل صلاحیتوں سے آتی ہے، جو امیج ان پٹ کو سپورٹ کرتی ہے۔ مثال کے طور پر، LLM تصاویر کا تجزیہ کر سکتا ہے اور تصویر میں نشانات، نمایاں تفصیلات، اور موسم اور آب و ہوا کے حالات کے بارے میں سوالات کے جوابات دے سکتا ہے۔ |
![]() |
جب میگزین کے صفحہ کی تصویر سے تمام متن نکالنے کے لیے کہا گیا، Gemma 4 نے نتیجہ واپس کرنے میں صرف 30 سیکنڈ کا وقت لیا۔ یہ ٹائم فریم دوسرے آن لائن سرچ انجنوں سے نمایاں طور پر مختلف نہیں ہے جن سے صارفین واقف ہیں۔ |
![]() |
اسمارٹ فون ایپ پر، صارفین کو مرکزی انٹرفیس (AI Chat، Ask Image، وغیرہ) سے ایک فیچر منتخب کرنے کی ضرورت ہے، پھر استعمال کرنے کے لیے ایک ماڈل کا انتخاب کریں۔ چونکہ یہ GPU کی بنیاد پر کام کرتا ہے، اس لیے آلہ AI انفرنس کے عمل کے دوران گرم ہو سکتا ہے۔ |
![]() |
صارف دستاویز کی فائلیں، DOCX یا PDF فارمیٹ میں بھی اپ لوڈ کر سکتے ہیں، اور پھر متن کے تجزیہ یا خلاصہ کی درخواست کر سکتے ہیں۔ گوگل کے نمائندوں کے مطابق، ماڈلز کی نئی نسل کریکٹر سٹرنگ جنریشن کو مؤثر طریقے سے کنٹرول کرتی ہے۔ ماڈل غیر ضروری سوچ کے عمل کو محدود کرتا ہے، گرافکس کارڈز اور کمپیوٹر میموری پر کمپیوٹیشنل دباؤ کو کم کرتا ہے۔ |
![]() |
Gemma 4 بھی قابل پروگرام ہے۔ ایک تجربے میں، ماڈل کو HTML، CSS، اور JavaScript کا استعمال کرتے ہوئے ایک آپریٹنگ سسٹم بنانے کا کام سونپا گیا جو براہ راست براؤزر میں چلتا ہے۔ صارفین کو سٹارٹ اپ سے پہلے سیاق و سباق کی لمبائی میں اضافہ کرنے کی ضرورت تھی تاکہ یہ یقینی بنایا جا سکے کہ ماڈل نے مکمل جواب دیا ہے۔ اس کے باوجود، اگر HTML فائل نامکمل تھی تو AI پھر بھی غلطیاں کر سکتا ہے، اور ہو سکتا ہے کہ ایپلی کیشن کے کچھ اجزاء کام نہ کریں۔ |
![]() |
عام طور پر، متعدد مراحل یا پیچیدہ ڈیٹا کی ضرورت والی کمانڈز Gemma 4 کے لیے چیلنجنگ ہو سکتی ہیں۔ کچھ کمانڈز بڑی تعداد میں پروسیسنگ ٹوکن استعمال کر سکتے ہیں۔ ضرورت سے زیادہ بڑی ٹوکن کی حدیں مقرر کرنا بہت زیادہ RAM یا VRAM استعمال کر سکتا ہے۔ |
ماخذ: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























تبصرہ (0)