![]() |
Gemma 4 یک زبان مدلسازی بزرگ (LLM) است که توسط Google DeepMind توسعه داده شده است. این یک خانواده مدل متنباز است که از پردازش در محل و بدون اتصال به اینترنت پشتیبانی میکند. کاربران میتوانند آن را دانلود، سفارشیسازی و روی رایانهها یا دستگاههای تلفن همراه خود مستقر کنند. |
![]() |
سری Gemma 4 در چهار نسخه توزیع شده است: E2B، E4B، 31B و 26B A4B. نسخههای E2B و E4B به حداقل 4-6 گیگابایت (4 بیتی) یا 10-16 گیگابایت (16 بیتی) رم نیاز دارند که برای اجرا در دستگاههای تلفن همراه و رایانههای با پیکربندی متوسط مناسب است. در همین حال، نسخه 26B A4B به حداقل 18 گیگابایت رم و 31B به حداقل 20 گیگابایت رم نیاز دارد. |
![]() |
طبق گفته MindStudio ، یکی از مزایای اجرای مدلهای هوش مصنوعی به صورت محلی، امنیت و عدم نیاز به هزینههای اضافی است. با این حال، عملکرد این مدلها به سختافزار دستگاه بستگی دارد. کاربران موبایل میتوانند برنامه Google AI Edge Gallery (تصویر) را نصب کنند، در حالی که کامپیوترها به ابزارهایی مانند LM Studio یا Ollama نیاز دارند. عکس: گوگل . |
![]() |
LM Studio در کامپیوتر به شما امکان میدهد Gemma 4 را در اولین اجرا انتخاب و بارگذاری کنید. نسخه E4B تقریباً ۶.۳ گیگابایت حجم دارد و از استنتاج و تحلیل تصویر پشتیبانی میکند. Gemma 4 E4B در موبایل هنگام دانلود با استفاده از Google AI Edge Gallery حجمی معادل ۳.۶ گیگابایت دارد. |
![]() |
پس از اتمام دانلود، کاربر به رابط کاربری به سبک ربات چت هدایت میشود. در بخش انتخاب مدل زیر، روی Gemma 4 E4B کلیک کنید. در پنجره بعدی، Load Model را انتخاب کنید و حدود یک دقیقه صبر کنید تا مدل شروع به کار کند. |
![]() |
مشابه سایر مدلهای محبوب، Gemma 4 E4B از تعامل به زبان ویتنامی پشتیبانی میکند. با آزمایش روی یک مک مینی M4 (با ۱۶ گیگابایت رم)، این مدل تقریباً ۸ ثانیه طول کشید تا زبان را درک کرده و پاسخ دهد. |
![]() |
وقتی از Gemma 4 E4B پرسیده شد «چه کاری میتوانی انجام دهی؟»، تقریباً ۱۳ ثانیه طول کشید تا دستور را بفهمد و بلافاصله به انگلیسی ترجمه کند، سپس به تدریج پاسخ را یادداشت کرد. |
![]() |
از آنجا که مستقیماً روی دستگاه اجرا میشود، زمان پاسخگویی مدل ممکن است بسته به سختافزار متفاوت باشد. با همان سوال «چه کاری میتوانید انجام دهید؟»، این مدل تقریباً ۴۵ ثانیه طول کشید تا پاسخ کاملی را در آیفون ۱۵ پرو ارائه دهد. |
![]() |
یکی دیگر از سوالات استدلالی که به سرعت و با دقت پاسخ داده شد، برای مثال این بود: «قطاری ساعت ۸:۱۵ صبح حرکت میکند و ساعت ۱۱:۴۷ صبح میرسد. این سفر چقدر طول کشیده است؟». به طور کلی، جملات استدلالی سادهای مانند این برای نسل جدید دانشجویان کارشناسی ارشد مدیریت بازرگانی (LLM) خیلی پیچیده نیستند. |
![]() |
با یک سوال منطقی مانند «چند «ر» در کلمه «توت فرنگی» وجود دارد؟» امتحان شدم. این سوال بسیاری از آزمونهای LLM قبلی را گیج کرده بود، اما Gemma 4 E4B فقط حدود ۳ ثانیه طول کشید تا به درستی به آن پاسخ دهد. |
![]() ![]() |
با یک سوال پیچیدهتر، پس از یک سری استدلال دقیق، Gemma 4 به درستی پاسخ داد. کل زمان تفکر ۱ دقیقه و ۶ ثانیه بود که برای یک مدل آفلاین خیلی طولانی نیست. برای مقایسه، Gemini 3 Thinking حدود ۱۵ ثانیه طول کشید و GPT-5.5 نیز زمان مشابهی را صرف کرد. |
![]() |
نکته برجسته Gemma 4 E4B از قابلیتهای چندوجهی آن ناشی میشود که از ورودی تصویر پشتیبانی میکند. به عنوان مثال، LLM میتواند تصاویر را تجزیه و تحلیل کند و به سؤالاتی در مورد نقاط دیدنی، جزئیات برجسته و شرایط آب و هوایی و اقلیمی در تصویر پاسخ دهد. |
![]() |
وقتی از Gemma 4 خواسته شد تمام متن را از تصویر یک صفحه مجله استخراج کند، کمی بیش از 30 ثانیه طول کشید تا نتیجه را برگرداند. این بازه زمانی تفاوت چندانی با سایر موتورهای جستجوی آنلاین که کاربران با آنها آشنا هستند، ندارد. |
![]() |
در برنامه تلفن هوشمند، کاربران باید یک ویژگی را از رابط اصلی (AI Chat، Ask Image و غیره) انتخاب کنند، سپس مدلی را برای استفاده انتخاب کنند. از آنجا که این برنامه بر اساس GPU کار میکند، ممکن است دستگاه در طول فرآیند استنتاج هوش مصنوعی گرم شود. |
![]() |
کاربران همچنین میتوانند فایلهای سند را با فرمت DOCX یا PDF آپلود کنند و سپس درخواست تحلیل یا خلاصهسازی متن را بدهند. به گفته نمایندگان گوگل، نسل جدید مدلها به طور مؤثر تولید رشتههای کاراکتری را کنترل میکنند. این مدل فرآیندهای فکری غیرضروری را محدود میکند و فشار محاسباتی روی کارتهای گرافیک و حافظه کامپیوتر را کاهش میدهد. |
![]() |
Gemma 4 همچنین قابل برنامهریزی است. در یک آزمایش، از این مدل خواسته شد تا با استفاده از HTML، CSS و جاوا اسکریپت، سیستم عاملی بسازد که مستقیماً در مرورگر اجرا شود. کاربران باید قبل از راهاندازی، طول متن (Context Length) را افزایش میدادند تا مطمئن شوند که مدل پاسخ کاملی ارائه میدهد. با این وجود، اگر فایل HTML ناقص باشد، هوش مصنوعی همچنان میتواند اشتباه کند و برخی از اجزای برنامه ممکن است کار نکنند. |
![]() |
به طور کلی، دستوراتی که نیاز به مراحل متعدد یا دادههای پیچیده دارند، میتوانند برای Gemma 4 چالش برانگیز باشند. برخی از دستورات ممکن است تعداد زیادی توکن پردازشی مصرف کنند. تعیین محدودیتهای بیش از حد بزرگ برای توکنها میتواند مقدار زیادی RAM یا VRAM مصرف کند. |
منبع: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























نظر (0)