![]() |
Η Gemma 4 είναι μια μεγάλη γλώσσα μοντέλων (LLM) που αναπτύχθηκε από την Google DeepMind. Είναι μια οικογένεια μοντέλων ανοιχτού κώδικα που υποστηρίζει την επεξεργασία σε εγκαταστάσεις χωρίς σύνδεση στο διαδίκτυο. Οι χρήστες μπορούν να την κατεβάσουν, να την προσαρμόσουν και να την αναπτύξουν στους υπολογιστές ή τις κινητές συσκευές τους. |
![]() |
Η σειρά Gemma 4 διανέμεται σε τέσσερις εκδόσεις: E2B, E4B, 31B και 26B A4B. Οι εκδόσεις E2B και E4B απαιτούν τουλάχιστον 4-6 GB (4-bit) ή 10-16 GB (16-bit) μνήμης RAM, κατάλληλη για λειτουργία σε κινητές συσκευές και υπολογιστές μέτριας διαμόρφωσης. Εν τω μεταξύ, η έκδοση 26B A4B απαιτεί τουλάχιστον 18 GB μνήμης RAM και η 31B απαιτεί τουλάχιστον 20 GB. |
![]() |
Σύμφωνα με το MindStudio , ένα από τα πλεονεκτήματα της τοπικής εκτέλεσης μοντέλων τεχνητής νοημοσύνης είναι η ασφάλεια και η έλλειψη πρόσθετου κόστους. Ωστόσο, η απόδοση αυτών των μοντέλων εξαρτάται από το υλικό της συσκευής. Οι χρήστες κινητών τηλεφώνων μπορούν να εγκαταστήσουν την εφαρμογή Google AI Edge Gallery (εικόνα), ενώ οι υπολογιστές απαιτούν εργαλεία όπως το LM Studio ή το Ollama. Φωτογραφία: Google . |
![]() |
Το LM Studio σε υπολογιστή σάς επιτρέπει να επιλέξετε και να φορτώσετε το Gemma 4 κατά την πρώτη εκτέλεση. Η έκδοση E4B έχει μέγεθος περίπου 6,3 GB και υποστηρίζει συμπερασματολογία και ανάλυση εικόνας. Το Gemma 4 E4B σε κινητό έχει μέγεθος 3,6 GB όταν λαμβάνεται χρησιμοποιώντας το Google AI Edge Gallery. |
![]() |
Αφού ολοκληρωθεί η λήψη, ο χρήστης ανακατευθύνεται σε μια διεπαφή τύπου chatbot. Στην ενότητα επιλογής μοντέλου παρακάτω, κάντε κλικ στο Gemma 4 E4B . Στο επόμενο παράθυρο, επιλέξτε Φόρτωση μοντέλου και περιμένετε περίπου ένα λεπτό για να ξεκινήσει το μοντέλο. |
![]() |
Όπως και άλλα δημοφιλή μοντέλα, το Gemma 4 E4B υποστηρίζει την αλληλεπίδραση στη βιετναμέζικη γλώσσα. Κατά τη δοκιμή σε Mac mini M4 (16 GB RAM) με την εντολή "Hello", το μοντέλο χρειάστηκε περίπου 8 δευτερόλεπτα για να το καταλάβει και να απαντήσει. |
![]() |
Όταν ρωτήθηκε «Τι μπορείς να κάνεις;», η Gemma 4 E4B χρειάστηκε περίπου 13 δευτερόλεπτα για να καταλάβει και να μεταφράσει αμέσως την εντολή στα Αγγλικά, και στη συνέχεια να σημειώσει σταδιακά την απάντηση. |
![]() |
Επειδή εκτελείται απευθείας στη συσκευή, ο χρόνος απόκρισης του μοντέλου ενδέχεται να διαφέρει ανάλογα με το υλικό. Με την ίδια ερώτηση, "Τι μπορείτε να κάνετε;", το μοντέλο χρειάστηκε περίπου 45 δευτερόλεπτα για να παρέχει μια πλήρη απόκριση σε ένα iPhone 15 Pro. |
![]() |
Μια άλλη ερώτηση συλλογισμού που απαντήθηκε γρήγορα και με ακρίβεια ήταν, για παράδειγμα, «Ένα τρένο αναχωρεί στις 8:15 π.μ. και φτάνει στις 11:47 π.μ. Πόσο διήρκεσε το ταξίδι;». Γενικά, απλές προτάσεις συλλογισμού όπως αυτές δεν είναι πολύ περίπλοκες για τη νέα γενιά LLM. |
![]() |
Δοκιμάστηκε με μια ερώτηση βασισμένη στη λογική, όπως "Πόσα 'r' υπάρχουν στη λέξη 'φράουλα';". Αυτή η ερώτηση είχε βάλει σε δύσκολη θέση πολλούς προηγούμενους LLM, αλλά η Gemma 4 E4B χρειάστηκε μόνο περίπου 3 δευτερόλεπτα για να απαντήσει σωστά. |
![]() ![]() |
Με μια πιο σύνθετη ερώτηση, μετά από μια σειρά σχολαστικών συλλογισμών, η Gemma 4 απάντησε σωστά. Ο συνολικός χρόνος σκέψης ήταν 1 λεπτό και 6 δευτερόλεπτα, όχι πολύς για ένα μοντέλο εκτός σύνδεσης. Για λόγους σύγκρισης, η σκέψη στο Gemini 3 χρειάστηκε περίπου 15 δευτερόλεπτα και το GPT-5.5 χρειάστηκε παρόμοιο χρόνο. |
![]() |
Το αποκορύφωμα του Gemma 4 E4B προέρχεται από τις πολυτροπικές του δυνατότητες, υποστηρίζοντας την εισαγωγή εικόνων. Για παράδειγμα, το LLM μπορεί να αναλύσει εικόνες και να απαντήσει σε ερωτήσεις σχετικά με ορόσημα, σημαντικές λεπτομέρειες και καιρικές και κλιματικές συνθήκες στην εικόνα. |
![]() |
Όταν της ζητήθηκε να εξαγάγει όλο το κείμενο από μια εικόνα σελίδας περιοδικού, η Gemma 4 χρειάστηκε λίγο περισσότερο από 30 δευτερόλεπτα για να επιστρέψει το αποτέλεσμα. Αυτό το χρονικό πλαίσιο δεν διαφέρει σημαντικά από αυτό άλλων μηχανών αναζήτησης στο διαδίκτυο με τις οποίες είναι εξοικειωμένοι οι χρήστες. |
![]() |
Στην εφαρμογή για smartphone, οι χρήστες πρέπει να επιλέξουν μια λειτουργία από την κύρια διεπαφή (AI Chat, Ask Image, κ.λπ.) και, στη συνέχεια, να επιλέξουν ένα μοντέλο που θα χρησιμοποιήσουν. Επειδή λειτουργεί με βάση την GPU, η συσκευή ενδέχεται να ζεσταθεί κατά τη διάρκεια της διαδικασίας εξαγωγής συμπερασμάτων από την AI. |
![]() |
Οι χρήστες μπορούν επίσης να ανεβάσουν αρχεία εγγράφων, σε μορφή DOCX ή PDF, και στη συνέχεια να ζητήσουν ανάλυση ή σύνοψη κειμένου. Σύμφωνα με εκπροσώπους της Google, η νέα γενιά μοντέλων ελέγχει αποτελεσματικά τη δημιουργία συμβολοσειρών. Το μοντέλο περιορίζει τις περιττές διαδικασίες σκέψης, μειώνοντας την υπολογιστική επιβάρυνση στις κάρτες γραφικών και τη μνήμη του υπολογιστή. |
![]() |
Το Gemma 4 είναι επίσης προγραμματιζόμενο. Σε ένα πείραμα, το μοντέλο είχε την εντολή να χρησιμοποιήσει HTML, CSS και JavaScript για να δημιουργήσει ένα λειτουργικό σύστημα που εκτελείται απευθείας στο πρόγραμμα περιήγησης. Οι χρήστες έπρεπε να αυξήσουν το μήκος περιβάλλοντος πριν από την εκκίνηση, για να διασφαλίσουν ότι το μοντέλο παρήγαγε μια ολοκληρωμένη απάντηση. Παρόλα αυτά, η τεχνητή νοημοσύνη θα μπορούσε να κάνει λάθη εάν το αρχείο HTML ήταν ελλιπές και ορισμένα στοιχεία της εφαρμογής ενδέχεται να μην λειτουργούσαν. |
![]() |
Γενικά, οι εντολές που απαιτούν πολλαπλά βήματα ή σύνθετα δεδομένα μπορεί να είναι δύσκολες για το Gemma 4. Ορισμένες εντολές ενδέχεται να καταναλώνουν μεγάλο αριθμό διακριτικών επεξεργασίας. Ο καθορισμός υπερβολικά μεγάλων ορίων διακριτικών μπορεί να καταναλώσει πολλή μνήμη RAM ή VRAM. |
Πηγή: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Σχόλιο (0)