Τι μπορεί να κάνει η Τεχνητή Νοημοσύνη χωρίς το δίκτυο της Google;

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 1

Η Gemma 4 είναι μια μεγάλη γλώσσα μοντέλων (LLM) που αναπτύχθηκε από την Google DeepMind. Είναι μια οικογένεια μοντέλων ανοιχτού κώδικα που υποστηρίζει την επεξεργασία σε εγκαταστάσεις χωρίς σύνδεση στο διαδίκτυο. Οι χρήστες μπορούν να την κατεβάσουν, να την προσαρμόσουν και να την αναπτύξουν στους υπολογιστές ή τις κινητές συσκευές τους.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 2

Η σειρά Gemma 4 διανέμεται σε τέσσερις εκδόσεις: E2B, E4B, 31B και 26B A4B. Οι εκδόσεις E2B και E4B απαιτούν τουλάχιστον 4-6 GB (4-bit) ή 10-16 GB (16-bit) μνήμης RAM, κατάλληλη για λειτουργία σε κινητές συσκευές και υπολογιστές μέτριας διαμόρφωσης. Εν τω μεταξύ, η έκδοση 26B A4B απαιτεί τουλάχιστον 18 GB μνήμης RAM και η 31B απαιτεί τουλάχιστον 20 GB.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 3

Σύμφωνα με το MindStudio , ένα από τα πλεονεκτήματα της τοπικής εκτέλεσης μοντέλων τεχνητής νοημοσύνης είναι η ασφάλεια και η έλλειψη πρόσθετου κόστους. Ωστόσο, η απόδοση αυτών των μοντέλων εξαρτάται από το υλικό της συσκευής. Οι χρήστες κινητών τηλεφώνων μπορούν να εγκαταστήσουν την εφαρμογή Google AI Edge Gallery (εικόνα), ενώ οι υπολογιστές απαιτούν εργαλεία όπως το LM Studio ή το Ollama. Φωτογραφία: Google .

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 4

Το LM Studio σε υπολογιστή σάς επιτρέπει να επιλέξετε και να φορτώσετε το Gemma 4 κατά την πρώτη εκτέλεση. Η έκδοση E4B έχει μέγεθος περίπου 6,3 GB και υποστηρίζει συμπερασματολογία και ανάλυση εικόνας. Το Gemma 4 E4B σε κινητό έχει μέγεθος 3,6 GB όταν λαμβάνεται χρησιμοποιώντας το Google AI Edge Gallery.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 5

Αφού ολοκληρωθεί η λήψη, ο χρήστης ανακατευθύνεται σε μια διεπαφή τύπου chatbot. Στην ενότητα επιλογής μοντέλου παρακάτω, κάντε κλικ στο Gemma 4 E4B . Στο επόμενο παράθυρο, επιλέξτε Φόρτωση μοντέλου και περιμένετε περίπου ένα λεπτό για να ξεκινήσει το μοντέλο.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 6

Όπως και άλλα δημοφιλή μοντέλα, το Gemma 4 E4B υποστηρίζει την αλληλεπίδραση στη βιετναμέζικη γλώσσα. Κατά τη δοκιμή σε Mac mini M4 (16 GB RAM) με την εντολή "Hello", το μοντέλο χρειάστηκε περίπου 8 δευτερόλεπτα για να το καταλάβει και να απαντήσει.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 7

Όταν ρωτήθηκε «Τι μπορείς να κάνεις;», η Gemma 4 E4B χρειάστηκε περίπου 13 δευτερόλεπτα για να καταλάβει και να μεταφράσει αμέσως την εντολή στα Αγγλικά, και στη συνέχεια να σημειώσει σταδιακά την απάντηση.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 8

Επειδή εκτελείται απευθείας στη συσκευή, ο χρόνος απόκρισης του μοντέλου ενδέχεται να διαφέρει ανάλογα με το υλικό. Με την ίδια ερώτηση, "Τι μπορείτε να κάνετε;", το μοντέλο χρειάστηκε περίπου 45 δευτερόλεπτα για να παρέχει μια πλήρη απόκριση σε ένα iPhone 15 Pro.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 9

Μια άλλη ερώτηση συλλογισμού που απαντήθηκε γρήγορα και με ακρίβεια ήταν, για παράδειγμα, «Ένα τρένο αναχωρεί στις 8:15 π.μ. και φτάνει στις 11:47 π.μ. Πόσο διήρκεσε το ταξίδι;». Γενικά, απλές προτάσεις συλλογισμού όπως αυτές δεν είναι πολύ περίπλοκες για τη νέα γενιά LLM.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 10

Δοκιμάστηκε με μια ερώτηση βασισμένη στη λογική, όπως "Πόσα 'r' υπάρχουν στη λέξη 'φράουλα';". Αυτή η ερώτηση είχε βάλει σε δύσκολη θέση πολλούς προηγούμενους LLM, αλλά η Gemma 4 E4B χρειάστηκε μόνο περίπου 3 δευτερόλεπτα για να απαντήσει σωστά.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 11

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 12

Με μια πιο σύνθετη ερώτηση, μετά από μια σειρά σχολαστικών συλλογισμών, η Gemma 4 απάντησε σωστά. Ο συνολικός χρόνος σκέψης ήταν 1 λεπτό και 6 δευτερόλεπτα, όχι πολύς για ένα μοντέλο εκτός σύνδεσης. Για λόγους σύγκρισης, η σκέψη στο Gemini 3 χρειάστηκε περίπου 15 δευτερόλεπτα και το GPT-5.5 χρειάστηκε παρόμοιο χρόνο.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 13

Το αποκορύφωμα του Gemma 4 E4B προέρχεται από τις πολυτροπικές του δυνατότητες, υποστηρίζοντας την εισαγωγή εικόνων. Για παράδειγμα, το LLM μπορεί να αναλύσει εικόνες και να απαντήσει σε ερωτήσεις σχετικά με ορόσημα, σημαντικές λεπτομέρειες και καιρικές και κλιματικές συνθήκες στην εικόνα.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 14

Όταν της ζητήθηκε να εξαγάγει όλο το κείμενο από μια εικόνα σελίδας περιοδικού, η Gemma 4 χρειάστηκε λίγο περισσότερο από 30 δευτερόλεπτα για να επιστρέψει το αποτέλεσμα. Αυτό το χρονικό πλαίσιο δεν διαφέρει σημαντικά από αυτό άλλων μηχανών αναζήτησης στο διαδίκτυο με τις οποίες είναι εξοικειωμένοι οι χρήστες.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 15

Στην εφαρμογή για smartphone, οι χρήστες πρέπει να επιλέξουν μια λειτουργία από την κύρια διεπαφή (AI Chat, Ask Image, κ.λπ.) και, στη συνέχεια, να επιλέξουν ένα μοντέλο που θα χρησιμοποιήσουν. Επειδή λειτουργεί με βάση την GPU, η συσκευή ενδέχεται να ζεσταθεί κατά τη διάρκεια της διαδικασίας εξαγωγής συμπερασμάτων από την AI.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 16

Οι χρήστες μπορούν επίσης να ανεβάσουν αρχεία εγγράφων, σε μορφή DOCX ή PDF, και στη συνέχεια να ζητήσουν ανάλυση ή σύνοψη κειμένου. Σύμφωνα με εκπροσώπους της Google, η νέα γενιά μοντέλων ελέγχει αποτελεσματικά τη δημιουργία συμβολοσειρών. Το μοντέλο περιορίζει τις περιττές διαδικασίες σκέψης, μειώνοντας την υπολογιστική επιβάρυνση στις κάρτες γραφικών και τη μνήμη του υπολογιστή.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 17

Το Gemma 4 είναι επίσης προγραμματιζόμενο. Σε ένα πείραμα, το μοντέλο είχε την εντολή να χρησιμοποιήσει HTML, CSS και JavaScript για να δημιουργήσει ένα λειτουργικό σύστημα που εκτελείται απευθείας στο πρόγραμμα περιήγησης. Οι χρήστες έπρεπε να αυξήσουν το μήκος περιβάλλοντος πριν από την εκκίνηση, για να διασφαλίσουν ότι το μοντέλο παρήγαγε μια ολοκληρωμένη απάντηση. Παρόλα αυτά, η τεχνητή νοημοσύνη θα μπορούσε να κάνει λάθη εάν το αρχείο HTML ήταν ελλιπές και ορισμένα στοιχεία της εφαρμογής ενδέχεται να μην λειτουργούσαν.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 18

Γενικά, οι εντολές που απαιτούν πολλαπλά βήματα ή σύνθετα δεδομένα μπορεί να είναι δύσκολες για το Gemma 4. Ορισμένες εντολές ενδέχεται να καταναλώνουν μεγάλο αριθμό διακριτικών επεξεργασίας. Ο καθορισμός υπερβολικά μεγάλων ορίων διακριτικών μπορεί να καταναλώσει πολλή μνήμη RAM ή VRAM.

Πηγή: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html