Ο ιδρυτής του Facebook δημιουργεί νέο μοντέλο τεχνητής νοημοσύνης.

Η μητρική εταιρεία του Facebook μόλις ανακοίνωσε δύο νέα μοντέλα στη συλλογή Llama 4. Αυτά είναι τα ίδια μοντέλα που χρησιμοποιούνται αυτήν τη στιγμή για τον βοηθό Meta AI στο διαδίκτυο, καθώς και στο WhatsApp, το Messenger και το Instagram, βοηθώντας τους ανθρώπους να δημιουργούν πιο εξατομικευμένες εμπειρίες πολυμέσων.

Δύο νέα μοντέλα, που είναι πλέον διαθέσιμα για λήψη από το Meta ή το Hugging Face, είναι το Llama 4 Scout και το Llama 4 Maverick. Η Meta αναφέρει ότι βρίσκεται ακόμη στη διαδικασία εκπαίδευσης του Llama 4 Behemoth, του τεράστιου μοντέλου που ο Διευθύνων Σύμβουλος Mark Zuckerberg αποκαλεί « το μοντέλο πλατφόρμας με την υψηλότερη απόδοση στον κόσμο ».

Σύμφωνα με τον Meta, το Llama 4 Scout έχει ένα παράθυρο περιβάλλοντος έως και 10 εκατομμυρίων tokens, πολλές φορές περισσότερο από το μοντέλο με τον μεγαλύτερο αριθμό tokens αυτήν τη στιγμή, το Gemini. Αυτός ο αριθμός αντιπροσωπεύει τη μνήμη εργασίας ενός μοντέλου AI.

Ο Meta περιγράφει το μοντέλο ως ανώτερο από τα Gemma 3 και Gemini 2.0 Flash-Lite της Google, καθώς και από το Mistral 3.1, «σε μια σειρά από ευρέως δημοσιευμένα benchmarks», ενώ παράλληλα μπορεί να «τρέξει σε μία μόνο GPU Nvidia H100».

Για το Llama 4 Maverick, η εταιρεία έκανε παρόμοιους ισχυρισμούς απόδοσης όταν το συνέκρινε με το GPT-4o της OpenAI και το Gemini 2.0 Flash της Google. Οι εργασίες προγραμματισμού και συμπερασμάτων του Maverick είναι συγκρίσιμες με το DeepSeek-V3, παρόλο που χρησιμοποιεί μόνο λιγότερες από τις μισές παραμέτρους.

Φιγούρες για τα νέα μοντέλα της συλλογής Llama 4. Φωτογραφία: Meta.

Εν τω μεταξύ, η Behemoth διαθέτει 288 δισεκατομμύρια ενεργές παραμέτρους από συνολικά 2 τρισεκατομμύρια. Αν και δεν έχει ακόμη δημοσιευτεί, η Meta δηλώνει ότι η Behemoth έχει τη δυνατότητα να ξεπεράσει τους ανταγωνιστές της (συγκεκριμένα τα GPT-4.5 και Claude Sonnet 3.7) «σε αρκετές μετρήσεις STEM».

Η Meta ανακοίνωσε ότι έχει μεταβεί σε μια αρχιτεκτονική «μείγματος ειδικών» (MoE), την ίδια αρχιτεκτονική που έκανε το DeepSeek τόσο επιτυχημένο. Αυτή η προσέγγιση εξοικονομεί πόρους ενεργοποιώντας μόνο τα μέρη του μοντέλου που είναι απαραίτητα για κάθε συγκεκριμένη εργασία. Περισσότερες λεπτομέρειες σχετικά με το σχέδιο προϊόντος θα ανακοινωθούν στο συνέδριο LlamaCon στις 29 Απριλίου.

Παρά την κριτική σχετικά με τους περιορισμούς αδειοδότησης, η Meta συνεχίζει να χαρακτηρίζει το Llama 4 ως «ανοιχτού κώδικα», όπως και τα προηγούμενα μοντέλα της. Για παράδειγμα, η άδεια χρήσης του Llama 4 απαιτεί από τους εμπορικούς οργανισμούς με περισσότερους από 700 εκατομμύρια μηνιαίους ενεργούς χρήστες να λάβουν άδεια από τη Meta πριν από τη χρήση του μοντέλου.

Σύμφωνα με την Πρωτοβουλία Ανοικτού Κώδικα το 2023, τέτοιοι κανονισμοί «έχουν καταστήσει το μοντέλο πλέον μη ταξινομημένο ως ανοιχτού κώδικα».

Πηγή: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html