Ο ερευνητικός βραχίονας τεχνητής νοημοσύνης (AI) της Huawei αρνήθηκε τους ισχυρισμούς ότι μια έκδοση του μεγάλου γλωσσικού μοντέλου Pangu Pro αντέγραψε στοιχεία από ένα μοντέλο της Alibaba, επιμένοντας ότι το μοντέλο αναπτύχθηκε και εκπαιδεύτηκε ανεξάρτητα.
Το τμήμα, που ονομάζεται Noah Ark Lab, έκανε την ανακοίνωση στα τέλη της περασμένης εβδομάδας, αφότου μια οντότητα που ονομάζεται HonestAGI δημοσίευσε ένα έγγραφο στα αγγλικά στην πλατφόρμα κοινής χρήσης πηγαίου κώδικα Github, λέγοντας ότι το μοντέλο Pangu Pro Moe (Mixture of Experts) της Huawei είχε μια «ανώμαλη συσχέτιση» με το μοντέλο Qwen 2.5 14B της Alibaba.
Το άρθρο υποστηρίζει ότι αυτό δείχνει ότι το μοντέλο της Huawei δημιουργήθηκε μέσω «ανακύκλωσης» και όχι εκπαιδεύτηκε από την αρχή.
Οι παραπάνω πληροφορίες έχουν προκαλέσει εκτεταμένες συζητήσεις στην κοινότητα της Τεχνητής Νοημοσύνης και στα κινεζικά μέσα ενημέρωσης.
Σε μια δήλωση, το Noah Ark Lab ανέφερε ότι το μοντέλο «δεν βασίζεται σε πρόσθετη εκπαίδευση από μοντέλα άλλων κατασκευαστών».
Ισχυρίζονται ότι έχουν κάνει σημαντικές καινοτομίες στον αρχιτεκτονικό σχεδιασμό και τα τεχνικά χαρακτηριστικά, λέγοντας ότι αυτό είναι το πρώτο μοντέλο μεγάλης κλίμακας που κατασκευάστηκε εξ ολοκλήρου στο τσιπ Ascend της Huawei.
Το τμήμα δήλωσε επίσης ότι η ομάδα ανάπτυξής του τήρησε αυστηρά τις απαιτήσεις αδειοδότησης ανοιχτού κώδικα για οποιονδήποτε κώδικα τρίτου μέρους που χρησιμοποιήθηκε, αλλά δεν διευκρίνισε ποια μοντέλα ανοιχτού κώδικα συμβουλεύτηκε.
Η κυκλοφορία του μοντέλου ανοιχτού κώδικα R1 από την νεοσύστατη εταιρεία DeepSeek τον Ιανουάριο του 2025 σόκαρε τη Silicon Valley με το χαμηλό κόστος και την απόδοσή του συγκρίσιμη με άλλα ακριβά μοντέλα.
Ταυτόχρονα, το DeepSeek πυροδότησε επίσης έντονο ανταγωνισμό μεταξύ των τεχνολογικών γιγάντων της Κίνας για την ανάπτυξη ανταγωνιστικών προϊόντων τεχνητής νοημοσύνης.
Το Qwen 2.5-14B κυκλοφόρησε τον Μάιο του 2024 και είναι ένα από τα μικρά μοντέλα της σειράς Qwen 2.5 της Alibaba. Αυτό το μοντέλο μπορεί να αναπτυχθεί τόσο σε προσωπικούς υπολογιστές (PC) όσο και σε smartphones.
Ενώ το Qwen απευθύνεται σε ευρύ κοινό και προσφέρει παρόμοιες υπηρεσίες με το ChatGPT, τα μοντέλα Pangu της Huawei τείνουν να χρησιμοποιούνται περισσότερο σε κυβερνητικές λειτουργίες, καθώς και στον χρηματοπιστωτικό και μεταποιητικό τομέα.
Ενώ η Huawei ήταν μια από τις πρώτες εταιρείες που μπήκε στο μεγάλο παιχνίδι της μοντελοποίησης γλωσσών με την αρχική κυκλοφορία του Pangu το 2021, έκτοτε φέρεται να έχει μείνει πίσω από τους ανταγωνιστές της.
Η Huawei διέθεσε τα μοντέλα Pangu Pro Moe σε ανοιχτό κώδικα στην κινεζική πλατφόρμα προγραμματιστών GitCode στα τέλη Ιουνίου.
Στόχος είναι η προώθηση της υιοθέτησης της τεχνολογίας τεχνητής νοημοσύνης της Huawei, παρέχοντας δωρεάν πρόσβαση σε αυτά τα μοντέλα στους προγραμματιστές.
Πηγή: https://www.vietnamplus.vn/huawei-phu-nhan-sao-chep-mo-hinh-ai-cua-alibaba-post1048537.vnp






Σχόλιο (0)