Μετά την άνοδο του DeepSeek, μεγάλες κινεζικές εταιρείες τεχνολογίας έσπευσαν γρήγορα να λανσάρουν μεγάλα γλωσσικά μοντέλα (LLM) για να ανταγωνιστούν και να κερδίσουν μερίδιο αγοράς.
Η παγκόσμια τεχνολογία επιταχύνεται
Στις 29 Ιανουαρίου, την πρώτη ημέρα του Σεληνιακού Νέου Έτους 2025, ο Όμιλος Alibaba λάνσαρε μια νέα έκδοση του μοντέλου τεχνητής νοημοσύνης (AI) Qwen 2.5 και ανακοίνωσε ότι αυτό το μοντέλο είναι πιο ισχυρό από το DeepSeek. Σύμφωνα με την Alibaba, το Qwen 2.5 «ξεπερνά σχεδόν σε κάθε πτυχή» τα πιο προηγμένα μοντέλα τεχνητής νοημοσύνης από την OpenAI και την Meta (ΗΠΑ) όπως τα GPT-4o και Llama-3.1-405B.
Προηγουμένως, η DeepSeek λάνσαρε βοηθούς τεχνητής νοημοσύνης χρησιμοποιώντας τα μοντέλα DeepSeek-V3 και DeepSeek-R1 με κόστος μόνο ένα κλάσμα του κόστους των προϊόντων αμερικανικών εταιρειών.
Δύο «σεισμοί», η DeepSeek και η Alibaba, δημιούργησαν έναν αγώνα δρόμου για την αναβάθμιση της τεχνητής νοημοσύνης στην Κίνα. Αξίζει να σημειωθεί ότι το χαμηλού κόστους chatbot τεχνητής νοημοσύνης ChatGLM αναπτύχθηκε από μια ερευνητική ομάδα του Πανεπιστημίου Tsinghua και της Zhipu AI Company. Το ChatGLM είναι ένα chatbot τεχνητής νοημοσύνης ανοιχτού κώδικα ικανό να δημιουργεί κείμενο, να μεταφράζει και να απαντά σε ερωτήσεις.
Ο τεχνολογικός γίγαντας Baidu, το Ernie Bot, κυκλοφόρησε επίσης μια αναβαθμισμένη έκδοση, το Ernie 4.0 Turbo, ικανό να εκτελεί διάφορες εργασίες, όπως δημιουργία κειμένου, μετάφραση, απάντηση ερωτήσεων, δημιουργία εικόνας κ.λπ. Εν τω μεταξύ, η ByteDance - η μητρική εταιρεία του TikTok - ενημέρωσε το κορυφαίο μοντέλο τεχνητής νοημοσύνης και ανακοίνωσε ότι πέρασε το o1 του OpenAI στη δοκιμή AIME - ένα πρότυπο που μετρά την ικανότητα της τεχνητής νοημοσύνης να επεξεργάζεται και να ανταποκρίνεται σε πολύπλοκες οδηγίες.
Το DeepSeek απειλεί επίσης την παγκόσμια αγορά, αναγκάζοντας κορυφαίους τεχνολογικούς κολοσσούς όπως οι OpenAI, Meta, Google, Microsoft κ.λπ. να προσαρμόσουν τις επενδυτικές τους στρατηγικές. Οι αμερικανικές εταιρείες τεχνολογίας επένδυαν στο παρελθόν σε εργοστάσια τεχνητής νοημοσύνης και εργοστάσια δεδομένων, αλλά από τώρα και στο εξής θα πρέπει να επικεντρωθούν στη βελτίωση των αλγορίθμων για να μειώσουν το κόστος και να λειτουργούν ταχύτερα και πιο αποτελεσματικά. Πρόσφατα, η OpenAI παρουσίασε τη λειτουργία Deep Research, η οποία βοηθά το ChatGPT να συνθέτει και να ερευνά πληροφορίες. Το κύριο χαρακτηριστικό αυτής της λειτουργίας είναι η δυνατότητα εμφάνισης λεπτομερών ερευνητικών διαδικασιών, συμπεριλαμβανομένων παραπομπών και περιλήψεων των μεθόδων που χρησιμοποιούνται, διευκολύνοντας τους χρήστες να παρακολουθούν και να επαληθεύουν πληροφορίες.
Αρκετές άλλες χώρες, όπως η Ινδία, η Νότια Κορέα... συμμετέχουν επίσης στην ανάπτυξη χαμηλού κόστους chatbot τεχνητής νοημοσύνης. Για παράδειγμα, στην Ινδία, η εταιρεία Reliance Jio του δισεκατομμυριούχου Mukesh Ambani λάνσαρε το πρώτο chatbot τεχνητής νοημοσύνης που υποστηρίζει τοπικές γλώσσες, το BharatGPT. Αυτό αποτελεί ένα σημαντικό βήμα προόδου στον τομέα της τεχνητής νοημοσύνης στην Ινδία, βοηθώντας την τεχνολογία να προσεγγίσει πιο εύκολα τον μη αγγλόφωνο πληθυσμό.
Φωτογραφία διεπαφής DeepSeek και Qwen 2.5: Future/Qwen/Shutterstock
Ποιες ευκαιρίες υπάρχουν για το Βιετνάμ;
Ο κ. Lu Vincent The Hung - ιδρυτής και διευθύνων σύμβουλος της EduX Global Institute Joint Stock Company - δήλωσε ότι στο παρελθόν, η βιομηχανία τεχνολογίας συχνά ανακοίνωνε το κόστος κατασκευής μοντέλων Τεχνητής Νοημοσύνης να φτάνει τα δισεκατομμύρια δολάρια ΗΠΑ. Ωστόσο, η κυκλοφορία του R1 από την νεοσύστατη τεχνολογική εταιρεία DeepSeek με κόστος μόνο 6 εκατομμύρια δολάρια ΗΠΑ - εάν αληθεύει - θα μπορούσε να αποτελέσει την κινητήρια δύναμη για τις χώρες και τις νεοσύστατες επιχειρήσεις να αναπτύξουν τη δική τους Τεχνητή Νοημοσύνη με υψηλή απόδοση και χαμηλό κόστος. Από εκεί και πέρα, οι επιχειρήσεις, ιδίως οι μικρές και μεσαίες, μπορούν να έχουν πρόσβαση και να εφαρμόζουν την Τεχνητή Νοημοσύνη χωρίς να επενδύσουν υπερβολικό αρχικό κόστος· να προωθήσουν τον ψηφιακό μετασχηματισμό στους τομείς της παραγωγής, του εμπορίου, των υπηρεσιών, της εκπαίδευσης ...
Ωστόσο, το νεοσύστατο μοντέλο R1 της DeepSeek έχει αντιμετωπίσει πολλές αντιπαραθέσεις σχετικά με την ασφάλεια των δεδομένων και την αντιγραφή μοντέλων τεχνητής νοημοσύνης άλλων εταιρειών τεχνολογίας. Επομένως, προκειμένου να δημιουργήσουν τα δικά τους μοντέλα τεχνητής νοημοσύνης με χαμηλό κόστος, οι χώρες και οι επιχειρήσεις πρέπει να κατανοήσουν προσεκτικά τις αρχές λειτουργίας, τους αλγόριθμους, τον πηγαίο κώδικα κ.λπ., αντί να αντιγράφουν ή να κλέβουν. «Ένα επιτυχημένο μοντέλο τεχνητής νοημοσύνης δεν αφορά μόνο την ικανότητα επεξεργασίας αλλά και το κόστος. Οι βιετναμέζικες επιχειρήσεις θα πρέπει να ακολουθήσουν την κατεύθυνση της δημιουργίας λύσεων που μπορούν να επεκταθούν και να προσαρμοστούν σύμφωνα με τις απαιτήσεις πολλών διαφορετικών βιομηχανιών» - πρότεινε ο κ. Hung.
Σύμφωνα με τον κ. Phan Tan Quoc - Αναπληρωτή Διευθυντή του Προγράμματος Καινοτομίας της KPMG Βιετνάμ, ο έντονος ανταγωνισμός στην αγορά Τεχνητής Νοημοσύνης θα αποτελέσει τόσο πίεση όσο και κίνητρο για τις βιετναμέζικες επιχειρήσεις να δημιουργήσουν γρήγορα χρήσιμα και αναγνωρισμένου κύρους μοντέλα για την εξυπηρέτηση των εγχώριων χρηστών και πελατών. Ο κ. Quoc συνιστά στην κυβέρνηση να θεσπίσει πολιτικές που να ενθαρρύνουν τις επιχειρήσεις και τα άτομα να συμμετέχουν στην ανάπτυξη και τη δημιουργία βάσεων δεδομένων Τεχνητής Νοημοσύνης· ταυτόχρονα, να υποστηρίξει τις επενδύσεις σε ερευνητικά κέντρα Τεχνητής Νοημοσύνης.
«Η τάση της κοινής χρήσης ανοιχτού κώδικα στην κοινότητα της Τεχνητής Νοημοσύνης μπορεί να βοηθήσει τους προγραμματιστές να αξιοποιήσουν και να βελτιώσουν το μοντέλο. Στο μέλλον, πολλές νεοσύστατες επιχειρήσεις και ιδιώτες θα έχουν εύκολη πρόσβαση και θα εφαρμόζουν την Τεχνητή Νοημοσύνη στις δραστηριότητές τους, όταν εμφανιστούν πολλά νέα μοντέλα Τεχνητής Νοημοσύνης, καλύπτοντας συγκεκριμένες ανάγκες», δήλωσε ο κ. Quoc.
Σύμφωνα με τους ειδικούς, κατά την ανάπτυξη Τεχνητής Νοημοσύνης, οι επιχειρήσεις πρέπει να προσδιορίσουν με σαφήνεια εάν το μοντέλο μπορεί να λύσει ένα συγκεκριμένο πρόβλημα, να προσφέρει πραγματική αξία στους χρήστες και να έχει διαφορές σε χαρακτηριστικά ή εξαιρετικά σημεία. Το μοντέλο της DeepSeek αποτελεί μάθημα για τις παγκόσμιες εταιρείες τεχνολογίας με αυτοδηλούμενα κόστη σε εξαιρετικά χαμηλά επίπεδα, αλλά η απόδοση λέγεται ότι υπερβαίνει το ChatGPT. Στη συνέχεια, είναι απαραίτητο να κατανοηθεί σαφώς η ζήτηση για Τεχνητή Νοημοσύνη στην αγορά, ώστε να διασφαλιστεί ότι η Τεχνητή Νοημοσύνη είναι αρκετά ανταγωνιστική και μπορεί να είναι κερδοφόρα.
Είναι το DeepSeek όντως φθηνό;
Στην έκθεσή της, η DeepSeek ανέφερε ότι το συνολικό κόστος εκπαίδευσης του μοντέλου τεχνητής νοημοσύνης ήταν λιγότερο από 6 εκατομμύρια δολάρια, κυρίως λόγω της ενοικίασης μονάδων επεξεργασίας γραφικών από την NVIDIA. Ωστόσο, πρόσφατα, η εταιρεία έρευνας και συμβουλευτικής ημιαγωγών SemiAnalysis υπολόγισε ότι το κόστος ανάπτυξης του DeepSeek είναι πολύ υψηλότερο από το δηλωμένο.
Το DeepSeek εκτιμάται ότι θα λειτουργήσει ένα τεράστιο υπολογιστικό σύστημα περίπου 50.000 GPU Hopper, με 10.000 GPU H800 και 10.000 πιο ισχυρές GPU H100, μαζί με επιπλέον GPU H20. Η συνολική κεφαλαιουχική δαπάνη για τους διακομιστές εκτιμάται σε περίπου 1,6 δισεκατομμύρια δολάρια και το λειτουργικό κόστος είναι περίπου 944 εκατομμύρια δολάρια.
Πηγή: https://nld.com.vn/co-hoi-tu-nhung-con-dia-chan-ai-196250204200528423.htm
Σχόλιο (0)