Η DeepSeek αναφέρει ότι αναζητά υποψηφίους ικανούς να δημιουργήσουν «εμπειρίες έξυπνων προϊόντων επόμενης γενιάς» βασισμένες στην τεχνολογία μοντελοποίησης μεγάλων γλωσσών. Φωτογραφία: Shutterstock . |
Η κινεζική startup τεχνητής νοημοσύνης DeepSeek ξεκίνησε μια μαζική εκστρατεία προσλήψεων για θέσεις «προϊόντων και σχεδιασμού» στο Πεκίνο και τη Χανγκτζόου, σύμφωνα με την SCMP . Αυτή η είδηση έχει πυροδοτήσει εικασίες σχετικά με ένα νέο μοντέλο τεχνητής νοημοσύνης που η εταιρεία έχει κρατήσει εντελώς μυστικό μέχρι τώρα.
Σε μια αγγελία θέσης εργασίας στις 23 Απριλίου (τοπική ώρα) στον επίσημο λογαριασμό της στο WeChat, η DeepSeek δήλωσε ότι αναζητά υποψηφίους ικανούς να δημιουργήσουν «εμπειρίες έξυπνων προϊόντων επόμενης γενιάς» βασισμένες στην τεχνολογία Big Language Modeling (LLM). Αυτή είναι η θεμελιώδης τεχνολογία πίσω από υπηρεσίες δημιουργίας τεχνητής νοημοσύνης, όπως το ChatGPT και η ομώνυμη εφαρμογή chatbot της DeepSeek.
Για πρώτη φορά από την ίδρυσή της, η DeepSeek ανακοίνωσε θέσεις εργασίας για θέσεις σχετικές με προϊόντα, όπως product manager, product designer και visual designer. Προηγουμένως, η εταιρεία με έδρα το Χανγκτζόου επικεντρώνονταν κυρίως στην έρευνα μοντέλων πλατφόρμας στον τομέα της Τεχνητής Νοημοσύνης.
Οι αναλυτές βλέπουν αυτήν την κίνηση προσλήψεων ως ένδειξη ότι η DeepSeek μετασχηματίζεται σε μια ολοκληρωμένη επιχείρηση. Εκτός από τις θέσεις προϊόντων και σχεδιασμού, η εταιρεία προσλαμβάνει επίσης έναν Οικονομικό Διευθυντή (CFO) και έναν Λειτουργικό Διευθυντή (COO), μαζί με τέσσερις ακόμη θέσεις έρευνας και μηχανικής, σύμφωνα με τη σελίδα προσλήψεων της DeepSeek.
Παρά το γεγονός ότι προσέλκυσε ευρεία προσοχή από το κοινό και τους επενδυτές, το DeepSeek παραμένει πολύ μυστικοπαθές. Από την κυκλοφορία του, η δημόσια αλληλεπίδρασή του περιορίστηκε σε λίγες ενημερώσεις προϊόντων και δημοσιεύσεις επιστημονικής έρευνας. Η πιο πρόσφατη αναβάθμιση της εταιρείας στο μοντέλο LLM κυκλοφόρησε σχεδόν πριν από ένα μήνα, όταν η DeepSeek ανακοίνωσε βελτιώσεις στην απόδοση του μοντέλου ανοιχτού κώδικα V3.
Σύμφωνα με το Reuters , η DeepSeek ενδέχεται να λανσάρει το νέο της μοντέλο συλλογισμού R2 στις αρχές του επόμενου μήνα. Ωστόσο, η εταιρεία δεν έχει ακόμη κάνει καμία επίσημη ανακοίνωση σχετικά με την ημερομηνία κυκλοφορίας ή το χρονοδιάγραμμα για αυτό το μοντέλο.
Το DeepSeek άρχισε να προσελκύει την παγκόσμια προσοχή από τα τέλη Δεκεμβρίου 2024 έως τον Ιανουάριο του 2025 χάρη στις διαδοχικές κυκλοφορίες δύο προηγμένων μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα, V3 και R1. Και τα δύο μοντέλα αναπτύχθηκαν με κόστος και υπολογιστικές απαιτήσεις που αποτελούν μόνο ένα κλάσμα αυτού που χρειάζονται οι μεγάλες εταιρείες τεχνολογίας για τα έργα LLM τους. Οι ανακοινώσεις του DeepSeek προκάλεσαν αναταραχή τόσο στη Wall Street όσο και στη Silicon Valley.
Λίγο αργότερα, ορισμένες εταιρείες τεχνολογίας στην Κίνα ανέπτυξαν γρήγορα προϊόντα βασισμένα στα μοντέλα ανοιχτού κώδικα της DeepSeek, ειδικά το R1 - το μοντέλο που ανακοινώθηκε τον Ιανουάριο.
Τον περασμένο μήνα, ο Lee Kai-fu, ιδρυτής και διευθύνων σύμβουλος της νεοσύστατης εταιρείας 01.AI, δήλωσε ότι η εταιρεία του αξιοποιεί την τεχνολογία της DeepSeek για να παρέχει λύσεις τεχνητής νοημοσύνης σε εταιρικούς πελάτες, ιδίως στους τομείς των χρηματοοικονομικών, των τυχερών παιχνιδιών και της νομικής. Η 01.AI έχει επίσης σταματήσει να αναπτύσσει το δικό της μοντέλο τεχνητής νοημοσύνης.
Αυτή τη στιγμή, ερευνητές, επενδυτές και το ευρύ κοινό παρακολουθούν στενά πώς το DeepSeek συνεχίζει να σημειώνει σημαντικές ανακαλύψεις εν μέσω της αυστηροποίησης της απαγόρευσης εξαγωγών των προηγμένων τσιπ τεχνητής νοημοσύνης της Nvidia στην Κίνα από τις ΗΠΑ.
Την περασμένη εβδομάδα, σύμφωνα με τους Financial Times , ο Διευθύνων Σύμβουλος της Nvidia, Jensen Huang, συναντήθηκε με τον ιδρυτή της DeepSeek, Liang Wenfeng, κατά τη διάρκεια επίσκεψης στην Κίνα. Ωστόσο, ούτε η Nvidia ούτε η DeepSeek έχουν επιβεβαιώσει εάν η συνάντηση αυτή έλαβε χώρα πράγματι.
Πηγή: https://znews.vn/deepseek-tuyen-dung-gap-post1548748.html






Σχόλιο (0)