Shanghai Goku Technologies pourrait devenir le deuxième DeepSeek de Chine. Photo : Bloomberg . |
Un fonds de trading quantitatif chinois a fait la une des journaux pour avoir soumis des recherches à la principale conférence mondiale sur l'intelligence artificielle (IA). Ils y présentent une nouvelle méthode de formation de modèles capable de surpasser les techniques populaires actuelles.
Shanghai Goku Technologies, fondée en 2015, a soumis un article de recherche à la Conférence sur les systèmes de traitement de l'information neuronale (NeurIPS), un événement considéré comme les « Jeux olympiques de l'IA ». C'est également ici que se réunissent les plus grands chercheurs mondiaux dans les domaines de l'apprentissage automatique et de l'IA.
Les recherches de Goku soulignent les limites de deux méthodes de formation d'IA populaires aujourd'hui, la formation supervisée (SFT) et l'apprentissage par renforcement (RL), qui sont utilisées par des entreprises comme OpenAI et DeepSeek. Au lieu de cela, l’équipe propose une nouvelle méthode appelée SASR, qui vise à former des hybrides de manière adaptative étape par étape, inspirée de la façon dont les humains apprennent et développent leur pensée.
« Les résultats expérimentaux démontrent que le SASR surpasse les méthodes combinées de SFT, RL et d’entraînement statique », a écrit l’équipe dans l’article.
Bien que Goku n'ait pas encore répondu à une demande de commentaire, la décision de publier de nouvelles recherches et de lancer la filiale AllMind montre ses ambitions de s'étendre dans l'espace de l'IA. Selon les archives de Qcc.com, AllMind a été enregistré le jour même où Goku a annoncé ses recherches.
Wang Xiao, fondateur de Goku et représentant légal d'AllMind, a déclaré que la nouvelle société se concentrerait sur l'exploration des frontières technologiques des modèles d'intelligence artificielle, selon le China Securities Journal .
Cette évolution reflète une tendance émergente en Chine, où les entreprises d’IA commencent à créer des unités de recherche dédiées. High-Flyer, la société mère de DeepSeek, a également adopté une stratégie similaire lors de la création d'une filiale en 2023. DeepSeek est désormais l'un des noms les plus importants du monde des startups d'IA en Chine.
L'entrée de Goku dans l'arène mondiale de l'IA avec une nouvelle approche de la formation des modèles continue de montrer que la Chine pousse agressivement le développement de l'IA par le biais d'innovations algorithmiques, malgré les restrictions matérielles de Washington.
Source : https://znews.vn/sap-xuat-hien-deepseek-thu-2-post1555256.html
Comment (0)