Shanghai Goku Technologies pourrait devenir le deuxième DeepSeek de Chine. Photo : Bloomberg . |
Un fonds de trading quantitatif chinois a fait la une des journaux après avoir soumis un article à la principale conférence mondiale sur l'intelligence artificielle (IA), dans lequel il a présenté une nouvelle méthode de formation de modèles qui, selon lui, peut surpasser les techniques populaires actuelles.
Shanghai Goku Technologies, fondée en 2015, a soumis un article à la Conférence sur les systèmes de traitement de l'information neuronale (NeurIPS), un événement connu sous le nom de « Jeux olympiques de l'IA » et un lieu de rassemblement pour les plus grands chercheurs du monde dans les domaines de l'apprentissage automatique et de l'IA.
Les recherches de Goku mettent en évidence les limites de deux méthodes populaires d'entraînement de l'IA : l'entraînement supervisé (SFT) et l'apprentissage par renforcement (RL), utilisées par des entreprises comme OpenAI et DeepSeek. L'équipe propose donc une nouvelle méthode, appelée SASR, qui vise à fournir un entraînement hybride adaptatif étape par étape, inspiré de la façon dont les humains apprennent et développent leur pensée.
« Les résultats expérimentaux démontrent que le SASR surpasse les méthodes combinées de SFT, RL et d’entraînement statique », a écrit l’équipe dans l’article.
Bien que Goku n'ait pas répondu à une demande de commentaire, l'annonce de cette nouvelle étude et le lancement de sa filiale AllMind témoignent de ses ambitions d'expansion dans le domaine de l'IA. Selon les informations de Qcc.com, AllMind a été enregistrée le jour même de la publication de l'étude par Goku.
Wang Xiao, fondateur de Goku et représentant légal d'AllMind, a déclaré que la nouvelle société se concentrerait sur l'exploration des frontières technologiques des modèles d'intelligence artificielle, selon le China Securities Journal .
Cette évolution reflète une tendance émergente en Chine, où les entreprises d'IA commencent à créer des unités de recherche dédiées. High-Flyer, la société mère de DeepSeek, a suivi une stratégie similaire en créant une filiale en 2023. DeepSeek est aujourd'hui l'un des noms les plus en vue du secteur des startups chinoises spécialisées dans l'IA.
L'entrée de Goku dans l'arène mondiale de l'IA avec une nouvelle approche de la formation des modèles continue de montrer que la Chine pousse agressivement le développement de l'IA par le biais d'innovations algorithmiques, malgré les restrictions matérielles de Washington.
Source : https://znews.vn/sap-xuat-hien-deepseek-thu-2-post1555256.html
Comment (0)