La división de investigación de inteligencia artificial (IA) de Huawei ha rechazado las acusaciones de que una versión de su modelo de lenguaje grande Pangu Pro copió elementos de un modelo de Alibaba, afirmando que el modelo fue desarrollado y entrenado de forma independiente.
El departamento, llamado Noah Ark Lab, emitió la declaración el fin de semana pasado después de que una entidad llamada HonestAGI publicara un artículo en inglés en la plataforma de intercambio de código fuente Github, afirmando que el modelo Pangu Pro Moe (Mezcla de expertos) de Huawei tenía una "correlación inusual" con el modelo Qwen 2.5 14B de Alibaba.
El artículo sugiere que esto indica que el modelo de Huawei se creó a través de “reciclaje” y no a través de una capacitación inicial.
Esta información ha provocado un amplio debate dentro de la comunidad de IA y en los medios de comunicación chinos.
En un comunicado, Noah Ark Lab dijo que el modelo "no se basa en entrenamiento adicional de modelos de otros fabricantes".
Afirmaron haber realizado innovaciones significativas en diseño arquitectónico y características técnicas, afirmando que este es el primer modelo a gran escala construido completamente con el chip Ascend de Huawei.
El departamento también afirmó que su equipo de desarrollo se adhirió estrictamente a los requisitos de licencia de código abierto para cualquier código de terceros utilizado, pero no especificó a qué modelos de código abierto hicieron referencia.
El lanzamiento del modelo de código abierto R1 por la startup DeepSeek en enero de 2025 ha sacudido a Silicon Valley por su bajo coste y un rendimiento comparable a otros modelos más caros.
Al mismo tiempo, DeepSeek también provocó una feroz competencia entre los gigantes tecnológicos chinos para desarrollar productos de IA competitivos.
El Qwen 2.5-14B, lanzado en mayo de 2024, es uno de los modelos más pequeños de la serie Qwen 2.5 de Alibaba. Este modelo es compatible tanto con ordenadores personales (PC) como con smartphones.
Si bien Qwen apunta al mercado de consumo general y ofrece servicios similares a ChatGPT, los modelos Pangu de Huawei tienden a usarse más en operaciones gubernamentales , así como en los sectores financiero y manufacturero.
Si bien Huawei fue uno de los primeros en ingresar al principal campo del modelado de lenguajes con el lanzamiento inicial de Pangu en 2021, desde entonces se informa que la empresa se ha quedado atrás de sus competidores.
Huawei publicó el código fuente abierto de sus modelos Pangu Pro Moe en la plataforma de desarrolladores china GitCode a fines de junio.
El objetivo es promover la adopción de la tecnología de inteligencia artificial de Huawei proporcionando acceso gratuito a estos modelos para los desarrolladores.
Fuente: https://www.vietnamplus.vn/huawei-phu-nhan-sao-chep-mo-hinh-ai-cua-alibaba-post1048537.vnp






Kommentar (0)