O braço de pesquisa de inteligência artificial (IA) da Huawei negou as alegações de que uma versão de seu grande modelo de linguagem, Pangu Pro, copiou elementos de um modelo do Alibaba, insistindo que o modelo foi desenvolvido e treinado de forma independente.
A divisão, chamada Noah Ark Lab, fez o anúncio no final da semana passada, depois que uma entidade chamada HonestAGI publicou um artigo em inglês na plataforma de compartilhamento de código-fonte Github, dizendo que o modelo Pangu Pro Moe (Mixture of Experts) da Huawei tinha uma "correlação anormal" com o modelo Qwen 2.5 14B da Alibaba.
O artigo argumenta que isso mostra que o modelo da Huawei foi criado por meio de “upcycling” e não treinado do zero.
As informações acima causaram amplas discussões na comunidade de IA e na mídia chinesa.
Em um comunicado, o Noah Ark Lab disse que o modelo "não depende de treinamento adicional de modelos de outros fabricantes".
Eles afirmam ter feito inovações significativas em design arquitetônico e recursos técnicos, dizendo que este é o primeiro modelo em larga escala construído inteiramente no chip Ascend da Huawei.
A divisão também disse que sua equipe de desenvolvimento aderiu rigorosamente aos requisitos de licenciamento de código aberto para qualquer código de terceiros usado, mas não especificou quais modelos de código aberto consultou.
O lançamento do modelo de código aberto R1 pela startup DeepSeek em janeiro de 2025 chocou o Vale do Silício com seu baixo custo e desempenho comparável a outros modelos caros.
Ao mesmo tempo, o DeepSeek também gerou uma competição acirrada entre os gigantes da tecnologia da China para desenvolver produtos de IA com preços competitivos.
O Qwen 2.5-14B foi lançado em maio de 2024 e é um dos modelos menores da série Qwen 2.5 da Alibaba. Este modelo pode ser usado tanto em computadores pessoais (PCs) quanto em smartphones.
Enquanto o Qwen é voltado para consumidores comuns e tem serviços semelhantes ao ChatGPT, os modelos Pangu da Huawei tendem a ser mais usados em operações governamentais , bem como nos setores financeiro e de manufatura.
Embora a Huawei tenha sido uma das primeiras a entrar no grande jogo da modelagem de linguagem com o lançamento inicial do Pangu em 2021, desde então ela ficou atrás de seus rivais.
A Huawei disponibilizou seus modelos Pangu Pro Moe de código aberto na plataforma de desenvolvimento chinesa GitCode no final de junho.
O objetivo é promover a adoção da tecnologia de IA da Huawei, fornecendo acesso gratuito a esses modelos aos desenvolvedores./.
Fonte: https://www.vietnamplus.vn/huawei-phu-nhan-sao-chep-mo-hinh-ai-cua-alibaba-post1048537.vnp






Comentário (0)