![]() |
A Baidu afirma que sua IA é melhor que a ChatGPT e a Gemini. Foto: Baidu . |
No evento Baidu World 2025, a gigante chinesa Baidu anunciou seu modelo de plataforma de próxima geração, uma série de atualizações de produtos de IA e planos de expansão internacional. Entre eles, o ERNIE 5.0 é um modelo proprietário capaz de processar e criar conteúdo em múltiplos formatos, como texto, imagens, áudio e vídeo .
O grupo almeja se tornar um player global no mercado de IA cada vez mais competitivo. O ERNIE 5.0 chega poucas horas depois da OpenAI atualizar seu modelo de plataforma principal do GPT-5 para o GPT-5.1, prometendo reduzir o consumo de tokens e aprimorar a experiência de interação com mais opções humanas.
ERNIE-4.5-VL-28B-A3B-Thinking, o modelo de código aberto lançado recentemente sob a licença Apache 2.0, adequada para empresas, está disponível para acesso exclusivo de usuários por meio do site ERNIE Bot da Baidu e da API da plataforma Qianfan Cloud para clientes institucionais.
A variante do modelo é o ERNIE 5.0 Preview 1022, otimizado para tarefas com grande volume de texto, além da versão de pré-visualização geral capaz de lidar com múltiplos tipos de dados. Ademais, a Baidu também introduziu uma série de atualizações importantes para a plataforma de "humanos digitais", ferramentas sem código e agentes de IA de propósito geral.
O ERNIE 5.0 marca uma mudança na forma como a IA é implementada em larga escala, visando expandir sua presença no mercado de IA para além da China. "Internalizar a IA se tornará uma capacidade inata e transformará a IA de um custo em uma fonte de produtividade", afirmou o CEO Robin Li.
ERNIE 5.0 demonstra superioridade na compreensão de gráficos e documentos. Foto: Baidu. |
Os resultados dos testes mostram que o ERNIE 5.0 tem desempenho igual ou próximo ao dos principais modelos de plataformas ocidentais em uma ampla gama de tarefas. O ERNIE 5.0 Preview supera ou se iguala ao GPT-5-High da OpenAI e ao Gemini 2.5 Pro do Google em testes de raciocínio multimodal, compreensão de documentos e resposta a perguntas baseadas em imagens.
Ao mesmo tempo, o modelo demonstra fortes capacidades de linguagem e execução de código. A empresa enfatiza a capacidade de lidar com combinações multimodais de entrada e saída dentro do mesmo modelo, em vez de concatenar modos de dados de pós-processamento, o que a equipe considera um diferencial técnico.
Em termos de tarefas com imagens, o ERNIE 5.0 obteve as melhores pontuações no OCRBench, DocVQA e ChartQA, três benchmarks que medem o reconhecimento de documentos, a compreensão de conteúdo e o raciocínio com dados estruturados. A Baidu afirmou que o modelo superou tanto o GPT-5-High quanto o Gemini 2.5 Pro em testes envolvendo documentos e gráficos.
Na área de imagens, o ERNIE 5.0 alcançou resultados iguais ou superiores ao Google Veo3 em categorias como correspondência semântica e qualidade de imagem, de acordo com a avaliação interna do Baidu. A integração multimodal do modelo permite a geração e interpretação de conteúdo visual com um alto nível de compreensão contextual.
O ERNIE 5.0 se posiciona em um segmento e com custo equivalentes a outros modelos de ponta de concorrentes chineses, como o Alibaba. Seu preço é superior ao de seu antecessor, o ERNIE 4.5 Turbo. No entanto, em comparação com modelos americanos, o preço do chatbot ainda se encontra na faixa intermediária.
Segundo a Venturebeat, isso demonstra a estratégia da Baidu de querer separar claramente entre modelos de baixo custo que atendem a alto tráfego e modelos de alto desempenho para tarefas complexas e raciocínio multimodal.
Fonte: https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html







Comentário (0)