Recentemente, o Baidu Baike – o equivalente chinês da Wikipédia – atualizou seu arquivo robots.txt – o arquivo que instrui os mecanismos de busca sobre quais endereços da web eles podem acessar – e bloqueou completamente o Googlebot e o Bingbot de indexarem conteúdo da plataforma.
Foto: Shutterstock
Essa medida demonstra que a Baidu está tentando proteger seus ativos online em meio à crescente demanda por big data para desenvolver modelos e aplicações de inteligência artificial (IA).
Após a atualização do arquivo robots.txt do Baidu Baike, uma investigação do SCMP descobriu que muitos itens da plataforma ainda apareciam nos resultados de busca do Google e do Bing, possivelmente devido a conteúdo antigo arquivado anteriormente.
Mais de dois anos após o lançamento do ChatGPT pela OpenAI, muitos dos principais desenvolvedores de IA do mundo estão fechando acordos com editores de conteúdo para acessar conteúdo de qualidade para seus projetos GenAI.
Em junho, a OpenAI firmou um acordo com a revista Time para ter acesso a todo o arquivo da publicação, que abrange mais de 100 anos de história.
Cao Phong (de acordo com o SCMP)
Fonte: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html






Comentário (0)