Recentemente, o Baidu Baike — o equivalente chinês da Wikipédia — atualizou seu arquivo robots.txt — o arquivo que instrui os mecanismos de busca sobre quais endereços da web eles podem acessar — e bloqueou completamente o Googlebot e o Bingbot de indexar conteúdo da plataforma.
Foto: Shutterstock
A mudança mostra que a Baidu está tentando proteger seus ativos online em meio à crescente demanda por big data para desenvolver modelos e aplicativos de inteligência artificial (IA).
Após a atualização do robots.txt do Baidu Baike, uma investigação do SCMP descobriu que muitos itens da plataforma ainda apareciam nos resultados de pesquisa do Google e do Bing, possivelmente de conteúdo antigo arquivado anteriormente.
Mais de dois anos após a OpenAI lançar o ChatGPT, muitos dos principais desenvolvedores de IA do mundo estão assinando acordos com editores de conteúdo para acessar conteúdo de qualidade para seus projetos GenAI.
A OpenAI assinou um acordo com a revista Time em junho para acessar todo o arquivo da revista com mais de 100 anos de história.
Cao Phong (de acordo com o SCMP)
[anúncio_2]
Fonte: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html
Comentário (0)