Di recente, Baidu Baike, l'equivalente cinese di Wikipedia, ha aggiornato il suo file robots.txt, che indica ai motori di ricerca a quali indirizzi web possono accedere, e ha bloccato completamente l'indicizzazione dei contenuti della sua piattaforma da parte di Googlebot e Bingbot.
Foto: Shutterstock
Questa mossa dimostra l'impegno di Baidu nel proteggere le proprie risorse online in un contesto di crescente domanda di big data per lo sviluppo di modelli e applicazioni di intelligenza artificiale (IA).
In seguito all'aggiornamento del file robots.txt di Baidu Baike, un'indagine del South China Morning Post ha rivelato che molti contenuti della piattaforma compaiono ancora nei risultati di ricerca di Google e Bing, probabilmente provenienti da archivi precedenti.
A più di due anni dal lancio di ChatGPT da parte di OpenAI, molti dei principali sviluppatori di intelligenza artificiale a livello mondiale stanno stipulando accordi con editori di contenuti per accedere a contenuti di qualità per i loro progetti di intelligenza artificiale generale.
A giugno OpenAI ha firmato un accordo con la rivista Time per accedere al suo intero archivio, che copre oltre 100 anni.
Cao Phong (secondo il South China Morning Post)
Fonte: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html








Commento (0)