Onlangs heeft Baidu Baike – de Chinese tegenhanger van Wikipedia – zijn robots.txt-bestand bijgewerkt. Dit bestand geeft zoekmachines instructies over welke webadressen ze mogen bezoeken. Daarmee heeft Baidu Baike Googlebot en Bingbot volledig geblokkeerd voor het indexeren van content van het platform.
Foto: Shutterstock
Deze stap toont aan dat Baidu ernaar streeft zijn online activa te beschermen tegen de groeiende vraag naar big data voor de ontwikkeling van kunstmatige intelligentie (AI)-modellen en -toepassingen.
Na de update van het robots.txt-bestand van Baidu Baike bleek uit een onderzoek van SCMP dat veel vermeldingen van het platform nog steeds in de zoekresultaten van Google en Bing verschijnen, mogelijk vanwege eerder gearchiveerde content.
Ruim twee jaar nadat OpenAI ChatGPT lanceerde, sluiten veel van 's werelds grootste AI-ontwikkelaars overeenkomsten met contentuitgevers om toegang te krijgen tot kwalitatief hoogwaardige content voor hun GenAI-projecten.
OpenAI heeft in juni een overeenkomst gesloten met Time magazine om toegang te krijgen tot het volledige archief van het tijdschrift, dat meer dan 100 jaar omvat.
Cao Phong (volgens SCMP)
Bron: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html






Reactie (0)