Нещодавно Baidu Baike – китайський аналог Вікіпедії – оновив свій файл robots.txt, який вказує пошуковим системам, до яких веб-адрес вони можуть отримати доступ, і повністю заблокував Googlebot та Bingbot від індексації контенту зі своєї платформи.
Фото: Шуттерсток
Цей крок демонструє зусилля Baidu щодо захисту своїх онлайн-активів на тлі зростаючого попиту на великі дані для розробки моделей та додатків штучного інтелекту (ШІ).
Після оновлення robots.txt від Baidu Baike, опитування SCMP показало, що багато записів із платформи досі з’являються в результатах пошуку Google та Bing, можливо, з раніше архівованого контенту.
Більш ніж через два роки після запуску ChatGPT OpenAI, багато провідних світових розробників штучного інтелекту підписують угоди з видавцями контенту для доступу до якісного контенту для своїх проектів GenAI.
У червні OpenAI підписала угоду з журналом Time про доступ до всього його архіву, що охоплює понад 100 років.
Цао Фонг (за даними SCMP)
Джерело: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html






Коментар (0)