Нещодавно Baidu Baike — китайськомовний сервіс, схожий на Вікіпедію, — оновив свій файл robots.txt — файл, який вказує пошуковим системам, до яких веб-адрес вони можуть отримати доступ, — і повністю заблокував Googlebot та Bingbot від індексації контенту з платформи.
Фото: Шуттерсток
Цей крок демонструє зусилля Baidu щодо захисту своїх онлайн-активів на тлі зростаючого попиту на великі дані для розробки моделей та додатків штучного інтелекту (ШІ).
Після оновлення robots.txt компанією Baidu Baike, розслідування SCMP виявило, що багато елементів із платформи все ще відображаються в результатах пошуку Google та Bing, ймовірно, з раніше архівованого старого контенту.
Більш ніж через два роки після запуску ChatGPT у OpenAI багато провідних світових розробників штучного інтелекту підписують угоди з видавцями контенту, щоб отримати доступ до якісного контенту для своїх проектів GenAI.
У червні OpenAI підписала угоду з журналом Time на доступ до всього архіву журналу, що містить понад 100 років історії.
Цао Фонг (за даними SCMP)
Джерело: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html
Коментар (0)