Нещодавно Baidu Baike – китайський аналог Вікіпедії – оновив свій файл robots.txt – файл, який вказує пошуковим системам, до яких веб-адрес вони можуть отримати доступ – і повністю заблокував Googlebot та Bingbot від індексації контенту з платформи.
Фото: Шуттерсток
Цей крок показує, що Baidu намагається захистити свої онлайн-активи на тлі зростаючого попиту на великі дані для розробки моделей та додатків штучного інтелекту (ШІ).
Після оновлення robots.txt компанією Baidu Baike, розслідування SCMP виявило, що багато елементів із платформи досі відображаються в результатах пошуку Google та Bing, можливо, з раніше архівованого старого контенту.
Більш ніж через два роки після запуску ChatGPT у OpenAI багато провідних світових розробників штучного інтелекту підписують угоди з видавцями контенту, щоб отримати доступ до якісного контенту для своїх проектів GenAI.
У червні OpenAI підписала угоду з журналом Time на доступ до всього архіву журналу, що містить понад 100 років історії.
Цао Фонг (за даними SCMP)
Джерело: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html






Коментар (0)