Kürzlich aktualisierte Baidu Baike – das chinesische Pendant zu Wikipedia – seine robots.txt-Datei, die Suchmaschinen anweist, auf welche Webadressen sie zugreifen dürfen, und blockierte Googlebot und Bingbot vollständig bei der Indexierung von Inhalten seiner Plattform.
Foto: Shutterstock
Dieser Schritt verdeutlicht Baidus Bemühungen, seine Online-Ressourcen angesichts der wachsenden Nachfrage nach Big Data für die Entwicklung von Modellen und Anwendungen der künstlichen Intelligenz (KI) zu schützen.
Nach der Aktualisierung der robots.txt-Datei von Baidu Baike ergab eine Untersuchung der SCMP, dass viele Einträge der Plattform immer noch in den Suchergebnissen von Google und Bing erscheinen, möglicherweise aufgrund zuvor archivierter Inhalte.
Mehr als zwei Jahre nach dem Start von ChatGPT durch OpenAI schließen viele der weltweit führenden KI-Entwickler Verträge mit Content-Anbietern ab, um Zugang zu qualitativ hochwertigen Inhalten für ihre GenAI-Projekte zu erhalten.
OpenAI hat im Juni eine Vereinbarung mit dem Time Magazine unterzeichnet, um Zugang zu dessen gesamtem, über 100 Jahre umfassenden Archiv zu erhalten.
Cao Phong (laut SCMP)
Quelle: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html







Kommentar (0)