Recientemente, Baidu Baike –el equivalente chino de Wikipedia– actualizó su archivo robots.txt (el archivo que indica a los motores de búsqueda a qué direcciones web pueden acceder) y bloqueó por completo a Googlebot y Bingbot para que no indexen contenido de la plataforma.
Foto: Shutterstock
La medida muestra que Baidu está tratando de proteger sus activos en línea en medio de la creciente demanda de big data para desarrollar modelos y aplicaciones de inteligencia artificial (IA).
Tras la actualización del archivo robots.txt de Baidu Baike, una investigación de SCMP descubrió que muchos elementos de la plataforma aún aparecían en los resultados de búsqueda de Google y Bing, posiblemente provenientes de contenido antiguo previamente archivado.
Más de dos años después de que OpenAI lanzara ChatGPT, muchos de los principales desarrolladores de IA del mundo están firmando acuerdos con editores de contenido para acceder a contenido de calidad para sus proyectos GenAI.
OpenAI firmó un acuerdo con la revista Time en junio para acceder al archivo completo de la revista de más de 100 años de historia.
Cao Phong (según SCMP)
[anuncio_2]
Fuente: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html
Kommentar (0)