Vietnam.vn - Nền tảng quảng bá Việt Nam

Reddit, AI가 콘텐츠를 훔치는 것을 방지하기 위해 프로토콜 업데이트

Công LuậnCông Luận26/06/2024

[광고_1]

인공지능 회사들이 AI를 훈련시키기 위해 출판사로부터 콘텐츠를 훔치거나 저작권이 있는 기사를 포함한 정보를 요약하여 비용을 지불하거나 허가를 요청하지 않고 사용자에게 응답한다는 비난을 받고 있는 가운데 이러한 조치가 나왔습니다.

레딧 업데이트 프로토콜 단축 코드 AI 캡 콘텐츠 이미지 1

사진: 로이터

Reddit은 웹사이트의 어떤 부분을 크롤링할 것인지 정의하는 널리 받아들여진 표준인 로봇 배제 프로토콜(robots.txt)을 업데이트할 것이라고 밝혔습니다.

또한 이 회사는 특정 엔터티의 요청 수를 제어하는 ​​데 사용되는 기술인 속도 제한을 유지하고, 알 수 없는 봇과 크롤러가 자사 사이트에서 데이터를 수집하는 것을 차단할 것이라고 밝혔습니다.

Robots.txt는 언론사를 포함한 출판사가 기술 회사가 AI를 훈련시키거나 특정 검색 질의에 답하는 요약을 작성하기 위해 불법적으로 콘텐츠를 스크래핑하는 것을 방지하는 데 사용하는 중요한 도구입니다.

지난주, 콘텐츠 라이선싱 스타트업 TollBit은 보고서를 통해 일부 AI 회사가 규칙을 우회하여 게시자 웹사이트의 콘텐츠를 스크래핑하고 있다고 밝혔습니다.

Wired 조사에 따르면 AI 검색 스타트업 Perplexity가 robots.txt를 통해 웹 크롤러를 차단하는 규칙을 위반했을 가능성이 있는 것으로 나타났습니다.

6월 초, 미디어 출판사인 포브스(Forbes)도 Perplexity가 출처를 밝히지 않고 생성 AI 시스템에 사용하기 위해 자사의 조사 기사를 표절했다고 비난했습니다.

Reddit은 화요일에 인터넷 아카이브와 같은 연구자와 조직이 비상업적 목적으로는 계속해서 콘텐츠에 접근할 수 있다고 밝혔습니다.

황하이 (로이터에 따르면)


[광고_2]
출처: https://www.congluan.vn/reddit-cap-nhat-giao-thuc-ngan-chan-ai-danh-cap-noi-dung-post300804.html

댓글 (0)

No data
No data

유산

수치

사업

No videos available

소식

정치 체제

현지의

제품