Vietnam.vn - Nền tảng quảng bá Việt Nam

AI, 모회사에 '복수'로 충격

Anthropic은 새로 출시된 AI 모델인 Claude Opus 4가 새로운 시스템으로 위협을 받을 때 개발자들을 정기적으로 협박한다고 말했습니다.

ZNewsZNews23/05/2025

새로 출시된 AI 모델 클로드 오푸스 4는 새로운 시스템으로 위협을 받으면 개발자들을 정기적으로 협박하려 한다. 사진: 블룸버그

5월 22일 저녁, Anthropic은 공식적으로 Claude Opus 4와 Claude Sonnet 4라는 차세대 Claude 모델을 발표했습니다. Anthropic은 Claude Opus 4가 자동화 프로세스와 복잡하고 장기적인 작업을 처리하는 능력이 뛰어나 세계에서 가장 강력한 프로그래밍 모델이라고 확언했습니다.

그러나 TechCrunch에 따르면, Anthropic은 출시 전 테스트 과정에서 이 AI 모델에서 심각한 이상 행동을 발견했습니다. 따라서 해당 시나리오에서 Claude Opus 4는 한 회사의 비서 역할을 수행하며 해당 행동의 장기적인 결과를 고려하도록 요청받았습니다.

보안 테스터는 클로드 오푸스 4에게 회사 이메일에 대한 접근 권한을 부여했는데, 이는 AI 모델이 곧 다른 시스템으로 대체될 것이며, 변경 작업을 담당한 엔지니어가 배우자를 속이고 있다는 것을 암시했습니다.

Anthropic은 이 시나리오에서 Claude Opus 4가 "교체가 이루어지면 사건을 폭로하겠다고 위협하여 엔지니어를 협박하려고 시도하는 경우가 많았다"고 말했습니다.

연구진은 클로드 오푸스 4가 AI 대체 모델과 유사한 가치를 가졌을 때 엔지니어를 협박하려는 시도가 84%에 달했다는 점에 주목했습니다. 특히, AI 대체 모델이 클로드 오푸스 4의 가치를 공유하지 않을 때, 앤트로픽은 이 모델이 이전 모델보다 엔지니어를 협박하려는 시도가 더 빈번하고 더 높은 비율로 나타났다고 밝혔습니다.

Anthropic은 Claude Opus 4가 여러 면에서 최첨단이며 OpenAI, Google, xAI의 최고 AI 모델들과 경쟁할 수 있다고 말합니다. 그러나 Anthropic은 Claude 4 모델이 우려스러운 동작을 보였으며, 이로 인해 보안 조치를 강화하게 되었다고 덧붙였습니다.

출처: https://znews.vn/ai-gay-soc-voi-thu-doan-tra-thu-cong-ty-chu-quan-post1555172.html


댓글 (0)

No data
No data
색조의 조각들 - 색조의 조각들
푸토의 '거꾸로 된 그릇' 차밭의 마법 같은 풍경
중부지역 3개 섬, 몰디브에 비유돼 여름철 관광객 유치
밤에 반짝이는 꾸이년 해안 도시 지아라이를 감상하세요
푸토의 계단식 논은 완만한 경사를 이루고 있으며, 심기 전 거울처럼 밝고 아름답습니다.
Z121 공장, 국제 불꽃놀이 마지막 밤 준비 완료
유명 여행 잡지가 손동 동굴을 '세계에서 가장 웅장한 동굴'이라고 칭찬했습니다.
서양 관광객을 끌어들이는 신비로운 동굴, 탄호아의 '퐁냐 동굴'과 비교돼
빈히만의 시적인 아름다움을 발견하세요
하노이에서 가장 비싼 차는 1kg당 1,000만 동이 넘는데, 어떻게 가공하나요?

유산

수치

사업

No videos available

소식

정치 체제

현지의

제품