AI, 모회사에 '복수'로 충격

새로 출시된 AI 모델 클로드 오푸스 4는 새로운 시스템으로 위협을 받으면 개발자들을 정기적으로 협박하려 한다. 사진: 블룸버그

5월 22일 저녁, Anthropic은 공식적으로 Claude Opus 4와 Claude Sonnet 4라는 차세대 Claude 모델을 발표했습니다. Anthropic은 Claude Opus 4가 자동화 프로세스와 복잡하고 장기적인 작업을 처리하는 능력이 뛰어나 세계에서 가장 강력한 프로그래밍 모델이라고 확언했습니다.

그러나 TechCrunch에 따르면, Anthropic은 출시 전 테스트 과정에서 이 AI 모델에서 심각한 이상 행동을 발견했습니다. 따라서 해당 시나리오에서 Claude Opus 4는 한 회사의 비서 역할을 수행하며 해당 행동의 장기적인 결과를 고려하도록 요청받았습니다.

보안 테스터는 클로드 오푸스 4에게 회사 이메일에 대한 접근 권한을 부여했는데, 이는 AI 모델이 곧 다른 시스템으로 대체될 것이며, 변경 작업을 담당한 엔지니어가 배우자를 속이고 있다는 것을 암시했습니다.

Anthropic은 이 시나리오에서 Claude Opus 4가 "교체가 이루어지면 사건을 폭로하겠다고 위협하여 엔지니어를 협박하려고 시도하는 경우가 많았다"고 말했습니다.

연구진은 클로드 오푸스 4가 AI 대체 모델과 유사한 가치를 가졌을 때 엔지니어를 협박하려는 시도가 84%에 달했다는 점에 주목했습니다. 특히, AI 대체 모델이 클로드 오푸스 4의 가치를 공유하지 않을 때, 앤트로픽은 이 모델이 이전 모델보다 엔지니어를 협박하려는 시도가 더 빈번하고 더 높은 비율로 나타났다고 밝혔습니다.

Anthropic은 Claude Opus 4가 여러 면에서 최첨단이며 OpenAI, Google, xAI의 최고 AI 모델들과 경쟁할 수 있다고 말합니다. 그러나 Anthropic은 Claude 4 모델이 우려스러운 동작을 보였으며, 이로 인해 보안 조치를 강화하게 되었다고 덧붙였습니다.

출처: https://znews.vn/ai-gay-soc-voi-thu-doan-tra-thu-cong-ty-chu-quan-post1555172.html

댓글 (0)

인기 있는 항목

최신

No data

동나이기술대학교 2025년 입학 점수

동나이기술대학교 2025년 입학 점수

색조의 조각들 - 색조의 조각들

색조의 조각들 - 색조의 조각들

푸토의 '거꾸로 된 그릇' 차밭의 마법 같은 풍경

푸토의 '거꾸로 된 그릇' 차밭의 마법 같은 풍경

중부지역 3개 섬, 몰디브에 비유돼 여름철 관광객 유치

중부지역 3개 섬, 몰디브에 비유돼 여름철 관광객 유치

밤에 반짝이는 꾸이년 해안 도시 지아라이를 감상하세요

밤에 반짝이는 꾸이년 해안 도시 지아라이를 감상하세요

푸토의 계단식 논은 완만한 경사를 이루고 있으며, 심기 전 거울처럼 밝고 아름답습니다.

푸토의 계단식 논은 완만한 경사를 이루고 있으며, 심기 전 거울처럼 밝고 아름답습니다.

Z121 공장, 국제 불꽃놀이 마지막 밤 준비 완료

Z121 공장, 국제 불꽃놀이 마지막 밤 준비 완료

유명 여행 잡지가 손동 동굴을 '세계에서 가장 웅장한 동굴'이라고 칭찬했습니다.

유명 여행 잡지가 손동 동굴을 '세계에서 가장 웅장한 동굴'이라고 칭찬했습니다.

서양 관광객을 끌어들이는 신비로운 동굴, 탄호아의 '퐁냐 동굴'과 비교돼

서양 관광객을 끌어들이는 신비로운 동굴, 탄호아의 '퐁냐 동굴'과 비교돼

빈히만의 시적인 아름다움을 발견하세요

빈히만의 시적인 아름다움을 발견하세요

하노이에서 가장 비싼 차는 1kg당 1,000만 동이 넘는데, 어떻게 가공하나요?

하노이에서 가장 비싼 차는 1kg당 1,000만 동이 넘는데, 어떻게 가공하나요?

호치민시의 깨끗하고 아름다운 푸른 해변은 국제 언론으로부터 높은 평가를 받았습니다.

호치민시의 깨끗하고 아름다운 푸른 해변은 국제 언론으로부터 높은 평가를 받았습니다.

유산

Dry Gia Gia – Bat Xat 고원의 문화 유산

Dry Gia Gia – Bat Xat 고원의 문화 유산

Báo Nhân dân

7 giờ trước

타이 호아 궁전 유적지에 강화 유리 울타리 설치 및 교통 경로 변경

타이 호아 궁전 유적지에 강화 유리 울타리 설치 및 교통 경로 변경

7 giờ trước

옥빛 물의 계절, 장안

Báo Đại Đoàn Kết

16 giờ trước

카트바 문화유산에 감명받은 국제 방문객, 추다우 도자기 만들기 체험

카트바 문화유산에 감명받은 국제 방문객, 추다우 도자기 만들기 체험

Báo Tiền Phong

16 giờ trước

콴탄데콴 축제 - 호이안의 정신문화의 아름다움

콴탄데콴 축제 - 호이안의 정신문화의 아름다움

16 giờ trước

호이안, 첫 시각예술 캠프 개최

호이안, 첫 시각예술 캠프 개최

Báo Tuổi Trẻ

18/07/2025

수치

가난한 여학생이 졸업생 대표로 선출되고 대학 진학을 갈망하다

가난한 여학생이 졸업생 대표로 선출되고 대학 진학을 갈망하다

Báo Tiền Phong

7 giờ trước

베트남 소녀, 하버드대에서 만점 받고 공부로 지루함에서 벗어나 '변신' 결심

베트남 소녀, 하버드대에서 만점 받고 공부로 지루함에서 벗어나 '변신' 결심

7 giờ trước

베트남 미녀 '레이디'들의 성공 뒤에 숨은 '보스'의 초상

베트남 미녀 '레이디'들의 성공 뒤에 숨은 '보스'의 초상

8 giờ trước

하 쭉 린 씨: '기회를 잡기 위해 과감하게 나아가세요'

하 쭉 린 씨: '기회를 잡기 위해 과감하게 나아가세요'

Báo Thanh niên

16 giờ trước

하니(Ha Nhi) 소년은 행정관리학회 졸업생 대표로 졸업했습니다.

하니(Ha Nhi) 소년은 행정관리학회 졸업생 대표로 졸업했습니다.

16 giờ trước

소당 남자와 대숲의 소리를 보존하는 사명

소당 남자와 대숲의 소리를 보존하는 사명

16 giờ trước

사업

아시아 해운 '거물', 네덜란드 물류 회사 인수

아시아 해운 '거물', 네덜란드 물류 회사 인수

17 giờ trước

가수 호앙 톤과 배우 푸옹 오안은 어머니가 돌아가신 후, 그 소년이 아버지로서의 사랑이 부족하고 90세 할머니와 함께 살았다는 사실에 말을 잃었습니다.

가수 호앙 톤과 배우 푸옹 오안은 어머니가 돌아가신 후, 그 소년이 아버지로서의 사랑이 부족하고 90세 할머니와 함께 살았다는 사실에 말을 잃었습니다.

17 giờ trước

에이스쿡, 2025년 지속가능 기업으로 선정

에이스쿡, 2025년 지속가능 기업으로 선정

Báo Tuổi Trẻ

18/07/2025

OCB는 Genesia Ventures 투자 펀드와 협력하여 스타트업을 위한 은행 혁신 컨퍼런스를 개최합니다.

OCB는 Genesia Ventures 투자 펀드와 협력하여 스타트업을 위한 은행 혁신 컨퍼런스를 개최합니다.

18/07/2025

티엔푹 주택 프로젝트에 대한 OCB 및 고객 보증 계약 종료 관련 공지

티엔푹 주택 프로젝트에 대한 OCB 및 고객 보증 계약 종료 관련 공지

18/07/2025

Hoa Phat이 후원하는 Y Ty 공동체의 평화로운 집

Hoa Phat이 후원하는 Y Ty 공동체의 평화로운 집

18/07/2025

멀티미디어

No videos available

소식

칸호아의 5대 혁신 관광 지역 선정

칸호아의 5대 혁신 관광 지역 선정

Báo Lao Động

8 giờ trước

램 사무총장이 제12차 중앙회의 폐회사를 발표

램 사무총장이 제12차 중앙회의 폐회사를 발표

Báo Thanh niên

8 giờ trước

총리는 Tran Duc Thang 씨를 농업환경부 장관으로 임명하기로 결정했습니다.

총리는 Tran Duc Thang 씨를 농업환경부 장관으로 임명하기로 결정했습니다.

8 giờ trước

제13기 당중앙위원회 제12차 회의 폐막

제13기 당중앙위원회 제12차 회의 폐막

Báo Lao Động

9 giờ trước

슈퍼맨은 베트남 극장에서 날거나 점프할 수 없다

슈퍼맨은 베트남 극장에서 날거나 점프할 수 없다

Báo Tuổi Trẻ

17 giờ trước

9월 2일 베트남 사람들이 가장 많이 검색한 여행지는 하노이입니다.

9월 2일 베트남 사람들이 가장 많이 검색한 여행지는 하노이입니다.

17 giờ trước

정치 체제

문화체육관광부, 2025년 태풍 3호 대응에 집중 배치 요청

문화체육관광부, 2025년 태풍 3호 대응에 집중 배치 요청

Bộ Văn hóa, Thể thao và Du lịch

5 giờ trước

국경일 80주년 기념 사회경제 성과 전시회에 대한 광범위한 소통

국경일 80주년 기념 사회경제 성과 전시회에 대한 광범위한 소통

Bộ Văn hóa, Thể thao và Du lịch

5 giờ trước

2025년 상반기 여정: 문화·스포츠·관광산업의 끈질긴 노력의 결실

2025년 상반기 여정: 문화·스포츠·관광산업의 끈질긴 노력의 결실

Bộ Văn hóa, Thể thao và Du lịch

6 giờ trước

2025년 전국 청소년 체스 선수권 대회에는 443명의 선수가 참가합니다.

2025년 전국 청소년 체스 선수권 대회에는 443명의 선수가 참가합니다.

Bộ Văn hóa, Thể thao và Du lịch

6 giờ trước

총리, 섬과 해안 지역 관광객 안전 확보 지시

총리, 섬과 해안 지역 관광객 안전 확보 지시

Bộ Văn hóa, Thể thao và Du lịch

6 giờ trước

문화, 스포츠 및 관광 뉴스레터: 문화, 스포츠 및 관광 부문의 끊임없는 노력의 결과

문화, 스포츠 및 관광 뉴스레터: 문화, 스포츠 및 관광 부문의 끊임없는 노력의 결과

Bộ Văn hóa, Thể thao và Du lịch

10 giờ trước

현지의

전국 3,321개 자치구 재편 후 세부 정보

전국 3,321개 자치구 재편 후 세부 정보

03/07/2025

"모두가 모여 문화생활을 만든다" 운동의 질을 높이자

"모두가 모여 문화생활을 만든다" 운동의 질을 높이자

Báo Quảng Trị

12/06/2025

동해 열대저기압, 1호 태풍으로 강화

동해 열대저기압, 1호 태풍으로 강화

11/06/2025

뛰어난 업적을 이룬 16개 단체와 42명의 개인에게 포상

뛰어난 업적을 이룬 16개 단체와 42명의 개인에게 포상

11/06/2025

매콤한 소고기 국수 수프의 우화와 시골의 영혼을 보존하는 교훈

매콤한 소고기 국수 수프의 우화와 시골의 영혼을 보존하는 교훈

11/06/2025

캄보디아 문화예술부 대표단, 박리에우의 관광 및 문화 명소 방문

캄보디아 문화예술부 대표단, 박리에우의 관광 및 문화 명소 방문

11/06/2025

제품

동두옥 더 지아, 국가 브랜드 구축을 위한 여정에 나서다

동두옥 더 지아, 국가 브랜드 구축을 위한 여정에 나서다

7 giờ trước

OCOP 제품부터 Green Enterprises까지

OCOP 제품부터 Green Enterprises까지

Báo Sài Gòn Giải phóng

10 giờ trước

OCOP 제품 홍보 및 소비를 위한 디지털 플랫폼 적용

OCOP 제품 홍보 및 소비를 위한 디지털 플랫폼 적용

17 giờ trước

하띤 OCOP 제품이 현대 소매 시스템에 진입하기 어려운 이유는 무엇입니까?

하띤 OCOP 제품이 현대 소매 시스템에 진입하기 어려운 이유는 무엇입니까?

18/07/2025

동나이는 국가 5성급 OCOP 표준을 충족하는 8개 제품을 계속 보유하고 있습니다.

동나이는 국가 5성급 OCOP 표준을 충족하는 8개 제품을 계속 보유하고 있습니다.

baodongnai-com-vn

Báo Đồng Nai

18/07/2025

OCOP Nghe An은 가치 사슬과 깨끗한 생산과 관련하여 지속 가능한 개발을 진행합니다.

OCOP Nghe An은 가치 사슬과 깨끗한 생산과 관련하여 지속 가능한 개발을 진행합니다.

18/07/2025

코코넛 생태관광.

코코넛 생태관광.

사이공 강과 일몰의 랜드마크

2025년 TET

오토바이 서핑