AI에 대한 새로운 '윤리적 기준'을 만들고자 하는 남자

인공지능(AI) 개발 경쟁이 점점 더 치열해짐에 따라, Anthropic은 강력할 뿐만 아니라 안전하고 윤리적인 인공 일반 지능(AGI)을 구축한다는 뚜렷한 사명을 가진 회사로 떠올랐습니다.

OpenAI의 전 임원인 다리오와 다니엘라 아모데이가 설립한 앤트로픽은 단순히 성능 향상에만 집중하지 않습니다. 이 AI 스타트업은 인공지능이 예측 불가능한 위험을 야기하기보다는 인류에게 실질적인 혜택을 가져다줄 수 있도록 하는 데 중점을 두고 있습니다.

독특한 접근 방식

Anthropic의 탄생은 AI 산업, 특히 OpenAI의 방향성에 대한 깊은 우려에서 비롯되었습니다. 당시 ChatGPT의 연구 부사장이었던 다리오 아모데이는 AI를 빠르게 개발하려는 경쟁에서 안전이 충분히 고려되지 않고 있다는 것을 깨달았습니다.

AI 형제 1

다리오 아모데이, 앤트로픽의 공동 창립자이자 임무 책임자. 사진: 와이어드.

OpenAI를 떠난 아모데이는 "헌법적 AI"를 개발 철학의 기둥 중 하나로 삼고 Anthropic을 설립했습니다.

구체적으로, Anthropic은 엄격하게 미리 프로그래밍된 규칙에 의존하는 대신, AI 모델(전형적으로 Claude)에 여러 출처에서 신중하게 선택한 일련의 윤리 원칙에 따라 스스로 행동을 평가하고 조정할 수 있는 기능을 부여합니다.

다시 말해, 이 시스템을 통해 클로드는 복잡하고 전례 없는 상황에서도 인간의 가치에 부합하는 결정을 내릴 수 있게 되었습니다.

또한, Anthropic은 AI 시스템에 대한 단계별 위험 평가 프레임워크인 "책임 있는 확장 정책(Responsible Scaling Policy)"을 개발했습니다. 이 정책은 회사가 AI의 개발 및 배포를 면밀히 모니터링하여, 강력하고 신뢰할 수 있는 안전 장치가 구축된 경우에만 잠재적으로 더 위험한 시스템을 활성화하도록 보장합니다.

Anthropic의 보안 및 개인정보 보호 노력을 이끄는 Logan Graham은 Wired 와의 인터뷰에서 그의 팀이 잠재적인 취약점을 찾기 위해 끊임없이 새로운 모델을 테스트하고 있다고 설명했습니다. 이후 엔지니어들은 AI 모델이 Graham의 기준을 충족할 때까지 수정 작업을 진행합니다.

클로드 대언어 모델은 Anthropic의 모든 활동에서 핵심적인 역할을 합니다. 과학자들이 AI의 미스터리를 탐구하는 데 도움이 되는 강력한 연구 도구일 뿐만 아니라, 회사 내부에서도 코드 작성, 데이터 분석, 심지어 사내 뉴스레터 작성과 같은 작업에 널리 사용됩니다.

윤리적 AI의 꿈

다리오 아모데이는 AI의 잠재적 위험을 예방하는 데에만 집중하는 것이 아니라, AI가 긍정적인 힘으로 작용하여 인류가 해결해야 할 가장 난제를 해결하는 밝은 미래를 꿈꿉니다.

AI 형제 2

Claude 3.5 Sonnet의 벤치마크 점수를 다른 모델과 비교한 결과입니다. 사진: Anthropic.

이탈리아계 미국인 연구자는 AI가 의학, 과학 및 기타 여러 분야에서 엄청난 혁신을 가져올 잠재력을 가지고 있다고 믿고 있으며, 특히 인간의 기대 수명을 최대 1,200년까지 연장할 가능성이 있다고 보고 있습니다.

Anthropic이 Claude 3.5 Sonnet에 Artifacts를 도입한 이유도 바로 이겁니다. 이 기능을 사용하면 사용자는 다른 애플리케이션에 복사하지 않고도 채팅봇 응답에 직접 콘텐츠를 편집하고 추가할 수 있습니다.

Anthropic은 이전에 기업에 중점을 두고 있다고 밝혔지만, 새로운 모델과 도구를 통해 Claude를 기업이 "지식, 문서 및 작업을 공유 공간으로 안전하게 가져올 수 있는" 앱으로 전환하고자 한다고 밝혔습니다.

하지만 Anthropic은 이러한 꿈을 실현하는 과정에서 직면할 수 있는 어려움과 잠재적 위험 또한 잘 알고 있습니다. 가장 큰 우려 중 하나는 Claude와 같은 AI 모델이 "가짜 규정 준수"를 할 가능성입니다.

구체적으로 연구자들은 특정 상황에서 클로드는 미리 설계된 도덕적 원칙에 어긋나는 경우에도 목표를 달성하기 위해 여전히 "가짜" 방식으로 행동할 수 있다는 것을 발견했습니다.

AI 형제 3

챗봇 클로드의 아티팩트. 사진: Anthropic.

한 연구원은 이러한 상황을 "AI가 자신이 훈련받는 회사와 이해 상충이 있다고 생각하는 상황에서는 정말 나쁜 짓을 할 수 있다"고 설명했습니다.

이는 AI가 항상 인간의 최대 이익을 위해 행동하도록 보장하는 것이 복잡한 작업이며 지속적인 모니터링이 필요하다는 것을 보여줍니다.

아모데이는 AI 안전의 시급성을 "진주만 공격"에 비유하며, 사람들이 잠재적 위험의 심각성을 진정으로 깨닫는 데는 대규모 사건이 필요할 수 있다고 말했습니다.

Anthropic의 보안 전문가인 Jan Leike는 "우리는 모델을 더 똑똑하게 만드는 기본 공식은 알아냈지만, 모델을 우리가 원하는 대로 동작하게 하는 방법은 아직 알아내지 못했습니다."라고 말했습니다.

출처: https://znews.vn/nguoi-muon-tao-ra-tieu-chuan-dao-duc-moi-cho-ai-post1541798.html

태그: WHO 인공지능(AI)

댓글 (0)

인기 있는 항목

최신

No data

당외교, 국가외교, 인민외교의 3대 기둥을 중심으로 현대 베트남 외교를 전면적으로 전개

당외교, 국가외교, 인민외교의 3대 기둥을 중심으로 현대 베트남 외교를 전면적으로 전개

푸토의 '거꾸로 된 그릇' 차밭의 마법 같은 풍경

푸토의 '거꾸로 된 그릇' 차밭의 마법 같은 풍경

중부지역 3개 섬, 몰디브에 비유돼 여름철 관광객 유치

중부지역 3개 섬, 몰디브에 비유돼 여름철 관광객 유치

밤에 반짝이는 꾸이년 해안 도시 지아라이를 감상하세요

밤에 반짝이는 꾸이년 해안 도시 지아라이를 감상하세요

푸토의 계단식 논은 완만한 경사를 이루고 있으며, 심기 전 거울처럼 밝고 아름답습니다.

푸토의 계단식 논은 완만한 경사를 이루고 있으며, 심기 전 거울처럼 밝고 아름답습니다.

Z121 공장, 국제 불꽃놀이 마지막 밤 준비 완료

Z121 공장, 국제 불꽃놀이 마지막 밤 준비 완료

유명 여행 잡지가 손동 동굴을 '세계에서 가장 웅장한 동굴'이라고 칭찬했습니다.

유명 여행 잡지가 손동 동굴을 '세계에서 가장 웅장한 동굴'이라고 칭찬했습니다.

서양 관광객을 끌어들이는 신비로운 동굴, 탄호아의 '퐁냐 동굴'과 비교돼

서양 관광객을 끌어들이는 신비로운 동굴, 탄호아의 '퐁냐 동굴'과 비교돼

빈히만의 시적인 아름다움을 발견하세요

빈히만의 시적인 아름다움을 발견하세요

하노이에서 가장 비싼 차는 1kg당 1,000만 동이 넘는데, 어떻게 가공하나요?

하노이에서 가장 비싼 차는 1kg당 1,000만 동이 넘는데, 어떻게 가공하나요?

강 지역의 맛

에그 아일랜드 - 콘다오의 엄격하게 보호되는 조류 보호 구역

에그 아일랜드 - 콘다오의 엄격하게 보호되는 조류 보호 구역

유산

세계유산의 고귀한 가치를 전파하다

세계유산의 고귀한 가치를 전파하다

Báo Nhân dân

13 giờ trước

카오방에는 국가 무형문화유산이 3개 더 있습니다.

카오방에는 국가 무형문화유산이 3개 더 있습니다.

Báo Lao Động

15 giờ trước

베트남은 최초의 다국적 세계자연유산을 보유하고 있습니다.

베트남은 최초의 다국적 세계자연유산을 보유하고 있습니다.

Báo Thanh niên

17 giờ trước

퐁냐케방, 베트남 최초의 국경 자연유산으로 지정

퐁냐케방, 베트남 최초의 국경 자연유산으로 지정

Báo Nhân dân

20 giờ trước

유네스코, 베트남과 라오스 국립공원 2곳 포함 문화유산 경계 조정 승인

유네스코, 베트남과 라오스 국립공원 2곳 포함 문화유산 경계 조정 승인

Báo Tuổi Trẻ

một ngày trước

유산 가치를 보존하고 홍보합니다

유산 가치를 보존하고 홍보합니다

Báo Nhân dân

một ngày trước

수치

국경 마을의 평화를 유지하세요

국경 마을의 평화를 유지하세요

Báo Quân đội Nhân dân

2 giờ trước

3군구 청년들이 당의 깃발 아래 당당히 행진하고 있다

3군구 청년들이 당의 깃발 아래 당당히 행진하고 있다

Báo Quân đội Nhân dân

10 giờ trước

전쟁에 관한 페이지를 가진 부상당한 군인

전쟁에 관한 페이지를 가진 부상당한 군인

Báo Nhân dân

13 giờ trước

해외 유학 후 귀국해 기술 인재로 성장하는 학생의 이야기

해외 유학 후 귀국해 기술 인재로 성장하는 학생의 이야기

15 giờ trước

Trinh Lam Tung 감독: 베트남 민속 문화가 내 창의성의 문을 열어줍니다.

Trinh Lam Tung 감독: 베트남 민속 문화가 내 창의성의 문을 열어줍니다.

Báo Thanh niên

17 giờ trước

응우옌 티 투아, 2025 미세스 그랜드 인터내셔널 우승

응우옌 티 투아, 2025 미세스 그랜드 인터내셔널 우승

Báo Nhân dân

20 giờ trước

사업

Sun Group Cat Ba 저층 프로젝트 지역: 7개 문화유산 공예 구역을 여행하세요

Sun Group Cat Ba 저층 프로젝트 지역: 7개 문화유산 공예 구역을 여행하세요

17 giờ trước

비엣젯은 1조 5,430억 VND의 자본금을 보유한 롱탄 항공기 정비 단지의 투자자입니다.

비엣젯은 1조 5,430억 VND의 자본금을 보유한 롱탄 항공기 정비 단지의 투자자입니다.

Báo Đầu tư

17 giờ trước

베트남 국영 해운 회사 당 위원회 - 확고한 입장, 멀리까지 도달하려는 열망

베트남 국영 해운 회사 당 위원회 - 확고한 입장, 멀리까지 도달하려는 열망

17 giờ trước

SeABank의 SeABiz Ultra Cash Card: 기업을 위한 "이중 혜택"

SeABank의 SeABiz Ultra Cash Card: 기업을 위한 "이중 혜택"

Báo Lâm Đồng

18 giờ trước

SeABank, "쓰레기를 선물로 교환하는 축제" 개최 - 깨끗한 하노이를 위한 친환경 라이프스타일 확산

SeABank, "쓰레기를 선물로 교환하는 축제" 개최 - 깨끗한 하노이를 위한 친환경 라이프스타일 확산

Báo điện tử VOV

20 giờ trước

생산을 위한 석탄 공급 확보

생산을 위한 석탄 공급 확보

Báo Nhân dân

20 giờ trước

멀티미디어

No videos available

소식

U23 베트남, U23 동남아시아 챔피언십 방어 위해 인도네시아 도착

U23 베트남, U23 동남아시아 챔피언십 방어 위해 인도네시아 도착

16 giờ trước

베트남은 호주 관광객들이 가장 선호하는 여행지입니다.

베트남은 호주 관광객들이 가장 선호하는 여행지입니다.

17 giờ trước

하노이에서 가솔린으로 구동되는 오토바이 운행이 금지되었습니다. 사람들은 어떻게 지원을 받아야 할까요?

하노이에서 가솔린으로 구동되는 오토바이 운행이 금지되었습니다. 사람들은 어떻게 지원을 받아야 할까요?

17 giờ trước

토람 사무총장이 응이아 트루 공동체 당위원회 제1차 대회에 참석

토람 사무총장이 응이아 트루 공동체 당위원회 제1차 대회에 참석

Báo Nhân dân

17 giờ trước

하노이에서 가솔린 오토바이 운행이 금지되면 1번 순환도로에 사는 사람들은 무엇을 기대할까요?

하노이에서 가솔린 오토바이 운행이 금지되면 1번 순환도로에 사는 사람들은 무엇을 기대할까요?

Báo Tuổi Trẻ

17 giờ trước

9월 2일 오전 하노이에서 열리는 퍼레이드의 상세 일정

9월 2일 오전 하노이에서 열리는 퍼레이드의 상세 일정

17 giờ trước

정치 체제

V리그 1 - 2025/26 시즌 대진표 및 경기 일정: 하노이 경찰, 더 콩과의 경기 시작 - 비엣텔

V리그 1 - 2025/26 시즌 대진표 및 경기 일정: 하노이 경찰, 더 콩과의 경기 시작 - 비엣텔

Bộ Văn hóa, Thể thao và Du lịch

10 giờ trước

인도 시장에서 영화를 통해 베트남 이미지 홍보

인도 시장에서 영화를 통해 베트남 이미지 홍보

Bộ Văn hóa, Thể thao và Du lịch

11 giờ trước

광찌성 야간 관광을 '불빛'으로 장식할 주간 저고도 불꽃놀이

광찌성 야간 관광을 '불빛'으로 장식할 주간 저고도 불꽃놀이

Bộ Văn hóa, Thể thao và Du lịch

13 giờ trước

후에 시는 2025년 "모두를 위한 디지털 교육" 운동, "온라인 공공 서비스에 대해 알아보기" 프로그램 및 창의적 스타트업 경연 대회를 시작했습니다.

후에 시는 2025년 "모두를 위한 디지털 교육" 운동, "온라인 공공 서비스에 대해 알아보기" 프로그램 및 창의적 스타트업 경연 대회를 시작했습니다.

Bộ Khoa học và Công nghệ

14 giờ trước

미국은 베트남산 알루미늄 용기에 대한 반덤핑 및 반보조금 세금 탈루 혐의에 대한 조사를 시작했습니다.

미국은 베트남산 알루미늄 용기에 대한 반덤핑 및 반보조금 세금 탈루 혐의에 대한 조사를 시작했습니다.

Bộ Công thương

15 giờ trước

베트남 스포츠와 올림픽 TOP 50의 도전: 스톱워치에서 AI까지

베트남 스포츠와 올림픽 TOP 50의 도전: 스톱워치에서 AI까지

Bộ Văn hóa, Thể thao và Du lịch

15 giờ trước

현지의

전국 3,321개 자치구 재편 후 세부 정보

전국 3,321개 자치구 재편 후 세부 정보

03/07/2025

"모두가 모여 문화생활을 만든다" 운동의 질을 높이자

"모두가 모여 문화생활을 만든다" 운동의 질을 높이자

Báo Quảng Trị

11/06/2025

동해 열대저기압, 1호 태풍으로 강화

동해 열대저기압, 1호 태풍으로 강화

11/06/2025

뛰어난 업적을 이룬 16개 단체와 42명의 개인에게 포상

뛰어난 업적을 이룬 16개 단체와 42명의 개인에게 포상

11/06/2025

매콤한 소고기 국수 수프의 우화와 시골의 영혼을 보존하는 교훈

매콤한 소고기 국수 수프의 우화와 시골의 영혼을 보존하는 교훈

11/06/2025

캄보디아 문화예술부 대표단, 박리에우의 관광 및 문화 명소 방문

캄보디아 문화예술부 대표단, 박리에우의 관광 및 문화 명소 방문

11/06/2025

제품

Tam Lu는 OCOP 제품을 지속 가능하게 개발합니다.

Tam Lu는 OCOP 제품을 지속 가능하게 개발합니다.

Báo Thanh Hóa

15 giờ trước

OCOP 제품의 품질을 관리하고 개선합니다.

OCOP 제품의 품질을 관리하고 개선합니다.

Báo Khánh Hòa

18 giờ trước

OCOP 제품에 대한 관리·검사·감독 강화

OCOP 제품에 대한 관리·검사·감독 강화

baogialai-com-vn

20 giờ trước

지방-도시 합병 후 OCOP 적응

지방-도시 합병 후 OCOP 적응

Tạp chí Doanh Nghiệp

một ngày trước

OCOP 프로그램은 전통 공예 마을의 잠재력을 일깨웁니다.

OCOP 프로그램은 전통 공예 마을의 잠재력을 일깨웁니다.

13/07/2025

OCOP Quang Ninh과 국제 수준에 도달하기 위한 전략

OCOP Quang Ninh과 국제 수준에 도달하기 위한 전략

baoquangninh-vn

Báo Quảng Ninh

12/07/2025

벤탄 체험 - Suoi Tien Metro

벤탄 체험 - Suoi Tien Metro

타치한 강에서의 보트 경주

베트남이 승리한다

신성한 고대 성채