(CLO) 페이스북 모회사인 메타는 금요일에 일련의 새로운 AI 모델을 출시한다고 발표했습니다. 여기에는 AI 개발 과정에서 인간의 개입을 줄일 수 있는 "자체 학습 평가기"가 포함됩니다.
이번 발표는 Meta가 8월 연구 논문에서 이 도구를 소개한 후 나온 것으로, OpenAI의 새로운 모델과 유사한 "사고 사슬" 기법을 사용하여 AI 모델 반응에 대한 정확한 판단을 내리는 방식을 설명합니다. 이 기법은 복잡한 문제를 더 단순한 논리적 단계로 나누어 과학 , 프로그래밍, 수학 등의 분야에서 정확도를 높이는 데 도움을 줍니다.
메타 AI 아이콘. 사진: 로이터
메타 연구원들은 이 평가 모델을 훈련하기 위해 전적으로 AI가 생성한 데이터를 사용했으며, 그 단계에서 인간의 개입을 완전히 배제했습니다.
메타 연구원 두 명에 따르면, AI를 사용하여 AI 자체를 평가하는 능력은 자신의 실수로부터 학습할 수 있는 자율적인 AI 에이전트를 개발할 수 있는 잠재력을 보여줍니다.
AI 분야의 많은 전문가들은 이러한 지능형 디지털 에이전트를 인간의 개입 없이 다양한 작업을 수행할 수 있는 디지털 비서로 생각합니다.
자가 개선 모델은 고도로 숙련된 전문가가 데이터에 레이블을 지정하고 복잡한 수학 및 서면 답변의 정확성을 검증해야 하는 '인간 피드백 기반 강화 학습' 프로세스의 필요성을 없앨 수 있습니다. 이 프로세스는 현재 매우 비용이 많이 들고 비효율적입니다.
이 프로젝트의 연구원 중 한 명인 제이슨 웨스턴은 "AI가 인간보다 점점 더 우수해짐에 따라, AI가 스스로 작업을 확인하는 능력도 향상되고 심지어 인간을 능가하게 될 것으로 기대합니다."라고 말했습니다.
그는 "학습하고 스스로 평가하는 능력은 AI를 초인적 수준으로 개발하는 데 중요합니다."라고 덧붙였다.
Meta 외에도 Google과 Anthropic 같은 다른 회사들도 RLAIF(피드백 AI를 활용한 강화 학습) 개념에 대한 연구를 발표했습니다. 하지만 Meta와 달리 이러한 회사들은 자신들의 모델을 대중에게 공개하는 경우가 드뭅니다.
카오퐁 (로이터 통신에 따르면)
[광고_2]
출처: https://www.congluan.vn/meta-phat-hanh-mo-hinh-ai-co-the-tu-hoc-va-tu-phat-trien-post317675.html
댓글 (0)