새롭게 출시된 AI 모델에는 다른 AI 모델의 성능을 테스트할 수 있는 "자가 학습 평가기" 도구가 탑재되어 있습니다. 특히, 이 도구는 초인적 지능을 통해 인공지능 개발에 있어 인간의 개입을 줄일 수 있을 것으로 기대됩니다.
이번 출시는 Meta가 8월에 보고서를 통해 앱을 소개한 이후에 이루어졌으며, 보고서에서는 해당 도구가 OpenAI의 새로 출시된 1 모델에서 사용하는 것과 동일한 "사고 사슬" 기술을 사용하여 모델의 응답에 대한 신뢰할 수 있는 판단을 내리는 방식을 자세히 설명했습니다.
메타는 AI 개발에서 인간의 개입을 줄일 수 있는 새로운 AI 모델을 출시했습니다.
이 기술은 복잡한 문제를 더 작은 논리적 단계로 나누어 과학 , 코딩, 수학과 같은 과목의 어려운 문제에 대한 응답의 정확도를 높이는 것을 포함합니다.
메타 연구원들은 평가 모델을 훈련하기 위해 전적으로 AI가 생성한 데이터를 사용했으며, 그 단계에서는 인간의 개입을 배제했습니다.
AI를 사용하여 AI를 안정적으로 평가하는 능력은 자신의 실수로부터 학습할 수 있는 자율적인 AI 에이전트를 구축하는 실행 가능한 길을 열어준다고 이 프로젝트를 담당한 두 명의 메타 연구원이 Reuters에 말했습니다.
AI 분야의 많은 사람들은 이러한 에이전트를 인간의 개입 없이 다양한 작업을 수행할 수 있을 만큼 지능적인 디지털 비서로 생각합니다.
메타는 페이스북과 인스타그램 플랫폼을 중독성 있게 만들어 청소년의 정신 건강 문제를 야기했다는 혐의로 미국 주에서 여러 건의 소송을 당하고 있습니다.
오클랜드의 이본 곤잘레스 로저스 미국 지방 법원 판사는 작년에 제기된 두 건의 별도 소송에서 주정부가 제기한 청구를 기각해 달라는 메타의 요청을 기각했습니다. 한 건은 캘리포니아와 뉴욕을 포함한 30개 이상의 주가 관련된 소송이고, 다른 한 건은 플로리다가 제기한 소송입니다.
자체 개선 모델을 사용하면 오늘날 사용되는 인간 피드백 강화 학습이라는 비용이 많이 들고 비효율적인 프로세스가 필요 없게 될 수 있습니다. 인간 피드백 강화 학습은 전문 지식을 갖춘 인간 주석자의 입력을 받아 정확한 데이터를 붙여넣고 복잡한 수학 및 쓰기 문제에 대한 답을 검증해야 합니다.
"AI가 더욱 초인적으로 발전함에 따라, 스스로의 작업을 검증하는 능력도 점점 더 향상되어 실제로 인간보다 더 뛰어나기를 바랍니다. 자가 학습과 자가 평가 능력은 초인적 수준의 AI를 달성하는 데 근본적으로 중요합니다."라고 연구원 중 한 명인 제이슨 웨스턴은 말했습니다.
Google과 Anthropic을 비롯한 다른 기업들도 RLAIF(인공지능 피드백 기반 강화 학습) 개념에 대한 연구를 발표했습니다. 하지만 Meta와 달리 이러한 기업들은 일반적으로 모델을 대중에게 공개하지 않습니다.
금요일에 Meta가 출시한 다른 AI 도구에는 회사의 Segment Anything 이미지 인식 모델 업데이트, LLM 응답 생성 시간을 단축하는 도구, 새로운 무기 소재 발견에 도움이 되는 데이터 세트가 포함됩니다.
[광고_2]
출처: https://www.baogiaothong.vn/cong-ty-me-facebook-ra-mat-mo-hinh-ai-giam-sat-mo-hinh-ai-khac-192241019113020535.htm
댓글 (0)