GPT-4.5 OpenAI가 만든 가장 큰 모델입니다. 출처: The Verge . |
캘리포니아 대학교는 과학과 의 새로운 연구는 인공지능 분야에서 이정표를 세웠습니다. OpenAI의 GPT-4.5 모델은 "개성" 기반의 복합 복합 방식을 사용하여 튜브링 테스트에서 반발 성능을 달성했습니다.
지금까지 말하는 AI 대화 시스템 중 가장 인간과 접촉을 적용하는, 소셜 베어링 분야에서 많은 응용 프로그램 범위를 열어줄 것으로 예상됩니다.
OpenAI는 GPT-4.5를 "사전 학습 및 기어 축소에 있어 중요한 이해"라고 홍보합니다. Open AI가 있습니다.
OpenAI가 2월 27일에 공식 블로그에 게시된 사실, GPT-4.5가 발표에 ChatGPT Pro 사용자를 대상으로 배포되기 시작했습니다.
AI가 인간을 속일 수 있다고?
이 실험은 1960년대 챗봇 ELIZA, Meta AI의 LLaMa-3.1-405B, 그리고 OpenAI의 GPT-4o와 GPT-4.5, 이렇게 네 가지 AI 시스템을 칭찬했습니다. 그것은 다작과 같은 온라인 플랫폼에서 총 500명의 사용자를 대상으로 250명의 참가자를 대상으로 두 가지 반응인 실험을 설계했습니다. 다양한 종류를 최대한 활용하기 위해 연령, 사용, 교육 수준에 맞는 것이 있습니다.
![]() |
네 가지 AI 시스템 비교표. 출처: AIbase |
이 테스트는 또 다른 튜링 형식을 사용합니다. 각인 인지는 텍스트 인터페이스를 통해 두 명의 명의 피험자(한 명은 인간, 한 명은 AI)와 5분 동안 만남을 한 후, 누가 인간을 평가합니다.
결과는 여러 가지였습니다. GPT-4.5는 73%의 "튜링 테스트 통과"율을 기준으로 인간 평균(60~70%)을 넘어섰습니다. AI 모델이 표준 튜닝 테스트를 실제로 "통과"한 것은 이번이 처음입니다. 반면에, GPT-4o는 약간의 하이브리드를 제외하고, LLaMa-3.1-405B의 일부 상황에서 인간 성능에 힘을 더하거나 더 큰 힘을 얻었으며, ELIZA는 훨씬 더 어렵습니다.
인간처럼 작용할 수 있는 능력
GPT-4.5가 아닌 감정을 표현하고 대화하는 것과 반대되는 반대되는 능력입니다. 많은 분들이 GPT-4.5를 "친절하고" "진정성 있다"고 평가했습니다.
특히 사용자가 그럴 때 GPT-4.5는 룬러스나 위안이 되는 답변을 많은 사람들이 실제 사람과 만나는 것처럼 믿을게 있습니다.
![]() |
테스트 중 두 번의 고통자(한 명은 AI, 한 명은 인간). 사진: UC 샌디에이고 . |
LLaMa-3.1-405B가 있습니다. GPT-4o는 강력하지만 개인화 및 상황 반응에 있어서는 다릅니다.
GPT 4.5의 활용 가능성을 열어줄 수 있습니다. 하지만 AI가 점점 더 인간과 동일해짐에 따라, 현실과 환상을 구분하고 기술 사용 방식을 받아들이는 것은 중요한 사회적 임무가 될 것입니다.
이 연구는 AI의 수채화한 전투입니다. GPT-4.5의 성공은 OpenAI가 승리할 뿐만 아니라 인간과 기계의 관계에 대한 심오한 질문을 제기합니다. 한 테스터는 마치 친구와 이야기하는 것을 알리고 있습니다. 하지만 결국 모든 코드가 몇 줄에 걸리는 것을 깨달았습니다. 인간과 AI의 대화는 이제 막 시작되지도 않습니다.
출처: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
댓글 (0)