TechSpot 에 따르면, OpenAI는 차세대 대규모 언어 모델인 ChatGPT-5를 개발하면서 많은 어려움에 직면하고 있습니다. "프로젝트 오리온"이라는 코드명을 가진 ChatGPT-5는 18개월 동안 개발되었지만 큰 진전을 이루지 못했습니다.
OpenAI는 최소 두 번의 초기 학습 단계를 완료했지만, 예상만큼 좋은 결과를 얻지 못했습니다. 주된 이유 중 하나는 학습 데이터의 다양성과 품질이 충분하지 않기 때문입니다. 공개 인터넷 데이터를 활용하는 데 한계가 있어, OpenAI는 합성 데이터를 생성하거나 인력을 고용하여 데이터를 수동으로 생성하는 등의 대안을 모색해야 했습니다.
GPT-5는 GPT-4보다 133배 더 많은 GPU를 필요로 하며 이는 OpenAI에 어려운 문제가 될 것입니다.
인간이 생성한 데이터는 품질은 더 좋지만 시간과 비용 측면에서 어려움이 따릅니다. 예를 들어, AI 모델이 처리하는 텍스트 단위인 10억 개의 데이터 토큰을 생성하려면 약 1,000명이 하루에 5,000단어씩 몇 달 동안 작성해야 합니다. 반면, 현재 AI 모델로 생성된 합성 데이터를 사용하는 것은 품질에 대한 위험을 수반하며, 비효율적인 데이터 루프를 생성할 위험을 증가시킵니다.
데이터 문제 외에도 ChatGPT-5 학습에는 기술적 어려움이 있었습니다. 초기 테스트 속도가 예상보다 느렸기 때문에 대규모 학습에 더 오랜 시간이 걸리고 비용도 증가할 것입니다. 이는 수십억 달러의 개발 비용이 소요된 GPT-4를 능가하는 모델 개발의 실현 가능성에 대한 의문을 제기합니다.
OpenAI의 내부 불안 또한 프로젝트 진행에 상당한 영향을 미쳤습니다. CEO 샘 알트만은 2023년 말 일시적으로 직위에서 물러났고, 이로 인해 올해 20명 이상의 핵심 인력이 퇴사했습니다. 알트만은 ChatGPT-5 출시가 지연된 주된 이유가 이전 버전의 GPT-4o 출시였다고 시인했습니다.
지연과 비용 증가로 인해 OpenAI는 투자자들, 특히 최대 파트너인 마이크로소프트로부터 엄청난 압박을 받고 있습니다. 이미 AI 산업에 수십억 달러를 투자한 OpenAI는 ChatGPT-5가 이전 모델보다 크게 개선되었음을 입증해야 합니다. 하지만 학습 데이터가 점점 부족해짐에 따라 이 목표는 점점 더 어려워지고 있습니다.
현재 ChatGPT-5의 미래는 불확실합니다. OpenAI는 현재의 과제를 해결하고 AI 기술 경쟁에서 경쟁력을 유지하기 위해 리소스를 최적화할 방법을 찾아야 합니다.
[광고_2]
출처: https://thanhnien.vn/openai-doi-mat-kho-khan-lon-khi-phat-trien-chatgpt-5-1852412232345532.htm
댓글 (0)