x5p2qoem.png
소라가 만든 장면. (이미지: OpenAI)

Sora는 OpenAI의 새로운 AI 영상 생성 모델로, 같은 회사의 이미지 생성 도구인 Dal-E와 유사합니다. 사용자는 영상 콘텐츠를 입력하기만 하면 Sora가 고품질 영상 클립을 생성합니다. 또한, 정지 이미지를 영상으로 변환하거나, 기존 영상을 확장하거나, 빈 프레임을 채우는 등의 작업도 가능합니다.

챗봇과 이미지 생성기가 현실 세계에 침투하면서 영상은 인공지능(AI) 확산의 차세대 핵심 분야가 될 수 있습니다. AI 애호가들에게는 환영받는 이러한 신기술이지만, 전 세계적으로 주요 정치 선거가 다가옴에 따라 허위 정보 유포에 대한 심각한 우려도 제기되고 있습니다. 머신러닝 기업 클래리티(Clarity)의 데이터에 따르면 AI로 생성된 딥페이크 영상의 수는 전년 대비 900% 증가했습니다.

오픈아이는 소라를 통해 메타, 구글, 그리고 스태빌리티 AI 같은 스타트업의 AI 비디오 제작 도구들과 경쟁하려 합니다. 아마존 또한 음성 명령에 따라 어린이용 단편 애니메이션 콘텐츠를 제작하는 모델인 알렉사와 함께하는 창작(Create with Alexa)을 출시했습니다.

Sora는 현재 1분 이하의 동영상만 제작할 수 있습니다. 보안 취약점을 찾기 위해 이 모델을 사용할 수 있는 팀은 소수에 불과하며, 이를 '레드팀'이라고 부릅니다. OpenAI는 웹사이트에 공개된 10개의 샘플 영상 외에는 어떠한 공개 데모도 제공하지 않았습니다.

OpenAI는 Sora에서 제작한 비디오 클립을 식별할 수 있는 분류기를 개발 중이며, AI 생성 콘텐츠를 식별하는 데 도움이 되도록 특정 메타데이터를 출력에 통합할 계획입니다. 이러한 노력은 Meta가 AI 생성 이미지를 식별하기 위해 진행하는 작업과 유사합니다.

Sora는 ChatGPT와 마찬가지로 2017년 Google 연구원들이 논문에서 소개한 Transformer 아키텍처를 사용합니다.

(CNBC에 따르면)