DeepMind는 텍스트로부터 몰입형 3D 가상 세계를 생성할 수 있는 AI 모델인 Genie 3를 출시하여 미래의 일반 인공 지능의 길을 열었습니다.
Báo Khoa học và Đời sống•15/08/2025
Genie 3는 사용자가 단 한 줄의 텍스트로 실시간 대화형 3D 환경을 만들 수 있는 DeepMind의 새로운 세계 모델입니다. 기존의 AI 비디오 와 달리 Genie 3는 720p, 24fps 프레임 속도와 일관된 물리 법칙을 적용해 게임처럼 플레이할 수 있는 가상 세계를 만들어냅니다.
이 모델은 자체 피드백 아키텍처를 사용하여 전체 기록을 기억하고 환경의 다음 진화를 예측합니다. 엄격한 물리 엔진이 없기 때문에 Genie 3는 사람이 테이블에서 유리잔이 떨어지는 것을 지켜보듯이 세상이 어떻게 작동하는지 학습합니다.
테스트에서 Genie 3는 SIMA와 결합하여 AI가 특정 객체로 이동하는 것과 같은 복잡한 작업을 수행하는 데 도움이 됩니다. DeepMind는 시뮬레이션 환경에서의 경험과 반성을 통해 구체화된 AI를 훈련시키는 전략적 도구라고 말합니다. Genie 3는 지속 시간과 다중 에이전트 상호 작용 측면에서 아직 제한적이기는 하지만 미래 AGI의 중요한 기반이 될 것입니다.
전문가에 따르면 이 기술은 교육 , 콘텐츠 제작, 훈련, 자율 로봇 분야에 널리 적용될 것으로 보인다. 독자 여러분, 더 많은 영상을 시청해 주세요: 인간형 로봇 혁명의 돌파구 | VTV24
댓글 (0)