페이스북 모회사가 Llama 4 컬렉션에 두 가지 새로운 모델을 발표했습니다. 이 모델은 웹뿐 아니라 WhatsApp, Messenger, Instagram에서도 사용되는 Meta AI 비서에 사용되는 모델과 동일하며, 사용자들이 더욱 개인화된 멀티미디어 경험을 만들 수 있도록 지원합니다.
메타(Meta) 또는 허깅 페이스(Hugging Face)에서 지금 다운로드할 수 있는 두 가지 새로운 모델은 라마 4 스카우트(Llama 4 Scout)와 라마 4 매버릭(Llama 4 Maverick)입니다. 메타는 CEO 마크 저커버그가 " 세계에서 가장 성능이 뛰어난 플랫폼 모델"이라고 언급한 초대형 모델인 라마 4 베히모스(Llama 4 Behemoth)를 아직 훈련 중이라고 밝혔습니다.
Meta에 따르면 Llama 4 Scout는 최대 1천만 개의 토큰을 저장할 수 있는 컨텍스트 윈도우를 가지고 있는데, 이는 현재 가장 많은 토큰을 사용하는 모델인 Gemini보다 몇 배 더 많습니다. 이 숫자는 AI 모델의 작업 메모리를 나타냅니다.
Meta에서는 이 모델이 "단일 Nvidia H100 GPU에서도 실행 가능"하면서도 "많은 인기 있는 공개 벤치마크에서" Google의 Gemma 3와 Gemini 2.0 Flash-Lite, Mistral 3.1보다 우수한 성능을 보인다고 설명합니다.
Llama 4 Maverick의 경우, OpenAI의 GPT-4o 및 Google의 Gemini 2.0 Flash와 비교했을 때 비슷한 성능을 보인다고 회사는 주장합니다. Maverick의 프로그래밍 및 추론 작업은 DeepSeek-V3와 유사하며, 매개변수를 절반 이하로 사용하더라도 마찬가지입니다.
![]() |
Llama 4 컬렉션의 새로운 모델들. 사진: Meta. |
한편, Behemoth는 총 2조 개의 매개변수 중 2,880억 개의 활성 매개변수를 보유하고 있습니다. 아직 출시되지는 않았지만, Meta는 Behemoth가 "여러 STEM 지표"에서 경쟁사(특히 GPT-4.5와 Claude Sonnet 3.7)보다 우수한 성능을 발휘할 수 있다고 밝혔습니다.
Meta는 DeepSeek에 성공적인 결과를 가져온 "전문가 혼합(MoE)" 아키텍처로 전환했다고 밝혔습니다. 이 접근 방식은 특정 작업에 필요한 모델 부분만 활성화하여 리소스를 절약합니다. 제품 계획에 대한 자세한 내용은 4월 29일 열리는 LlamaCon 컨퍼런스에서 발표될 예정입니다.
라이선스 제한에 대한 비판에도 불구하고, Meta는 이전 모델과 마찬가지로 Llama 4를 여전히 "오픈 소스"라고 부릅니다. 예를 들어, Llama 4의 라이선스는 월간 활성 사용자가 7억 명이 넘는 상업 기관이 모델을 사용하기 전에 Meta의 허가를 받도록 규정하고 있습니다.
2023년 오픈소스 이니셔티브에 따르면, 이러한 규제는 "해당 모델을 더 이상 오픈소스로 만들지 않는다."
출처: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html
댓글 (0)