VinBigdata는 8월 21일 베트남어 빅 언어 모델 개발에 성공했다고 발표하며, AI 생성 기술 습득을 위한 기반을 마련했다고 밝혔습니다.
대규모 언어 모델(LLM)은 방대한 텍스트 또는 이미지 데이터셋을 사용하여 딥러닝 기술로 학습된 모델입니다. 이러한 모델은 지식을 이해하고, 텍스트를 독립적으로 생성하며, 다양한 자연어 처리 작업을 수행할 수 있습니다. LLM은 다양한 형태(텍스트, 이미지, 오디오 등)로 새로운 콘텐츠와 아이디어를 창출할 수 있는 생성형 인공지능 기술 개발의 핵심으로 여겨집니다.
VinBigdata는 대규모 베트남어 모델 개발에 성공하여, 기술을 통합해 VinBase(종합 다중 인지 인공지능 플랫폼)를 베트남 최고의 AI 생성 플랫폼으로 만들고, 이 기술을 기반으로 개발된 생성형 AI 챗봇, 콜봇, 차세대 가상 비서 ViVi 등의 솔루션을 제공할 예정입니다. 이 기술은 기계와의 소통을 더욱 자연스럽게 만들어 사용자가 이전보다 더 빠르고 쉽게 정보를 검색하고 종합할 수 있도록 지원합니다.
부 하 반 교수 - VinBigdata 회사 과학 책임자. 사진: VinBigdata
VinBigdata의 과학 책임자인 Vu Ha Van 교수는 전 세계 여러 대기업들이 OpenAI의 ChatGPT, Google의 Bard와 같이 빅 언어 모델 기반 제품을 성공적으로 연구 및 출시했다고 밝혔습니다. 베트남에서는 Vingroup 이 VinBigdata를 통해 베트남어 빅 언어 모델을 구축하고 있습니다. Van 교수에 따르면, 이 모델은 정확도 향상, 인프라 비용 절감, 보안 확보라는 세 가지 핵심 문제를 해결하는 데 중점을 두고 있습니다.
"ChatGPT처럼 약 1750억 개의 매개변수가 필요한 대신, VinBigdata는 베트남어 데이터와 지식에 초점을 맞춰 수십억 개의 매개변수만으로도 매우 사실적인 텍스트를 생성할 수 있는 대규모 언어 모델을 만들 수 있습니다."라고 해당 부서 책임자는 말했다.
VinBigdata는 인공지능 생성 기술을 자사 제품 및 서비스 생태계에 통합하기 위해 기술 습득, 초기 개발, 그리고 대규모 베트남어 모델 구축을 중요한 단계로 여기고 있습니다. 현재 VinBigdata는 이 신기술을 자사의 VinBase KB(VinBase 지식 기반 포털) 제품 라인에 초기 적용하고 있습니다. 이 제품은 방대한 지식 기반 데이터에서 수집된 정보를 기반으로 정보를 검색하고 자동으로 답변을 생성할 수 있습니다.
VinBigdata의 담당자들이 AI 세대 출범 행사에서 이 정보를 공유했습니다. 사진: VinBigdata
Vingroup은 오는 12월 VinBase 2.0과 ViGPT 애플리케이션이라는 두 가지 주요 제품 라인을 출시할 예정입니다. VinBase 2.0은 기업 및 정부 기관을 위한 솔루션을 제공하는 다중 인지 기반 응답 생성 AI 플랫폼입니다. 한편, 회사에서 "ChatGPT의 베트남 버전"으로 소개한 ViGPT 애플리케이션은 커뮤니티 접근 및 테스트를 위해 공개될 예정입니다. ViGPT를 통해 사용자는 베트남 관련 정보(법규, 법률 문서) 또는 지역 정보(역사, 문학, 관광 명소, 지역 특산물)에 대한 질문을 하고 답변을 얻을 수 있습니다.
VinBigdata 주식회사는 최대 3,500테라바이트 규모의 데이터베이스 시스템을 보유하고 있습니다. 이 시스템에는 수십만 시간 분량의 음성 데이터, 이미지, 정보가 저장되어 있으며, 이러한 데이터는 정제, 처리, 분류 과정을 거쳐 AI 학습 및 연구 개발 인프라에 활용됩니다. 연구 개발 인프라에는 수십 개의 Nvidia DGX A100 서버 클러스터가 포함되어 있습니다. 또한, VinBigdata는 베트남 교수진, 과학자, 그리고 전 세계에서 온 기술 전문가들로 구성된 팀을 자랑합니다.
호아이 푸옹
[광고_2]
출처 링크






댓글 (0)