VinBigdata는 8월 21일에 대규모 베트남어 모델의 성공적인 구축을 발표했으며, 이를 통해 생성적 AI 기술을 숙달할 수 있는 기반을 마련했습니다.
대규모 언어 모델(LLM)은 방대한 텍스트 또는 이미지 집합을 기반으로 딥러닝 기법을 사용하여 학습된 모델입니다. 이 모델은 지식을 이해하고, 텍스트를 생성하고, 다양한 자연어 처리 작업을 수행할 수 있습니다. 이는 텍스트, 이미지, 사운드 등 다양한 형태로 새로운 콘텐츠와 아이디어를 생성할 수 있는 생성적 AI 기술 개발의 핵심으로 여겨집니다.
VinBigdata는 대규모 베트남어 모델을 성공적으로 구축한 데 이어, VinBase(종합적 다중 인지 인공 지능 플랫폼)를 베트남의 생성형 AI 플랫폼으로 만드는 기술을 통합하고, 생성형 AI 챗봇, 콜봇, 차세대 ViVi 가상 비서 등 이 기술을 기반으로 한 개발 솔루션을 제공할 예정입니다. 이 기술은 기계와의 자연스러운 소통을 높이는 데 도움이 되며, 사용자가 이전보다 더 빠르고 간편하게 정보를 검색하고 종합할 수 있도록 지원합니다.
Vu Ha Van 교수 - VinBigdata Company의 과학 책임자. 사진: VinBigdata
VinBigdata Company의 과학 책임자인 부 하 반(Vu Ha Van) 교수는 전 세계적으로 OpenAI의 ChatGPT나 Google의 Bard처럼 대규모 언어 모델을 기반으로 제품을 성공적으로 연구하고 출시한 대기업들이 많다고 말했습니다. 베트남에서는 VinBigdata가 Vingroup의 투자를 받아 대규모 베트남어 언어 모델을 구축하고 있습니다. 반 교수에 따르면, 이 모델은 정확도 향상, 인프라 비용 절감, 보안 강화라는 세 가지 핵심 문제 해결에 중점을 두고 있습니다.
"VinBigdata는 ChatGPT와 같이 약 1,750억 개의 매개변수가 필요하지 않고, 수십억 개의 매개변수를 갖는 대규모 언어 모델을 만들 수 있으며, 베트남어 데이터와 베트남어 지식에 초점을 맞춰 매우 신뢰할 수 있는 문서를 생성할 수 있는 기능을 갖추고 있습니다."라고 해당 부서의 리더가 말했습니다.
기술을 완벽하게 숙달하고, 처음부터 자체 개발하며, 대규모 베트남어 모델을 구축한 것은 VinBigdata가 생성적 AI 기술을 시장의 제품 및 서비스 생태계에 도입하는 데 있어 한 걸음 더 나아간 것으로 평가됩니다. 현재 VinBigdata는 VinBase KB 제품군(VinBase 지식 기반 포털)에 새로운 기술을 최초로 적용했습니다. 이 제품은 지식 시스템의 방대한 데이터 세트에서 수집된 정보를 기반으로 정보를 검색하고 답변을 자동으로 생성하는 기능을 갖추고 있습니다.
VinBigdata 담당자가 생성 AI를 발표하는 행사에 참석했습니다. 사진: VinBigdata
올해 12월, 빈그룹(Vingroup) 회원사들은 VinBase2.0과 ViGPT 애플리케이션이라는 두 가지 주요 제품군을 출시할 예정입니다. VinBase 2.0은 기업과 정부 기관에 다양한 관점을 제시하는 AI 플랫폼입니다. 한편, 빈그룹은 ViGPT 애플리케이션을 "베트남 버전의 ChatGPT"로 소개하며, 커뮤니티의 접근 및 테스트에 개방했습니다. ViGPT를 통해 사용자는 베트남의 특정 정보(규정, 법률 문서) 또는 지역 정보(역사, 문학, 명승지, 지역 특산품)에 대해 질문하고 답변할 수 있습니다.
VinBigdata 주식회사는 최대 3,500테라바이트 규모의 데이터베이스 시스템을 보유하고 있습니다. 이 시스템은 수십만 시간 분량의 음성 데이터, 이미지 및 정보를 정제, 처리, 분류하여 AI 훈련 및 R&D 인프라에 활용합니다. 이 인프라에는 수십 개의 NvidiaDGX A100 서버 클러스터가 포함되어 있습니다. 또한, 이 회사는 전 세계 베트남 출신 교수, 과학자, 기술 전문가들로 구성된 팀을 보유하고 있습니다.
호아이 푸옹
[광고_2]
소스 링크






댓글 (0)