위의 코멘트는 VinBigdata의 최고 제품 책임자(CPO)인 응웬 킴 안(Nguyen Kim Anh) 씨가 VinBigdata가 8월 21일에 성공적으로 개발했다고 발표한 베트남어 모델에 관해 VietNamNet과 대화할 때 한 말입니다. VietNamNet은 독자 여러분께 이 인터뷰 내용을 보내드리고자 합니다.
베트남에서 AI가 현재 어떻게 활용되고 있는지 말씀해 주시겠습니까?
응우옌 킴 안: AI는 최근 몇 년 동안 전 세계 에서 가장 인기 있는 키워드 중 하나입니다. 베트남에서도 여러 포럼에서 이 주제를 논의해 왔습니다. 하지만 현실은 베트남에서 AI를 구현하는 데 있어 자원, 인프라, 전문 인력 등 여러 가지 제약이 여전히 많다는 것을 보여줍니다.
2022년 인공지능(AI) 준비 지수 보고서에 따르면 베트남은 세계 55위, 싱가포르는 2위, 말레이시아는 29위, 태국은 31위를 기록했습니다. 베트남은 AI 연구 및 응용 분야를 더욱 적극적으로 육성해야 할 필요가 있음을 알 수 있습니다.
베트남에는 수학과 공학에 대한 탄탄한 기반을 갖춘 젊은 인력이 많기 때문에 지름길을 택하는 데 많은 이점이 있다고 생각합니다. 이는 반드시 확보해야 할 중요한 장점입니다. 정부와 기업의 지원과 협력을 통해 AI 산업 발전의 잠재력을 빠르게 파악하여 국가의 사회 경제적 발전에 기여할 수 있을 것이라고 믿습니다.
VinBigdata가 최근 출시한 베트남어 모델을 개발하기로 결정한 이유는 무엇입니까?
응우옌 킴 안: 대규모 언어 모델은 Open AI의 ChatGPT나 Google의 Bard와 같은 AI 기반 제품 개발에 탄탄한 기반이 됩니다. 그러나 해외 제품의 경우, 베트남어는 핵심 언어 그룹에 포함되지 않습니다. 이는 사용자에게 제공되는 콘텐츠의 품질에 어느 정도 영향을 미칩니다.
베트남 사람들에 대한 자세한 정보를 요청하는 경우 오류가 발생할 가능성이 매우 높습니다. 더 심각한 것은, 사용자가 이 도구를 사용하여 정보를 검색하고 뉴스를 업데이트할 경우, 향후 베트남 사람들, 특히 젊은층에 대한 기본 지식이 부정확해지는 등의 결과를 초래할 수 있다는 것입니다.
따라서 베트남 사용자의 니즈에 가장 적합한 제품을 개발하고 최상의 서비스를 제공하기 위해서는 대규모 베트남어 모델을 구축하는 것이 필수적입니다. VinBigdata는 처음부터 시장에 서비스를 제공하기 위한 AI 제품을 연구하고 출시하는 데 있어 "데이터"를 핵심이자 가장 중요한 요소로 인식해 왔습니다.
이것이 바로 우리가 대규모 베트남어 언어 모델 구축을 조기에 완료할 수 있는 이유이기도 합니다. ChatGPT처럼 1,750억 개의 매개변수를 사용하는 대신, 우리는 몇 십억 개의 매개변수만 필요합니다. 이는 응용 측면에서뿐만 아니라, 점점 더 많은 사람들이 학습, 작업, 정보 검색 도구로 생성 AI를 사용하는 추세를 고려할 때 사회적으로도 큰 의미가 있습니다.
새로 발표된 베트남어 모델을 VinBigdata에서 어떻게 적용할 예정인가요?
응웬 킴 안(Nguyen Kim Anh) 씨: 기술을 완벽하게 숙지하고, 첫 단계부터 자체 개발하여 대규모 베트남어 모델을 성공적으로 구축한 것은 VinBigdata가 생성적 AI 기술을 시장에 제공되었거나 제공되고 있는 제품 및 서비스 생태계에 도입하는 데 중요한 단계로 간주됩니다.
연구 결과를 실제 업무에 적용하기 위한 구체적인 로드맵을 마련했습니다. 구체적으로 VinBigdata는 소비자를 대상으로 두 가지 버전의 애플리케이션을 출시할 예정입니다. 첫 번째는 기업용이고 두 번째는 커뮤니티용입니다.
VinBigdata는 기업용 버전을 통해 기술을 통합하여 VinBase(종합적 다중 인지 인공지능 플랫폼)를 베트남 최초의 생성적 AI 플랫폼으로 만들며, 생성적 AI 챗봇, 콜봇 또는 차세대 ViVi 가상 비서와 같은 생성적 AI 기술 기반 개발 솔루션을 제공합니다.
이 기술은 기계 의사소통의 자연스러움을 높이는 데 도움이 되는 동시에 사용자가 이전보다 훨씬 빠르고 간편하게 정보를 검색하고 종합할 수 있도록 지원합니다.
현재 VinBigdata는 VinBase KB 제품군(VinBase 지식 기반 포털)에 새로운 기술을 성공적으로 적용했습니다. 이 제품은 지식 시스템의 방대한 데이터 세트에서 수집된 정보를 기반으로 정보를 검색하고 답변을 자동으로 생성하는 기능을 갖추고 있습니다.
저희 계획에 따르면, VinBigdata는 2023년 12월 말까지 "ChatGPT의 베트남어 버전"인 ViGPT 제품을 출시할 예정입니다. 이 제품은 커뮤니티에 무료로 공개되어 접근 및 테스트가 가능합니다. ViGPT를 통해 사용자는 베트남 관련 정보(규정, 법률 문서 등) 또는 특정 성격의 정보(역사, 지리, 문학 등)에 대해 질문하고 답변할 수 있습니다.
이 프로젝트는 지역사회와 사회에 큰 의미를 갖는 프로젝트로, 베트남 국민의 공부와 취업을 효과적으로 지원하는 유용한 도구가 될 것으로 기대됩니다.
VinBigdata는 이 대규모 베트남어 모델을 관심 있는 당사자들과 공유할 계획이 있나요?
응우옌 킴 안: 대규모 베트남어 모델의 성공적인 구축은 VinBigdata뿐만 아니라 베트남 사회와 과학 기술계에도 큰 의미가 있습니다. VinBase 플랫폼은 생성적 AI와 통합되어 있어 기업들이 이 핵심 기술을 자사 브랜드 제품에 적용할 수 있도록 지원합니다.
VinBigdata는 이 모델을 통해 베트남 기업이 AI 기술에 접근하여 당사가 개발한 베트남어 모델에서 성과를 창출하거나 계승할 수 있는 기회가 더 많아지기를 바랍니다.
또한 ViGPT를 사용하면 베트남 사람들은 "베트남어 버전의 ChatGPT"를 갖게 되어 정보 출처를 빠르고 정확하고 안정적으로 검색할 수 있습니다.
생성 AI 개발 시 보안과 저작권은 중요한 요소입니다. 새로 출시된 베트남어 모델을 통해 VinBigdata는 이 문제를 어떻게 해결했습니까?
응우옌 킴 안(Nguyen Kim Anh) 씨: 빅데이터 및 인공지능 연구 기관인 VinBigdata는 엄격한 프로세스 개발과 데이터 보안 규정의 철저한 준수를 통해 데이터의 기밀성을 항상 존중합니다. 특히 사용자의 권리를 보장하기 위해 VinBigdata는 특히 개인 소유 데이터의 경우 데이터 수집 및 사용 과정에서 투명성을 확보하기 위해 노력합니다.
동시에, 저희는 정보 유출을 방지하기 위해 다층 보안 조치, 엄격한 데이터 수명 주기 관리 프로세스, 그리고 적절한 데이터 사용 권한(누가 어떤 데이터에 접근하고 사용할 권리가 있는지)을 구축하는 데 항상 적극적으로 노력하고 있습니다. 또한 전 세계와 베트남에는 데이터 보안 관련 규정과 표준이 있으며, VinBigdata는 이러한 원칙을 항상 준수합니다.
최근 생성 AI의 급속한 발전으로 저작권 문제 또한 골치 아픈 문제로 떠올랐습니다. VinBigdata는 이러한 점을 인지하고, 잘못된 정보를 퍼뜨리기보다는 각 분야에 특화된 베트남 현지 맞춤형 정보를 제공하는 방향으로 제품 개발에 집중하고 있습니다.
이러한 초기 지향성 덕분에 VinBigdata는 금융, 은행업, 법률, 의학 등 특정 전문 분야에서 ChatGPT보다 더 정확한 지식을 제공하는 제품을 자신 있게 만들 수 있으며, 역사, 지리, 문학 등 베트남 고유의 정보도 제공할 수 있습니다.
귀하의 의견으로는, 베트남에서 AI를 실제로 적용할 때가 되었다고 생각하십니까?
응우옌 킴 안 씨: 인공지능 경쟁에서 우리는 더욱 박차를 가해야 한다고 생각합니다. 세계 주요 국가와 기업들이 이미 우리보다 어느 정도 앞서 있기 때문입니다.
현재 베트남은 AI를 실질적으로 많이 도입하지 않았으며 아직 초기 단계에 있다고 할 수 있습니다.
하지만 저는 베트남의 고품질 AI 인력과 모든 계층의 노력과 협력이 결합된다면, 우리가 도약할 수 있는 기회를 잡을 수 있다고 믿습니다!
[광고_2]
원천
댓글 (0)