«نسخه ویتنامی ChatGPT» و داستان پیشگام آن

این محصول به سرعت در جامعه علم و فناوری ویتنام سر و صدا به پا کرد.

انتخاب مسیر دشوار برای حل مشکل ویتنام

در پایان سال ۲۰۲۲، ChatGPT یک "انفجار بزرگ" ایجاد کرد و رقابتی را برای فتح هوش مصنوعی مصنوعی در بین کشورها و غول‌های حوزه فناوری آغاز کرد. در آن زمان، جامعه فناوری ویتنام نیز مشتاق توسعه محصولات ویتنامی برای خودکفایی در فناوری و کاهش وابستگی به محصولات بین‌المللی بود. با این حال، هر واحدی توانایی و عزم لازم برای تحقق این آرزو مانند VinBigdata را ندارد.

«هوش مصنوعی مولد یک مشکل دشوار است. شرکت‌های بزرگی مانند OpenAI یا گوگل نیز باید منابع و زمان زیادی را صرف تحقیق کنند تا بتوانند محصولاتی مانند آنچه می‌بینیم ایجاد کنند. این محصولات بسیار خوب هستند، اما در واقع، دانشمندان هنوز مکانیسم عملکرد آن را به طور کامل درک نکرده‌اند. اینکه چه زمانی خطا دارد و این خطاها چه خواهند بود، کمتر کسی می‌تواند پیش‌بینی کند. برای توسعه محصولی مشابه ChatGPT برای مردم ویتنام، در مدت زمان کوتاهی کمتر از یک سال، چالش‌های زیادی وجود دارد. اما ما تصمیم گرفتیم «ریسک» کنیم زیرا اگر نسخه ویتنامی ChatGPT توسط مردم ویتنام ساخته نشود، چه کسی آن را خواهد ساخت؟» - پروفسور وو ها ون - مدیر علوم VinBigdata به اشتراک گذاشت.

در واقع، شرکت‌های بسیار کمی تصمیم می‌گیرند مدل‌های زبان بزرگ خود را از ابتدا بسازند. به عنوان مثال، GPT 3 شرکت OpenAI دارای ۱۷۵ میلیارد پارامتر است و با یک مجموعه داده ۴۵ ترابایتی آموزش دیده و ۴.۶ میلیون دلار هزینه داشته است. طبق محاسبات، میزان بودجه برای توسعه GPT 4 حتی می‌تواند به ۱۰۰ میلیون دلار برسد. دکتر نگوین کیم آنه - مدیر محصول VinBigdata - گفت: «با چنین اعداد عظیمی، یافتن شرکتی که بتواند از عهده سرمایه‌گذاری در این فناوری برآید، بسیار دشوار است.»

برای اینکه کسب‌وکارهای ویتنامی بتوانند به فناوری هوش مصنوعی نسل جدید، با هزینه‌ها و زیرساخت‌های بهینه، دسترسی پیدا کنند، VinBigdata مسیر کاملاً متفاوتی را انتخاب کرد، یعنی ایجاد یک مدل زبانی با تنها ۱.۶ میلیارد پارامتر، اما با قابلیت‌هایی معادل مدل‌های زبانی بزرگ با میلیاردها پارامتر. دکتر نگوین کیم آنه افزود: «نتایج نشان می‌دهد که با معماری توسعه‌یافته توسط خود VinBigdata، بهینه‌سازی و تسریع فرآیند آموزش مدل زبانی، کاهش هزینه‌های زیرساخت (از جمله هزینه‌های آموزش و هزینه‌های استفاده) کاملاً امکان‌پذیر است، اما همچنان کیفیت مدل تضمین می‌شود.»

پس از حل مشکل اندازه بزرگ مدل زبانی، در طول فرآیند «ایده پردازی» ViGPT، پس از تحقیق در مورد مدل‌های خارجی، تیم VinBigdata همچنین به چالش دیگری به نام «توهم» پی برد که از ماهیت ذاتی مدل‌های احتمال آماری ناشی می‌شود.

بر این اساس، بزرگترین مدل‌های زبانی جهان اغلب با منابع داده انگلیسی آموزش می‌بینند. بنابراین، این مدل واقعاً بافت و فرهنگ مردم ویتنام را درک نمی‌کند و به درستی به آن پاسخ نمی‌دهد. این امر منجر به توهماتی می‌شود که باعث می‌شود مدل‌های زبانی بزرگ پاسخ‌های نادرستی را «بسازند».

برای یافتن راه‌حل بهینه در کوتاه‌ترین زمان، تیم پردازش زبان طبیعی (NLP) وین‌بیگ‌دیتا به گروه‌های کوچک تقسیم شده و با تجزیه و تحلیل و بحث در مورد ایده‌های مختلف، مناسب‌ترین مسیر نهایی را پیدا می‌کنند.

دکتر نگوین کیم آنه افزود: «در نهایت، ما تصمیم گرفتیم معماری متفاوتی از اکثر مدل‌های زبانی بزرگ فعلی توسعه دهیم و آموزش را روی یک مجموعه داده ویتنامی با حجم ۶۰۰ گیگابایت انجام دهیم تا یک «دستیار مجازی هوشمند» ایجاد کنیم که بتواند زبان مردم ویتنام را بفهمد و بر اساس شرایط آنها پاسخ دهد.»

آرمان برای یک اکوسیستم فناوری ویتنامی

طبق نتایج ارزیابی استانداردهای ارزیابی مهارت زبان ویتنامی (VMLU)، ViGPT میانگین امتیاز ۴۲.۲۴٪ را کسب کرد که پس از ChatGPT (۴۸.۵۴٪) در رتبه دوم قرار دارد. این نتیجه به ViGPT اجازه می‌دهد تا به سرعت اطلاعات را جستجو کرده و به سؤالات مربوط به موضوعات خاص ویتنام پاسخ دهد.

علاوه بر قابلیت‌های دستیار مجازی، تیم توسعه‌دهنده تمایل دارد ViGPT را در محصولات آشنا و روزمره ادغام کند تا تغییراتی در زندگی مردم ویتنام ایجاد کند. این نیروی محرکه‌ای است که تیم VinBigdata را برای ایجاد اکوسیستمی از محصولات زبانی و صوتی که ViGPT را به کار می‌گیرند، ترغیب می‌کند - اکوسیستم "Vi" شامل موارد زیر است: ViChat، ViVoice، دستیار مجازی ViVi. این محصولات می‌توانند در بسیاری از صنایع، از صنعت خودرو، بانکداری - امور مالی، بیمه گرفته تا حمل و نقل و بسیاری از زمینه‌های دیگر، مورد استفاده قرار گیرند.

مدیر محصول VinBigdata تأیید کرد: «هنگام کار با فناوری، به ویژه هوش مصنوعی، ما فقط نمی‌خواهیم سیستم‌های جالب، پیچیده و دشوار را فتح کنیم. ما می‌خواهیم محصولات ملموس و بسیار کاربردی ایجاد کنیم، جایی که هوش مصنوعی عامل مستقیمی است که در زندگی تغییر ایجاد می‌کند.»

بنابراین، توسعه موفقیت‌آمیز ViGPT تنها اولین گام در مسیر ارائه فناوری و داده‌های «کاملاً ویتنامی» برای خدمت به زندگی میلیون‌ها ویتنامی است. نماینده VinBigdata گفت که این واحد با هدف ادغام ViGPT در پلتفرم هوش مصنوعی چندشناختی VinBase 2.0، راهکارهای برجسته‌ای را برای سازمان‌ها و مشاغل با اندازه‌ها و صنایع مختلف ارائه می‌دهد.

پیش از ViGPT، تیم متخصصان و مهندسان VinBigdata در حوزه فناوری پردازش زبان و گفتار، با راه‌اندازی ViVi - اولین دستیار مجازی جامع ویتنامی (که در خودروهای برقی VinFast ، برنامه‌های Vinhomes Resident و پلتفرم تجارت الکترونیک Vinhomes Online اعمال و مستقر شده است) و در عین حال تسلط کامل بر پیشرفته‌ترین فناوری‌های جهان مانند بیومتریک صدا یا شبیه‌سازی صدا، جایگاه خود را تثبیت کردند.

همه این فناوری‌ها بر اساس یک پایگاه داده ۳۵۰۰ ترابایتی توسعه یافته‌اند که عمدتاً بر داده‌های خاص ویتنامی متمرکز هستند و توسط VinBigdata جمع‌آوری، تجزیه و تحلیل و پالایش می‌شوند. هدف نهایی، آوردن فناوری جهانی به زندگی ویتنامی‌ها، با استفاده از داده‌ها و سیستم‌های دانش ویتنامی است.

ViGPT اولین «نسخه ویتنامی ChatGPT» برای کاربران نهایی است که بر اساس مدل زبان بزرگ ویتنامی (LLM) توسعه‌یافته توسط VinBigdata ساخته شده است. ViGPT دارای ویژگی‌های برجسته‌ای است و به گونه‌ای طراحی شده است که به بهترین نحو نیازهای مردم ویتنام مانند تولید محتوا، جستجوی اطلاعات و پاسخ به سوالات رایج با ویژگی‌های ویتنامی را برآورده کند. در ViGPT ثبت نام کنید و از آن استفاده کنید: vigpt.vinbigdata.com

تان ها

منبع