این محصول به سرعت در جامعه علم و فناوری ویتنام سر و صدا به پا کرد.
انتخاب مسیر دشوار برای حل مشکل ویتنام
در پایان سال ۲۰۲۲، ChatGPT یک "انفجار بزرگ" ایجاد کرد و رقابتی را برای فتح هوش مصنوعی مصنوعی در بین کشورها و غولهای حوزه فناوری آغاز کرد. در آن زمان، جامعه فناوری ویتنام نیز مشتاق توسعه محصولات ویتنامی برای خودکفایی در فناوری و کاهش وابستگی به محصولات بینالمللی بود. با این حال، هر واحدی توانایی و عزم لازم برای تحقق این آرزو مانند VinBigdata را ندارد.
«هوش مصنوعی مولد یک مشکل دشوار است. شرکتهای بزرگی مانند OpenAI یا گوگل نیز باید منابع و زمان زیادی را صرف تحقیق کنند تا بتوانند محصولاتی مانند آنچه میبینیم ایجاد کنند. این محصولات بسیار خوب هستند، اما در واقع، دانشمندان هنوز مکانیسم عملکرد آن را به طور کامل درک نکردهاند. اینکه چه زمانی خطا دارد و این خطاها چه خواهند بود، کمتر کسی میتواند پیشبینی کند. برای توسعه محصولی مشابه ChatGPT برای مردم ویتنام، در مدت زمان کوتاهی کمتر از یک سال، چالشهای زیادی وجود دارد. اما ما تصمیم گرفتیم «ریسک» کنیم زیرا اگر نسخه ویتنامی ChatGPT توسط مردم ویتنام ساخته نشود، چه کسی آن را خواهد ساخت؟» - پروفسور وو ها ون - مدیر علوم VinBigdata به اشتراک گذاشت.
در واقع، شرکتهای بسیار کمی تصمیم میگیرند مدلهای زبان بزرگ خود را از ابتدا بسازند. به عنوان مثال، GPT 3 شرکت OpenAI دارای ۱۷۵ میلیارد پارامتر است و با یک مجموعه داده ۴۵ ترابایتی آموزش دیده و ۴.۶ میلیون دلار هزینه داشته است. طبق محاسبات، میزان بودجه برای توسعه GPT 4 حتی میتواند به ۱۰۰ میلیون دلار برسد. دکتر نگوین کیم آنه - مدیر محصول VinBigdata - گفت: «با چنین اعداد عظیمی، یافتن شرکتی که بتواند از عهده سرمایهگذاری در این فناوری برآید، بسیار دشوار است.»
برای اینکه کسبوکارهای ویتنامی بتوانند به فناوری هوش مصنوعی نسل جدید، با هزینهها و زیرساختهای بهینه، دسترسی پیدا کنند، VinBigdata مسیر کاملاً متفاوتی را انتخاب کرد، یعنی ایجاد یک مدل زبانی با تنها ۱.۶ میلیارد پارامتر، اما با قابلیتهایی معادل مدلهای زبانی بزرگ با میلیاردها پارامتر. دکتر نگوین کیم آنه افزود: «نتایج نشان میدهد که با معماری توسعهیافته توسط خود VinBigdata، بهینهسازی و تسریع فرآیند آموزش مدل زبانی، کاهش هزینههای زیرساخت (از جمله هزینههای آموزش و هزینههای استفاده) کاملاً امکانپذیر است، اما همچنان کیفیت مدل تضمین میشود.»
پس از حل مشکل اندازه بزرگ مدل زبانی، در طول فرآیند «ایده پردازی» ViGPT، پس از تحقیق در مورد مدلهای خارجی، تیم VinBigdata همچنین به چالش دیگری به نام «توهم» پی برد که از ماهیت ذاتی مدلهای احتمال آماری ناشی میشود.
بر این اساس، بزرگترین مدلهای زبانی جهان اغلب با منابع داده انگلیسی آموزش میبینند. بنابراین، این مدل واقعاً بافت و فرهنگ مردم ویتنام را درک نمیکند و به درستی به آن پاسخ نمیدهد. این امر منجر به توهماتی میشود که باعث میشود مدلهای زبانی بزرگ پاسخهای نادرستی «بسازند».
برای یافتن راهحل بهینه در کوتاهترین زمان، تیم پردازش زبان طبیعی (NLP) وینبیگدیتا به گروههای کوچک تقسیم شده و با تجزیه و تحلیل و بحث در مورد ایدههای مختلف، مناسبترین مسیر نهایی را پیدا میکنند.
دکتر نگوین کیم آنه افزود: «در نهایت، ما تصمیم گرفتیم معماری متفاوتی از اکثر مدلهای زبانی بزرگ فعلی توسعه دهیم و آموزش را روی یک مجموعه داده ویتنامی با حجم ۶۰۰ گیگابایت انجام دهیم تا یک «دستیار مجازی هوشمند» ایجاد کنیم که بتواند زبان مردم ویتنام را بفهمد و بر اساس شرایط آنها پاسخ دهد.»
آرمان برای یک اکوسیستم فناوری ویتنامی
طبق نتایج ارزیابی استانداردهای ارزیابی مهارت زبان ویتنامی (VMLU)، ViGPT میانگین امتیاز ۴۲.۲۴٪ را کسب کرد که پس از ChatGPT (۴۸.۵۴٪) در رتبه دوم قرار دارد. این نتیجه به ViGPT اجازه میدهد تا به سرعت اطلاعات را جستجو کرده و به سؤالات مربوط به موضوعات خاص ویتنام پاسخ دهد.
علاوه بر قابلیتهای دستیار مجازی، تیم توسعهدهنده تمایل دارد ViGPT را در محصولات آشنا و روزمره ادغام کند تا تغییراتی در زندگی مردم ویتنام ایجاد کند. این نیروی محرکهای است که تیم VinBigdata را برای ایجاد اکوسیستمی از محصولات زبانی و صوتی که ViGPT را به کار میگیرند، ترغیب میکند - اکوسیستم "Vi" شامل موارد زیر است: ViChat، ViVoice، دستیار مجازی ViVi. این محصولات میتوانند در بسیاری از صنایع، از صنعت خودرو، بانکداری - امور مالی، بیمه گرفته تا حمل و نقل و بسیاری از زمینههای دیگر، مورد استفاده قرار گیرند.
مدیر محصول VinBigdata تأیید کرد: «هنگام کار با فناوری، به ویژه هوش مصنوعی، ما فقط نمیخواهیم سیستمهای جالب، پیچیده و دشوار را فتح کنیم. ما میخواهیم محصولات ملموس و بسیار کاربردی ایجاد کنیم، جایی که هوش مصنوعی عامل مستقیمی است که در زندگی تغییر ایجاد میکند.»
بنابراین، توسعه موفقیتآمیز ViGPT تنها اولین گام در مسیر ارائه فناوری و دادههای «کاملاً ویتنامی» برای خدمت به زندگی میلیونها ویتنامی است. نماینده VinBigdata گفت که این واحد با هدف ادغام ViGPT در پلتفرم هوش مصنوعی چندشناختی VinBase 2.0، راهکارهای برجستهای را برای سازمانها و مشاغل با اندازهها و صنایع مختلف ارائه میدهد.
پیش از ViGPT، تیم متخصصان و مهندسان VinBigdata در حوزه فناوری پردازش زبان و گفتار، با راهاندازی ViVi - اولین دستیار مجازی جامع ویتنامی (که در خودروهای برقی VinFast ، برنامههای Vinhomes Resident و پلتفرم تجارت الکترونیک Vinhomes Online اعمال و مستقر شده است) و در عین حال تسلط کامل بر پیشرفتهترین فناوریهای جهان مانند بیومتریک صدا یا شبیهسازی صدا، جایگاه خود را تثبیت کردند.
همه این فناوریها بر اساس یک پایگاه داده ۳۵۰۰ ترابایتی توسعه یافتهاند که عمدتاً بر دادههای خاص ویتنامی متمرکز هستند و توسط VinBigdata جمعآوری، تجزیه و تحلیل و پالایش میشوند. هدف نهایی، آوردن فناوری جهانی به زندگی ویتنامیها، با استفاده از دادهها و سیستمهای دانش ویتنامی است.
ViGPT اولین «نسخه ویتنامی ChatGPT» برای کاربران نهایی است که بر اساس مدل زبان بزرگ ویتنامی (LLM) توسعهیافته توسط VinBigdata ساخته شده است. ViGPT دارای ویژگیهای برجستهای است و به گونهای طراحی شده است که به بهترین نحو نیازهای مردم ویتنام مانند تولید محتوا، جستجوی اطلاعات و پاسخ به سوالات رایج با ویژگیهای ویتنامی را برآورده کند. در ViGPT ثبت نام کنید و از آن استفاده کنید: vigpt.vinbigdata.com |
تان ها
منبع
نظر (0)