شرکت VinBigdata در ۲۱ آگوست از ساخت موفقیتآمیز یک مدل بزرگ زبان ویتنامی خبر داد که پایه و اساسی برای تسلط بر فناوری هوش مصنوعی مولد ایجاد میکند.
مدلهای زبان بزرگ (LLM) مدلهایی هستند که با استفاده از تکنیکهای یادگیری عمیق روی مجموعه دادههای عظیم متنی یا تصویری آموزش داده میشوند. این مدلها قادر به درک دانش، تولید متن و انجام وظایف مختلف پردازش زبان طبیعی هستند. آنها کلید توسعه فناوری هوش مصنوعی مولد (Generative AI) محسوب میشوند - که قادر به تولید محتوا و ایدههای جدید در اشکال مختلف (متن، تصاویر، صدا و غیره) است.
با ساخت موفقیتآمیز یک مدل بزرگ زبان ویتنامی، VinBigdata فناوری را برای تبدیل VinBase (یک پلتفرم جامع هوش مصنوعی چندشناختی) به یک پلتفرم هوش مصنوعی مولد در ویتنام ادغام خواهد کرد، ضمن اینکه راهحلهای توسعهای مبتنی بر این فناوری مانند چتبات هوش مصنوعی مولد، کالبات یا دستیار مجازی نسل جدید ViVi را ارائه میدهد... این فناوری به افزایش طبیعی بودن ارتباط ماشینی کمک میکند، در حالی که از کاربران برای جستجو و ترکیب اطلاعات سریعتر و سادهتر از قبل پشتیبانی میکند.
پروفسور وو ها ون - مدیر علمی شرکت VinBigdata. عکس: VinBigdata
پروفسور وو ها وان - مدیر علوم شرکت VinBigdata - گفت که در جهان، تعدادی شرکت بزرگ وجود داشتهاند که با موفقیت محصولات مبتنی بر مدلهای زبانی بزرگ مانند OpenAI با ChatGPT یا Google با Bard را تحقیق و عرضه کردهاند. در ویتنام، VinBigdata توسط Vingroup برای ساخت یک مدل زبانی بزرگ ویتنامی سرمایهگذاری شده است. به گفته آقای وان، این مدل بر حل سه مشکل اصلی از جمله بهبود دقت، کاهش هزینههای زیرساخت و تضمین امنیت تمرکز دارد.
رهبر این واحد گفت: «به جای نیاز به حدود ۱۷۵ میلیارد پارامتر مانند ChatGPT، VinBigdata میتواند یک مدل زبانی بزرگ با چندین میلیارد پارامتر ایجاد کند، اما همچنان توانایی تولید اسناد بسیار معتبر را با تمرکز بر دادههای ویتنامی و دانش ویتنامی دارد.»
تسلط بر فناوری، خودسازی از همان گامهای اول، و ساخت یک مدل بزرگ زبان ویتنامی، گامی رو به جلو برای کمک به VinBigdata در جهت ورود فناوری هوش مصنوعی مولد به اکوسیستم محصولات و خدمات موجود در بازار محسوب میشود. در حال حاضر، این شرکت در ابتدا فناوری جدیدی را در خط تولید VinBase KB (پورتال پایگاه دانش VinBase) به کار گرفته است. این محصول توانایی بازیابی اطلاعات و تولید خودکار پاسخها بر اساس اطلاعات جمعآوریشده از مجموعه دادههای بسیار بزرگ در سیستم دانش را دارد.
نماینده VinBigdata در مراسم معرفی Generative AI مطالبی را به اشتراک گذاشت. عکس: VinBigdata
انتظار میرود که در دسامبر امسال، اعضای Vingroup دو خط تولید اصلی را راهاندازی کنند: VinBase2.0 و اپلیکیشن ViGPT. VinBase 2.0 یک پلتفرم هوش مصنوعی است که با ارائه راهکارهایی برای کسبوکارها و سازمانهای دولتی ، ادراکات چندگانهای ایجاد میکند. در همین حال، اپلیکیشن ViGPT توسط این شرکت به عنوان "نسخه ویتنامی ChatGPT" معرفی شده است که برای دسترسی و آزمایش عموم در دسترس است. با ViGPT، کاربران میتوانند در مورد اطلاعات خاص درباره ویتنام (مقررات، اسناد قانونی) یا اطلاعات محلی (تاریخ، ادبیات، نقاط دیدنی، غذاهای محلی) سؤال بپرسند و به آنها پاسخ دهند.
شرکت سهامی VinBigdata دارای یک سیستم پایگاه داده با ظرفیت حداکثر ۳۵۰۰ ترابایت است. این سیستم شامل صدها هزار ساعت داده صوتی، تصویر و اطلاعات است که پاکسازی، پردازش، طبقهبندی و برای آموزش هوش مصنوعی به همراه زیرساخت تحقیق و توسعه استفاده میشوند. این زیرساخت شامل دهها خوشه سرور NvidiaDGX A100 است. این شرکت همچنین صاحب تیمی از اساتید، دانشمندان و متخصصان فناوری ویتنامی از سراسر جهان است.
هوای پونگ
لینک منبع
نظر (0)