در رویداد روز هوش مصنوعی ۲۰۲۳ با موضوع «هوش مصنوعی - بازسازی واقعیت» که در تاریخ ۵ و ۶ دسامبر برگزار شد، شرکت تحقیقات و کاربردهای هوش مصنوعی VinAI (شرکت Vingroup ) از یک پروژه تحقیقاتی متنباز روی یک مدل زبان بزرگ برای ویتنامی، PhoGPT، خبر داد.
PhoGPT یک پروژه متنباز است، نه یک نرمافزار اختصاصی مانند ChatGPT از OpenAI. از آنجا که متنباز است، هیچ محدودیت تجاری وجود ندارد و همه طرفها میتوانند از PhoGPT برای توسعه برنامههای خود، از جمله واحدهای کاربردی برای اهداف تجاری، استفاده کنند. یعنی، این مانند بستری است که به جامعه توسعهدهنده برنامههای مرتبط با فناوری هوش مصنوعی در کشور ارائه میدهد.
به گفته دکتر بویی های هونگ، مدیر کل شرکت تحقیقات و کاربرد هوش مصنوعی VinAI، محدودیتهای مدلهای زبان ویتنامی ثابت کرده است که این مدلها به عملکرد بهینه دست نیافتهاند و فاقد مجموعهای از کدهای منبع باز هستند. بنابراین، یکی از وظایف فوری پیش روی جامعه هوش مصنوعی به طور کلی و جامعه پردازش زبان طبیعی (NLP) به طور خاص، ساخت یک مدل جدید و قدرتمندتر است که قادر به پردازش زبان ویتنامی با دقت و عملکرد بالا باشد.
متخصصان هوش مصنوعی میگویند که با یک مدل زبان کلانداده با ۷.۵ میلیارد پارامتر، که بر روی پلتفرم رمزگشایی Transformer ساخته شده است، این مدل از ابتدا و با استفاده از پیشرفتهترین تکنیکهای موجود مانند مکانیسم توجه سریع (Flash Attention mechanism)، برونیابی طول متن AliBi و ... آموزش داده میشود.
این تکنیکها نه تنها به مدل کمک میکنند تا درک عمیقتری از زمینه به دست آورد، بلکه قابلیتهای گفتگوی طبیعی و تعامل PhoGPT را نیز افزایش میدهند. این امر، مدل را به ابزاری همهکاره و انعطافپذیر تبدیل میکند که قادر به برآوردن طیف گستردهای از نیازهای زبانی کاربران است.
دکتر بوی های هونگ افزود که PhoGPT از ابتدا توسط این شرکت و مستقل از سایر مدلهای جهان توسعه داده شده است. با مدل متنباز، جامعه ویتنام میتواند از آن بهتر استفاده کرده و آن را بهبود بخشد. عمومی کردن کد منبع PhoGPT و در دسترس قرار دادن آن برای کاربران، به ایجاد محیطی کمک میکند که در آن جامعه کاربران بتوانند برنامههای سفارشی و منحصر به فردی را توسعه دهند.
یکی از اهداف متنباز، ایجاد بستری است تا افراد مجبور نباشند وقت خود را صرف دوبارهکاری کنند و واحدها بتوانند مدلهای زبانی بزرگتری را در PhoGPT توسعه دهند. این امر به جامعه کمک میکند تا یک جامعه متنباز باکیفیت برای مدلهای زبانی بزرگ ویتنامی داشته باشد و تأثیر خوبی ایجاد کند تا بسیاری از شرکتها بتوانند در یک زمینه خاص مشارکت و درخواست دهند. شرکت تحقیقات و کاربردهای هوش مصنوعی VinAI اعلام کرد که با PhoGPT، برنامهای برای تحقیق و توسعه برنامههای کاربردی برای کاربران شخصی و مجموعهای از راهحلهای پشتیبانی تخصصی برای مشاغل ویتنامی در زمینههایی مانند مراقبتهای بهداشتی، آموزش و غیره خواهد داشت.
PhoGPT اولین پایههای توسعه مدلهای زبان ویتنامی با کارایی بالا را به عنوان مبنایی برای توسعه برنامههای کاربردی عملی و مؤثر، مطابق با استراتژی توسعه هوش مصنوعی دولت تا سال 2030، بنا نهاده است.
با تان
منبع






نظر (0)