أثار المنتج سريعًا ضجة في مجتمع العلوم والتكنولوجيا الفيتنامي.
اختر الطريق الصعب لحل المشاكل الفيتنامية
في نهاية عام ٢٠٢٢، أحدثت ChatGPT ثورةً هائلة، فاتحةً الباب أمام سباقٍ للسيطرة على الذكاء الاصطناعي بين الدول والشركات العملاقة في مجال التكنولوجيا. في ذلك الوقت، كان مجتمع التكنولوجيا الفيتنامي حريصًا أيضًا على تطوير منتجات فيتنامية لتحقيق الاكتفاء الذاتي في التكنولوجيا، وتقليل الاعتماد على المنتجات العالمية. ومع ذلك، لا تمتلك كل وحدة القدرة والعزيمة لتحقيق هذه الرغبة مثل VinBigdata.
الذكاء الاصطناعي التوليدي مشكلة صعبة. شركات كبيرة مثل OpenAI وجوجل تحتاج أيضًا إلى إنفاق الكثير من الموارد والوقت على الأبحاث لتتمكن من ابتكار منتجات كما نراها. هذه المنتجات جيدة جدًا، لكن في الواقع، لا يزال العلماء لا يفهمون آلية عملها تمامًا. قليلون هم من يستطيعون التنبؤ بالأخطاء التي قد تظهر فيها. تطوير منتج مشابه لـ ChatGPT للفيتناميين، في فترة قصيرة لا تتجاوز عامًا، يواجه تحديات كثيرة. لكننا اخترنا "المخاطرة" لأنه إذا لم يُصنع فيتناميون نسخة فيتنامية من ChatGPT، فمن سيصنعها؟ - البروفيسور فو ها فان، مدير العلوم في VinBigdata.
في الواقع، نادرًا ما تختار الشركات بناء نماذجها اللغوية الكبيرة من الصفر. على سبيل المثال، يحتوي نموذج GPT 3 من OpenAI على 175 مليار مُعامل، وقد تم تدريبه على قاعدة بيانات بحجم 45 تيرابايت، وبلغت تكلفته 4.6 مليون دولار. ووفقًا للحسابات، قد تصل تكلفة تطوير GPT 4 إلى 100 مليون دولار. وصرح الدكتور نجوين كيم آنه، مدير المنتجات في VinBigdata: "مع هذه الأعداد الضخمة، من الصعب جدًا العثور على شركة قادرة على الاستثمار في هذه التقنية".
لتمكين الشركات الفيتنامية من الوصول إلى تقنيات الذكاء الاصطناعي من الجيل الجديد، بتكاليف وبنية تحتية مثالية، اختارت شركة VinBigdata مسارًا مختلفًا تمامًا، وهو إنشاء نموذج لغوي يحتوي على 1.6 مليار معلمة فقط، ولكن بقدرات تعادل نماذج لغوية ضخمة بمليارات المعلمات. وأضاف الدكتور نجوين كيم آنه: "تُظهر النتائج أنه بفضل البنية التي طورتها شركة VinBigdata نفسها، يُمكن تحسين وتسريع عملية تدريب نموذج اللغة، وخفض تكاليف البنية التحتية (بما في ذلك تكاليف التدريب وتكاليف الاستخدام)، مع ضمان جودة النموذج".
بعد حل مشكلة حجم نموذج اللغة الكبير، أثناء عملية "تصور" ViGPT، وبعد دراسة النماذج الأجنبية، أدرك فريق VinBigdata أيضًا تحديًا آخر: "الوهم"، القادم من الطبيعة المتأصلة في نماذج الاحتمالات الإحصائية.
وبناءً على ذلك، غالبًا ما تُدرَّب أكبر نماذج اللغات في العالم باستخدام مصادر بيانات إنجليزية. ولذلك، لا يفهم هذا النموذج سياق وثقافة الشعب الفيتنامي ولا يستجيب لهما بشكل صحيح. وهذا يؤدي إلى حالة من الهلوسة تدفع نموذج اللغة الكبير إلى "اختلاق" إجابات خاطئة.
من أجل العثور على الحل الأمثل في أقصر وقت، تم تقسيم فريق معالجة اللغة الطبيعية (NLP) في VinBigdata إلى مجموعات صغيرة، لتحليل ومناقشة الأفكار المختلفة للعثور على الاتجاه النهائي الأكثر ملاءمة.
وأضاف الدكتور نجوين كيم آنه: "أخيرًا، قررنا تطوير بنية مختلفة عن معظم نماذج اللغة الكبيرة الحالية، وإجراء تدريب على مجموعة بيانات فيتنامية دقيقة بحجم 600 جيجابايت، لإنشاء "مساعد افتراضي ذكي" قادر على فهم وإعطاء إجابات وفقًا لسياق الشعب الفيتنامي".
التطلع إلى نظام بيئي للتكنولوجيا الفيتنامية
وفقًا لنتائج تقييم معايير تقييم إتقان اللغة الفيتنامية (VMLU)، حقق برنامج ViGPT متوسط درجة 42.24%، متفوقًا على برنامج ChatGPT (48.54%). تتيح هذه النتيجة لبرنامج ViGPT البحث السريع عن المعلومات والإجابة على أسئلة حول مواضيع محددة في فيتنام.
بالإضافة إلى قدرات المساعد الافتراضي، يسعى فريق التطوير إلى دمج ViGPT في المنتجات اليومية المألوفة، لإحداث تغييرات إيجابية في حياة الفيتناميين. هذا هو الدافع الذي يدفع فريق VinBigdata إلى بناء منظومة متكاملة من المنتجات اللغوية والصوتية التي تطبق ViGPT - تشمل منظومة "Vi": ViChat، وViVoice، ومساعد ViVi الافتراضي. يمكن استخدام هذه المنتجات في العديد من القطاعات، بدءًا من صناعة السيارات، والخدمات المصرفية والمالية، والتأمين، ووصولًا إلى النقل، وغيرها الكثير.
عند العمل مع التكنولوجيا، وخاصةً الذكاء الاصطناعي، لا نهدف فقط إلى إتقان أنظمة معقدة ومثيرة للاهتمام يصعب فهمها، بل نهدف أيضًا إلى ابتكار منتجات ملموسة وقابلة للتطبيق، حيث يكون الذكاء الاصطناعي العامل المباشر في إحداث التغييرات في الحياة، كما أكد مدير المنتجات في VinBigdata.
لذا، يُعدّ التطوير الناجح لـ ViGPT مجرد الخطوة الأولى في رحلة تسخير التكنولوجيا والبيانات "الفيتنامية البحتة" لخدمة حياة ملايين الفيتناميين. وصرح ممثل عن VinBigdata بأن هذه الوحدة تهدف إلى دمج ViGPT في منصة الذكاء الاصطناعي متعدد الإدراك VinBase 2.0، وذلك لتوفير حلول فائقة للمؤسسات والشركات بمختلف أحجامها وقطاعاتها.
قبل ViGPT، ترك فريق الخبراء والمهندسين في مجال تكنولوجيا معالجة اللغة والكلام VinBigdata بصمته من خلال إطلاق ViVi - أول مساعد افتراضي فيتنامي شامل (يتم تطبيقه ونشره على سيارات VinFast الكهربائية وتطبيقات Vinhomes Resident ومنصة التجارة الإلكترونية Vinhomes Online)، في نفس الوقت، إتقان التقنيات الأكثر تقدمًا في العالم مثل Voice Biometrics أو Voice Cloning.
طُوّرت جميع هذه التقنيات بالاعتماد على قاعدة بيانات سعة 3500 تيرابايت، تُركّز بشكل رئيسي على بيانات خاصة بفيتنام، جُمعت وحلّلت وحسّنت بواسطة شركة VinBigdata. الهدف النهائي هو إضفاء طابع الحياة على التكنولوجيا العالمية في فيتنام، باستخدام أنظمة البيانات والمعرفة الفيتنامية.
ViGPT هو أول إصدار فيتنامي من ChatGPT للمستخدمين النهائيين، مبني على نموذج اللغة الفيتنامية الكبيرة (LLM)، الذي طورته شركة VinBigdata. يتميز ViGPT بميزات رائعة، وهو مصمم لتلبية احتياجات الفيتناميين على النحو الأمثل، مثل إنشاء المحتوى، والبحث عن المعلومات، والإجابة على الأسئلة الشائعة الشائعة في فيتنام. سجّل واستمتع بتجربة ViGPT على: vigpt.vinbigdata.com |
ثانه ها
[إعلان 2]
مصدر
تعليق (0)