היישום של מודל הבינה המלאכותית הווייטנאמית מושך מיליוני ביקורים. |
מודל השפה רחב ההיקף, שפותח על ידי צוות ההנדסה הווייטנאמי של Zalo, עם 13 מיליארד פרמטרים, מניע סדרה של יישומים מעשיים המושכים מספר רב של משתמשים מדי חודש. אפליקציה בולטת במיוחד היא עוזרת השאלות והתשובות המקיפה של Kiki Info, הפועל כחשבון רשמי (OA) ב-Zalo, ומציעה שלוש תכונות: שאלות ותשובות בנושאים שונים כמו מדע, היסטוריה, חוקי תנועה וכו'; יצירת תוכן כגון כתיבת מאמרים, כתיבת מיילים ופרסום ברשתות חברתיות; ובידור על ידי מתן הצעות ליעדי טיול, מוזיקה , ספרים וכו'.
סטטיסטיקות של צוות הפיתוח מראות כי עד מיליון משתמשים ניגשו לחשבון הרשמי של Zalo (OA) בעוזר זה תוך פחות מחודשיים.
![]() |
Kiki Info משולב בפלטפורמת המסרים Zalo. |
אפליקציה נוספת שפותחה באמצעות מודל השפה הגדול של Zalo היא כרטיסי ברכה מבוססי בינה מלאכותית, שכעת הגיעו ל-15 מיליון כרטיסים שנוצרו ונשלחו על ידי משתמשים. נתונים אלה נאספו במשך תקופה של חודשיים, והראו משתמשים המשתמשים בכרטיסי ברכה מבוססי בינה מלאכותית כדי לשלוח ברכות למשפחה ולחברים באירועים חשובים.
אפליקציות אלו זוכות לדירוג גבוה מצד משתמשים בזכות חוויית המשתמש החכמה שלהן, המסייעת לקצר את זמני החיפוש וקבלת ההחלטות בחיים. הן גם הופכות את החיבור עם אחרים ובניית מערכות יחסים למהנות ומרתקות יותר.
מודל ה-LLM של Zalo פותח באמצעות טכניקת אימון צולב - יישום כל התהליכים, החל מאתחול פרמטרים וקבלת החלטות בארכיטקטורת המודל ועד לאלגוריתמי אימון על מערך נתונים נתון, המאפשר למשתמשים וייטנאמים לשלוט ולשלוט באופן מלא בתהליך האימון ובמודל.
בסוף שנת 2024, מודל ה-LLM של Zalo סיים במקום השני בדירוג VMLU - פלטפורמה להערכת ודירוג של רמת השליטה בשפה הוייטנאמית של מורשי LLM (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models). באופן ספציפי, מודל השפה הגדול של Zalo עלה למקום השני בדירוג המודלים שאומנו מאפס, רק אחרי Llama-3-70B של Meta, ועבר רשמית שמות גדולים כמו GPT-4 (OpenAI), gemma-2-9b-it (Google), ו-microsoft/Phi-3-small-128k-instruct (Microsoft).
![]() |
דירוג 2024 של סטודנטים לתואר ראשון במשפטים נבנה מאפס, כאשר מודל ה-LLM של Zalo נמצא בין 2 המובילים. |
זו הייתה הצלחה אדירה עבור שפת תכנות בקנה מידה גדול שפותחה על ידי העם הווייטנאמי, במיוחד בהתחשב במגבלות הרבות שעמדו בפניה בשלביה המוקדמים. בעוד שחברות גדולות ברחבי העולם החזיקו באלפי כרטיסי מסך חדישים של Nvidia, בווייטנאם באותה תקופה, המהנדסים עדיין לא היו מצוידים בתשתית השרתים הדרושה.
במקביל, וייטנאמית מדורגת גם בין שפות עם משאבי נתונים עניים עשרות מונים מאנגלית או סינית. בנוסף, לווייטנאם יש גם מגבלות במשאבי אנוש ובניסיון בהכשרת תואר שני במשפטים בהשוואה למדינות מפותחות ברחבי העולם.
ל-Zalo הייתה אסטרטגיית פיתוח כדי להתגבר על המגבלות של סביבת האימון שלה בהשוואה לשאר העולם. על ידי ציוד תשתית המחשוב שלה ב-8 שרתי DGX H100, מודל ה-LLM פותח ישירות באמצעות ה-GPU החדשים והנדירים ביותר של Nvidia באותה תקופה, עם ביצועים של עד 256 פטה-פלופים (פעולות נקודה צפה לשנייה - פטה-פלופ אחד שווה ערך ל-10 קוודריליון חישובים לשנייה).
![]() |
למערכת השרתים של Zalo יכולות עיבוד מעולות. |
במקביל, הושקעה השקעה בפיתוח נתוני הדרכה איכותיים כדי לפצות על המחסור במקורות נתונים בשפה הווייטנאמית. באמצעות סדרת מחקרים שבוצעו על כרטיסי מסך קטנים לצרכן, מהנדסי Zalo ניצלו גם הזדמנויות לרכוש ידע ויכולות הדרכה בתואר שני, ויצרו בסיס מוכן לשימוש בעת רכישת תשתית מחשוב בקנה מידה גדול.
אסטרטגיית הפיתוח הנכונה עזרה ל-Zalo לפתח בהצלחה מודל שפה בקנה מידה גדול עם 7 מיליארד פרמטרים המתמקדים בווייטנאמית תוך 6 חודשי אימון בלבד בשנת 2023, והשיגה 150% מהיכולת בהשוואה ל-GPT3.5 של OpenAI במבחן VMLU. נכון לעכשיו, היא עקפה שמות בינלאומיים רבים בדירוג VMLU 2024 ומביאה את מודל המחקר שלה ליישום מעשי עבור הקהילה.
![]() |
מודל ה-LLM של Zalo התחרה מול מגוון מודלים גלובליים כמו ChatGPT 3.5, ChatGPT 4.0, Llama, PhoGPT, ושחקן אמיתי כאשר הושק לראשונה בשנת 2023. |
לדברי זאלו, מודל התואר השני במשפטים ימשיך לקבל השקעה בהכשרה כדי להביא למשתמשים יותר יישומי בינה מלאכותית ברמה עולמית. זה יאפשר להם לשלוט בטכנולוגיית בינה מלאכותית מתקדמת, ולהתקדם לעבר עידן חדש של פיתוח טכנולוגי עבור המדינה עם אוריינטציה פורצת דרך במדע , טכנולוגיה, חדשנות וטרנספורמציה דיגיטלית לאומית.
מקור: https://znews.vn/ung-dung-cua-mo-hinh-ai-viet-dang-thu-hut-hang-trieu-luot-truy-cap-post1563330.html










תגובה (0)