זאלו והמסע המאתגר שלה לכבוש את שאיפותיה המקומיות.

זאלו מספר 1

התפוצצות הבינה המלאכותית הגנרטיבית (AI) שינתה לחלוטין את נוף הטכנולוגיה העולמי.

אח זאלו 2

מאז ש-OpenAI השיקה את ChatGPT בסוף 2022, סדרה של מודלים דומים של תואר שני במשפטים צצו ללא הרף, המיושמים בתחומים רבים כמו שירותי בריאות, חינוך , פיננסים ומשפטים. המירוץ הפך עז, לא רק ברמת הארגון אלא גם ברמה הלאומית מבחינת קיבולת הכשרה, תשתית מחשוב ונתונים.

חברות גדולות כמו OpenAI, גוגל, מטה ומיקרוסופט, עם המשאבים הפיננסיים והתנאים הנוחים שלהן, השקיעו במהירות מיליארדי דולרים כדי לרכוש אלפי כרטיסי מסך מתקדמים כמו ה-Nvidia H100 - רכיב מרכזי בהכשרת מודלים של LLM. מחיר המניה של Nvidia זינק במהלך תקופה זו, מה שמשקף את הביקוש העולמי לתשתיות.

אח זאלו 3

בינתיים, חברות טכנולוגיה במדינות מתפתחות, בנוסף לבעיות עלויות, מתמודדות גם עם מגבלות על ייבוא וייצוא של ציוד שבבי בינה מלאכותית מארה"ב. זה מוביל למחסור בציוד הדרכה ולקצב איטי יותר בהשוואה לענקיות הטכנולוגיה. עם שאיפתה להצלחה מקומית, גם Zalo לכודה במערבולת הזו.

אח זאלו 4

בנוגע לנתונים, בעיות קודמות של למידת מכונה דרשו כמויות גדולות של נתוני אימון, אך עבור מודלים של שפות בקנה מידה גדול, מדובר בכמות עצומה. כדי שיהיה מודל טוב מספיק, מערכת LLM דורשת עשרות, אפילו מאות מיליארדי, של טוקנים של טקסט קלט. בינתיים, מבחינת פופולריות, וייטנאמית אינה מתחרה לאנגלית ולסינית. עובדה זו הגבירה מאוד את הקשיים עבור מפתחי LLM וייטנאמים.

זאלו מספר 5

בשנת 2023, מודלים לשוניים גדולים (LLMs) כמו GPT-3.5 ו-GPT-4 חוללו מהפכה בעולם הטכנולוגיה, ועסקים וייטנאמיים רבים בחרו גם במודלים מכווננים וזמינים מחו"ל כדי לקחת קיצורי דרך ולהתקדם בתהליך ההכשרה לתואר שני במשפטים.

זאלו בחרה בדרך שונה – מאתגרת יותר, אך עצמאית יותר: אימון המודל שלה מאפס. גישה זו דורשת שהכל ייבנה מאפס – החל מארכיטקטורת הנתונים והמודל ועד לכל תהליך האימון. החלטה זו לא הייתה על תחרות עם ענקים, אלא על מימוש שאיפותיהם של העם הווייטנאמי: שליטה במודל ה-LLM בשפת האם שלהם.

זאלו מספר 6

"צפינו את הקשיים ועדיין החלטנו להיכנס למשחק מוקדם. לא התחרינו ישירות עם 'השחקנים הגדולים' אלא בחרנו בשוק נישה שבו נוכל להשתפר. השאיפה שלנו היא לבנות מודל שהעם הוייטנאמי ישלוט בו לחלוטין - מנתונים ועד אלגוריתמים", שיתף ד"ר נגוין טרונג סון, מנהל המדע ב-Zalo AI.

למרות שהתמודדו עם מכשולים רבים בשלושה תחומים מרכזיים - תשתיות, נתונים והכשרה - מהנדסים וייטנאמים חיפשו באופן יזום פתרונות כדי להתגבר על אתגרים אלה. דבר זה מדגים את רוחו וכוח הרצון של העם הווייטנאמי בנסיבות קשות, במיוחד בהתגברות על האתגרים של פיתוח תואר ראשון במשפטים (LLM) עבור העם הווייטנאמי.

זאלו מספר 7

כדי להכשיר LLM (Level Learning), מהנדסים היו זקוקים לתשתית המתאימה. אבל באותה תקופה, מעבדים גרפיים כמו H100 של Nvidia היו כמעט "נדירות עולמית". בינתיים, חברות גדולות הזמינו אותם מראש שנה מראש ושילמו מיליוני דולרים כדי לרכוש אותם. בווייטנאם, Zalo ניסתה גם לרכוש 8 שרתי DGX H100, אבל זה לא היה קל, ודרש המתנה לכל משלוח מהיצרן.

בהיעדר מעבדי גרפיקה של Nvidia, מהנדסים וייטנאמים נאלצו להשתמש בגמישות במעבדי גרפיקה ברמת צריכה לניסויים על שורות קוד בודדות ומודלים בקנה מידה קטן. במקום לחכות, המהנדסים התכוננו באופן יזום כך שכאשר ירכשו ציוד מודרני, הכל יהיה מוכן.

מבחינת נתונים, במקום להסתמך על משאבים זמינים בקלות, זאלו משקיעה בבניית מחסן נתונים איכותי משלה עבור השפה הוייטנאמית, במטרה לפצות על הגירעון החמור בהשוואה לאנגלית ולסינית.

זאלו מספר 8

הודות לאסטרטגיית הפיתוח הגמישה שלה, Zalo קיצרה את זמן הפיתוח של מודל השפה הגדול שלה מ-18 חודשים צפויים ל-6 חודשים בלבד. בסוף שנת 2023, מודל השפה הגדולה הוייטנאמית של Zalo הושק רשמית בכנס Zalo AI Summit, אירוע המאחד מומחי טכנולוגיה ובינה מלאכותית מובילים בווייטנאם. שם, מודל ה-LLM של Zalo ערך את הופעת הבכורה שלו באמצעות אתגר Kahoot שהוצג על ידי Tinhte.vn ובאופן מפתיע עקף את GPT 3.5, כשהוא מדורג רק אחרי GPT4 - מודל ה-LLM שנחשב לחזק בעולם באותה תקופה.

בפלטפורמת הביצועים של VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models), המודל של Zalo השיג ביצועים גבוהים פי 1.5 מ-GPT-3.5 של OpenAI. עד סוף 2024, מודל זה אף עקף שחקנים גדולים כמו GPT-4 (OpenAI), Gemma-2-9B (Google) ו-Phi-3-small (Microsoft), ומדורג רק אחרי LLaMA-3-70B של Meta ביכולות עיבוד שפה וייטנאמית בדירוג VMLU.

אח זאלו 9

מעבר למחקר בלבד, זאלו מביאה בהדרגה טכנולוגיה מהמעבדה לחיים האמיתיים על ידי מסחור ופופולריות של מוצרים ויישומים הנגזרים מתואר ראשון במשפטים.

זאלו מספר 10

בתחילת 2025, עוזר השאלות והתשובות המקיף של Kiki Info – שפעל כחשבון רשמי בפלטפורמת Zalo – משך אליו למעלה ממיליון משתמשים בפחות מחודשיים. אפליקציה נוספת, AI Greeting Cards, גם היא השיגה מספר מרשים של 15 מיליון כרטיסי ברכה שנוצרו ונשלחו תוך חודשיים בלבד.

זאלו מספר 11

המסע של זאלו אינו עוסק רק בחברה שרוצה לפתח טכנולוגיה. זהו חלק מהתמונה הגדולה יותר - שבה וייטנאם מקדמת חדשנות באגרסיביות, עם מדיניות הנובעת מהחלטה 57-NQ/TW בנושא פיתוח מדע, טכנולוגיה וטרנספורמציה דיגיטלית לאומית. בפרט, היא מדגישה את תחום הבינה המלאכותית.

הופעתה וההתפתחות המהירה של תואר ראשון במשפטים וייטנאמי מבית Zalo אינה רק התקדמות טכנולוגית עבור עסק, אלא גם עדות ליכולות הטבועות ולהתמדה של צוות הטכנולוגיה הווייטנאמי.

בעזרת טכניקת "מאפס" - אימון מודלים מאפס - זלו בחרה בדרך ארוכת טווח, אך כזו שבאמת עזרה לווייטנאם לשלוט בבינה מלאכותית. זה חל לא רק על התוצאות אלא גם על התהליך כולו, החל מארכיטקטורת המודל, הנתונים, האלגוריתמים ועד ליישום הסופי. הצלחת זלו הפכה את וייטנאם גם לאחת המדינות הבודדות בדרום מזרח אסיה המחזיקות במודל LLM מקומי - אבן דרך אסטרטגית בתחרות הטכנולוגית העולמית ההולכת וגוברת.

זאלו מספר 12

במסע הארוך שלפנינו, Zalo לא תעצור רק במודל אחד או בכמה מוצרים, אלא תמשיך לשכלל את המודל כדי לשרת את המשתמשים וליצור פלטפורמת בינה מלאכותית וייטנאמית תחרותית ואיכותית: "מסע פיתוח הבינה המלאכותית של Zalo עדיין ארוך. נמשיך לייעל את המודל הן לרוחב והן לעומק, תוך קידום יישומים מעשיים. המטרה הסופית היא ליצור מוצרי בינה מלאכותית איכותיים שישרתו באופן מעשי את העם הווייטנאמי", הוסיף מר סון.

הפיתוח המוצלח של מודל בינה מלאכותית בשפה הווייטנאמית על ידי Zalo הוא לא רק צעד פורץ דרך עבור חברה, אלא גם פותח עתיד מבטיח לבינה מלאכותית בווייטנאם. ההתמדה והשאיפה של העם הווייטנאמי הובילו את המסע לתוצאות ראויות אלה. עתיד הבינה המלאכותית בווייטנאם יכלול לא רק "Zalo", אלא גם דור של מהנדסים אמיצים שילכו בעקבותיה, יירשו את מורשתה ויכבשו את עולם הטכנולוגיה.

זאלו מספר 13