המוצר יצר במהירות רעש בקהילת המדע והטכנולוגיה הווייטנאמית.
בחרו בדרך הקשה לפתרון בעיות וייטנאמיות
בסוף שנת 2022, ChatGPT יצרה "מפץ גדול", ופתחה מרוץ לכיבוש בינה מלאכותית בין מדינות וענקיות בתחום הטכנולוגיה. באותה תקופה, גם קהילת הטכנולוגיה הוייטנאמית הייתה להוטה לפתח מוצרים וייטנאמיים כדי שיהיו עצמאיים מבחינה טכנולוגית, ובכך תפחית את התלות במוצרים בינלאומיים. עם זאת, לא לכל יחידה יש את היכולת והנחישות לממש את הרצון הזה כמו VinBigdata.
"בינה מלאכותית גנרטיבית היא בעיה קשה. חברות גדולות כמו OpenAI או גוגל צריכות גם להשקיע משאבים וזמן רבים במחקר כדי שיוכלו ליצור מוצרים כמו שאנחנו רואים. מוצרים אלה טובים מאוד, אך למעשה, מדענים עדיין לא מבינים במלואם את מנגנון הפעולה שלהם. מתי יש בו שגיאות, ומה יהיו השגיאות, מעטים יכולים לחזות. לפתח מוצר דומה ל-ChatGPT עבור אנשים וייטנאמים, בזמן קצר של פחות משנה, ישנם אתגרים רבים. אבל בחרנו "לקחת סיכון" כי אם גרסה וייטנאמית של ChatGPT לא מיוצרת על ידי אנשים וייטנאמים, אז מי ייצר אותה?" - שיתף פרופסור וו הא ואן - מנהל המדע של VinBigdata.
למעשה, מעט מאוד חברות בוחרות לבנות מודלים של שפה גדולה משלהן מאפס. לדוגמה, ל-GPT 3 של OpenAI יש 175 מיליארד פרמטרים והוא אומן על מערך נתונים של 45 טרה-בייט ועלה 4.6 מיליון דולר. על פי חישובים, עלות הפיתוח של GPT 4 עשויה להגיע אף ל-100 מיליון דולר. "עם מספרים כה עצומים, קשה מאוד למצוא חברה שיכולה להרשות לעצמה להשקיע בטכנולוגיה הזו", אמר ד"ר נגוין קים אן - מנהל מוצר של VinBigdata.
על מנת שעסקים וייטנאמים יוכלו לגשת לטכנולוגיית בינה מלאכותית מהדור החדש, עם עלויות ותשתיות אופטימליים, בחרה VinBigdata בכיוון שונה לחלוטין, והוא יצירת מודל שפה עם 1.6 מיליארד פרמטרים בלבד, אך עם יכולות שוות ערך למודלי שפה גדולים עם מיליארדי פרמטרים. "התוצאות מראות שעם הארכיטקטורה שפותחה על ידי VinBigdata עצמה, ניתן לחלוטין לייעל ולהאיץ את תהליך אימון מודל השפה, להפחית את עלויות התשתית (כולל עלויות אימון ועלויות שימוש), ועדיין להבטיח את איכות המודל", הוסיף ד"ר נגוין קים אן.
לאחר פתרון בעיית גודל מודל השפה הגדול, במהלך תהליך "ההגה" של ViGPT, לאחר לימוד מודלים זרים, צוות VinBigdata הבין גם אתגר נוסף: "אשליה", הנובעת מהאופי המובנה של מודלים סטטיסטיים של הסתברות.
בהתאם לכך, מודלי השפה הגדולים בעולם מאומנים לעתים קרובות עם מקורות נתונים באנגלית. לכן, מודל זה אינו באמת מבין ומגיב נכון להקשר ולתרבות של העם הווייטנאמי. זה מוביל להזיה שגורמת למודל השפה הגדול "לפברק" תשובות שגויות.
כדי למצוא את הפתרון האופטימלי בזמן הקצר ביותר, צוות עיבוד השפה הטבעית (NLP) של VinBigdata חולק לקבוצות קטנות, ניתח ודון ברעיונות שונים כדי למצוא את הכיוון הסופי המתאים ביותר.
"לבסוף, החלטנו לפתח ארכיטקטורה שונה מרוב מודלי השפה הגדולים הקיימים, ולבצע אימון על מערך נתונים וייטנאמי מכוון עדין בנפח 600 ג'יגה-בייט, כדי ליצור 'עוזר וירטואלי חכם' המסוגל להבין ולתת תשובות בהתאם להקשר של העם הווייטנאמי", הוסיף ד"ר נגוין קים אן.
שאיפה למערכת אקולוגית טכנולוגית וייטנאמית
על פי תוצאות ההערכה של תקני הערכת מיומנות השפה הוייטנאמית (VMLU), ViGPT השיגה ציון ממוצע של 42.24%, שנייה רק ל-ChatGPT (48.54%). תוצאה זו מאפשרת ל-ViGPT לחפש במהירות מידע ולענות על שאלות בנושאים ספציפיים וספציפיים של וייטנאם.
בנוסף ליכולות של העוזר הווירטואלי, מה שצוות הפיתוח רוצה הוא לשלב את ViGPT במוצרים מוכרים ויומיומיים, על מנת ליצור שינויים בחייהם של העם הווייטנאמי. זהו הכוח המניע שמניע את צוות VinBigdata לבנות מערכת אקולוגית של מוצרי שפה וקול המיישמים את ViGPT - מערכת האקולוגית "Vi" כוללת: ViChat, ViVoice, ViVi Virtual Assistant. מוצרים אלה ניתנים לשימוש בתעשיות רבות, החל מתעשיית הרכב, בנקאות - פיננסים, ביטוח ועד תחבורה ותחומים רבים אחרים.
"כשאנחנו עובדים עם טכנולוגיה, ובמיוחד עם בינה מלאכותית, אנחנו לא רק רוצים לכבוש מערכות מעניינות ומורכבות שקשה לראות. אנחנו רוצים ליצור מוצרים מוחשיים וישימים ביותר, שבהם בינה מלאכותית היא הסוכן הישיר שיוצר שינויים בחיים", אישר מנהל המוצר של VinBigdata.
לכן, הפיתוח המוצלח של ViGPT הוא רק הצעד הראשון במסע להביא טכנולוגיה ונתונים "וייטנאמיים לחלוטין" לשרת את חייהם של מיליוני אנשים וייטנאמים. נציג VinBigdata אמר כי יחידה זו שואפת לשלב את ViGPT בפלטפורמת הבינה המלאכותית הרב-קוגניטיבית VinBase 2.0, על מנת לספק פתרונות מעולים לארגונים ועסקים בגדלים ותעשיות שונות.
לפני ViGPT, צוות המומחים והמהנדסים בתחום טכנולוגיית עיבוד השפה והדיבור VinBigdata הטביע את חותמו על ידי השקת ViVi - העוזר הווירטואלי הווייטנאמי המקיף הראשון (שיושם ונפרס על מכוניות חשמליות VinFast , יישומי Vinhomes Resident ופלטפורמת המסחר האלקטרוני Vinhomes Online), ובמקביל, שולט באופן מלא בטכנולוגיות המתקדמות ביותר בעולם כמו ביומטריה קולית או שיבוט קולי.
כל הטכנולוגיות הללו מפותחות על סמך מסד נתונים של 3,500 טרה-בייט, המתמקד בעיקר בנתונים ספציפיים לווייטנאם, שנאספו, נותחו ועברו שיפור על ידי VinBigdata. המטרה הסופית היא להביא טכנולוגיה עולמית לחיים הווייטנאמיים, תוך שימוש במערכות נתונים וידע וייטנאמיות.
ViGPT היא הגרסה הווייטנאמית הראשונה של ChatGPT עבור משתמשי קצה, הבנויה על מודל השפה הגדולה הוייטנאמית (LLM) שפותח על ידי VinBigdata. ל-ViGPT תכונות יוצאות דופן והוא נועד להתאים בצורה הטובה ביותר לצרכים של אנשים וייטנאמים, כגון יצירת תוכן, חיפוש מידע ומענה על שאלות נפוצות האופייניות לווייטנאם. הירשמו והתנסו ב-ViGPT בכתובת: vigpt.vinbigdata.com |
טאנה הא
[מודעה_2]
מָקוֹר
תגובה (0)