לאחר שעבדת בארגון בינה מלאכותית גדול בארה"ב, מדוע החלטת לחזור הביתה ולהצטרף ל-VinBigdata?
בזמן שעבדתי בארה"ב, למרות שהשתתפתי בפרויקטים ממשלתיים גדולים רבים, התוצאות שהפקתי היו לעתים קרובות רק כמה צעדים בתהליך גדול. פעמים רבות, בשל הסודיות המחמירה של הפרויקטים, אפילו לא ידעתי כיצד הפתרונות שפיתחתי נמצאים בשימוש.
בשנת 2017 חזרתי לווייטנאם, כאשר וייטנאם הייתה בשלבי פיתוח והיו בעיות רבות הקשורות לביג דאטה ובינה מלאכותית שהיו צריכות פתרון. קיבלתי את הזמנתו של פרופסור וו הא ואן להגשים במשותף את המטרה של פיתוח פתרונות טכנולוגיים וייטנאמיים שישרתו את חייהם של העם הווייטנאמי. מצאתי את חזרתי לווייטנאם משמעותית הרבה יותר משום שאוכל לעבוד על בעיות בעלות השפעה גדולה יותר.
ד"ר דאו דוק מין בסדנה
באסטרטגיה של פיתוח בינה מלאכותית, איזה תפקיד והשפעה ממלאים ביג דאטה, אדוני?
לנתונים תפקיד עצום ויקר ערך באימון בינה מלאכותית. אימון מודל בינה מלאכותית איכותי מתחיל לעתים קרובות באימון מסד נתונים גדול. לכן, כדי לקבל בינה מלאכותית איכותית, ראשית עלינו לקבל נתונים טובים.
נתונים טובים דורשים כמות וקנה מידה, איכות, מגוון ואוניברסליות. תהליך האיסוף והעיבוד של אלפי שעות של נתונים, החל משלב ניקוי הנתונים הגולמיים, ליצירת נתונים באיכות הגבוהה ביותר להזנת מודלים של בינה מלאכותית, הוא יקר ומורכב מאוד. לעומת זאת, כדי לנתח ביג דאטה, עלינו להשתמש בבינה מלאכותית כדי להבטיח את היכולת לעבד נתונים במדויק בקנה מידה גדול, ובכך ליצור תוצאות החלטיות או ניבוי טובות יותר.
לדוגמה, בתהליך פיתוח מוצר עוזר וירטואלי עבור אנשים וייטנאמים (ViVi), היינו צריכים לאסוף ולעבד עשרות אלפי שעות של נתוני אודיו באיכות גבוהה, ממאות אלפי קולות מאזורים שונים, גילאים ומגדרים מגוונים, עם תוכן המשתרע על פני מאות תחומים...
או לאחרונה, השקת ViGPT - "הגרסה הוייטנאמית הראשונה של ChatGPT עבור משתמשי קצה" שפותחה ממודל שפה גדול בבעלות מלאה של VinBigdata. מודל זה מאומן על סמך 600 ג'יגה-בייט של נתונים וייטנאמיים מעודנים מתחומים רבים ושונים. עם הבנתנו את הנתונים והשפה הוייטנאמית, מצאנו גישה חדשה לקיצור זמן ההשקה של ViGPT תוך 9 חודשים בלבד לאחר לידת ChatGPT.
זהו הקשר בין ביג דאטה לבינה מלאכותית.
מהי עמדתך לגבי חיבור מחקר עם ערך מעשי לשירות הקהילה?
אני מאמין שמחקר טכנולוגי מצליח באמת רק כאשר הוא נכנס לחיים, פותר בעיות חברתיות ומשפר את חייהם של אנשים.
כדי ליצור מוצרים מסחריים פרקטיים הפותרים בעיות עסקיות וחברתיות, עלינו תמיד לשים לב ולשאול את השאלה: איזה ערך יביא הנתונים לחיים?
עד כה, חקרנו ופיתחנו מגוון מוצרים ופתרונות עבור תעשיות ותחומים שונים, בדרך כלל ViGPT, VinDr - המספק פתרונות בינה מלאכותית באבחון הדמיה רפואית , VinBase - פלטפורמת בינה מלאכותית ביו-מלאכותית, או Vizone - סט של פתרונות חכמים לניתוח תמונה.
עם אנשי מפתח של VinBigdata באירוע של תאגיד Vingroup
המהפכה התעשייתית הרביעית מתרחשת בצורה משמעותית בקנה מידה עולמי. אילו יתרונות לדעתך יש לווייטנאם?
בהשוואה למהפכות קודמות, אני מאמין שלווייטנאם יש כיום יתרונות רבים לפרוץ במהפכה התעשייתית 4.0 הזו, שתעזור לשפר את מעמדה של המדינה על מפת העולם. שני המפתחות להשגת מטרה זו הם נתונים ואנשים.
בווייטנאם מתגוררים כיום כמעט 100 מיליון תושבים, מתוכם שיעור גבוה של צעירים המשתמשים בטלפונים ובמחשבים אישיים. בנוסף, יש לנו מומחים בעלי מוניטין בתחום הבינה המלאכותית, כוח אדם צעיר ואיכותי בטכנולוגיית המידע, ויש לנו בסיס טוב מאוד במתמטיקה.
אז מהן המגבלות?
המגבלה הברורה הראשונה היא שלמרות שיש לנו אוכלוסייה גדולה, אנו עדיין מתקשים לשלוט בנתונים, ובמיוחד בתקינה וסנכרון של נתונים במתקנים, עסקים ויחידות מנהליות.
בנוסף, אנו מתמודדים גם עם אילוצים אחרים כגון משאבי השקעה מוגבלים, במיוחד השקעה בתשתית מחשוב בעלת ביצועים גבוהים.
לדעתך, עד כמה חשוב תפקידה של שליטה בנתונים הווייטנאמיים במסע של יצירה ושליטה בטכנולוגיה שתשרת את חייהם של העם הווייטנאמי?
כיום קיימים מוצרי בינה מלאכותית מובילים רבים בעולם, בדרך כלל יישומי בינה מלאכותית המבוססים על מודלי שפה גדולים כמו ChatGPT של OpenAI או Bard של גוגל. עם זאת, וייטנאמית אינה קבוצת השפות העיקרית לפיתוח מוצרים אלה.
לכן, איכות התוכן הספציפי לווייטנאם המוחזר למשתמשים מושפעת פחות או יותר ויש סבירות גבוהה לשגיאות, ומסוכן אף יותר, שגיאות בידע בסיסי.
כיאטנמים, יש לנו את היתרון של גישה למקורות הנתונים שלנו. רק לנו יש את היכולת להבין את מאפייני הנתונים הווייטנאמיים, את הצרכים והמאפיינים של העם הווייטנאמי. לכן, שליטה בנתונים הווייטנאמיים היא באמת המפתח לשליטה בטכנולוגיות הליבה, שהן הטכנולוגיות שישרתו את העם הווייטנאמי.
הדרכה פנימית לחברי VinBigdata
כיצד לגשת למקורות נתונים ספציפיים, במיוחד כאשר רוב הווייטנאמים כיום משתמשים באתרי רשתות חברתיות מחו"ל?
המציאות היא שהמקור הגדול ביותר של נתונים אנושיים כיום (לא רק וייטנאמיים) הוא האינטרנט והרשתות החברתיות. עם זאת, אנו עדיין יכולים לגשת ולאסוף נתונים ממקורות שונים, בהתבסס על הבנת מאפייני הנתונים הווייטנאמיים, בהתאם למאפיינים שנקבעו על ידי כל פרויקט.
לדוגמה, מודלי GPT של OpenAI מכילים מאות, אפילו טריליוני, פרמטרים, מאומנים על כמויות עצומות של נתונים ועולים מיליארדי דולרים. בהשוואה אליהם, בחרנו בדרך שונה לחלוטין המבוססת על המחקר, היכולות והמשאבים שלנו: יצירת מודל שפה וייטנאמי עם ארכיטקטורה של כמה מיליארדי פרמטרים בלבד, מאומן על מערך נתונים וייטנאמי של 600 ג'יגה-בייט שאספנו ושכללנו בעצמנו, אך עם יכולות מקבילות מבחינת עיבוד וייטנאמי. התוצאות מראות שהארכיטקטורה שפיתחנו בעצמנו יכולה לבצע אופטימיזציה עצמית, לקצר את זמן אימון מודל השפה, להפחית עלויות ועדיין להבטיח את איכות המודל.
מהם האתגרים שבהם אתה וצוותך נתקלתם בתהליך המחקר והפיתוח של מוצרי בינה מלאכותית?
האתגר הראשון הוא ללא ספק זמן. גל טכנולוגיית הבינה המלאכותית מגיע במהירות רבה ונמצא בתקופה של פריחה. בעולם, חברות טכנולוגיה מובילות השיקו במהירות מוצרים שלמים ביותר, המתעדכנים ומשתפרים כל הזמן. אם נהיה איטיים ולא נשיק מוצרים בזמן, בוודאי נישאר מאחור.
מצד שני, אם ברצוננו ליצור מוצרים שניתן ליישם ולפתור בעיות חברתיות מעשיות, עלינו לשקול גם מציאת ופיתוח של התכונות הבולטות, המיוחדות והייחודיות של המוצר.
מצגת ביום הבינה המלאכותית של וייטנאם (AI4VN 2023)
למעשה, אנשים וארגונים רבים בווייטנאם וברחבי העולם סבלו מהפסדים גדולים כתוצאה מדליפות מידע. כיצד אתה רואה את נושא אבטחת המידע?
ניתן לומר שכל יישום כיום נובע מנתונים. כשעובדים עם נתונים, מצד אחד, עלינו להבטיח את המטרה של יישום נתונים כדי ליצור את הטכנולוגיה הטובה ביותר לחיים, ומצד שני, עלינו להבטיח אבטחת מידע עבור יחידים וארגונים.
הגורם האנושי הוא חוליה חשובה מאוד בתהליך אבטחת אבטחת המידע. הוא כולל מפתחים, משתמשי מוצר ומשתמשים. עבור מפתחים, מודעות לאבטחת מידע חייבת להיות קיימת כבר מתחילת איסוף ועיבוד הנתונים.
לעתים קרובות, כאשר אין בעיה, איננו מודעים לחשיבות אבטחת המידע. אך אם מתרחשת דליפת נתונים, הנזק יכול להיות עצום. דליפות נתונים יכולות להתרחש עקב בעיות טכניות או מתקפות מכוונות לגניבת נתונים. כאשר נתונים דולפים, אנשים פרטיים או ארגונים עלולים לגרום למידע שלהם להשתמש על ידי אנשים רעים למטרות בלתי חוקיות, ועסקים עלולים לסבול הפסדים כספיים כדי לתקן בעיות קשורות, ואף נזק למותג שלהם.
ד"ר דאו דוק מין וצוות VinBigdata באירוע
האם לאחר השאיפה לשלוט בטכנולוגיה כדי לשרת את העם הווייטנאמי, יהיו צעדים להתקדמות לעולם?
כל ארגון או עסק שרוצה להביא את מוצריו לשוק הבינלאומי חייב לעמוד בתקנים בינלאומיים. ל-VinBigdata יש חוזקות בפתרונות ובטכנולוגיה, ולכן קביעת חזון לכבוש את העולם היא טבעית.
כמובן, כדי לפרוס עבור מוצרים ויישומים רבים ושונים, יש צורך בתמיכה של יחידות בינלאומיות בעלות ניסיון רב שנים והבנה של משתמשים ברחבי העולם.
תודה רבה!
[מודעה_2]
מקור: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm
תגובה (0)