עבודת המחקר שנועדה לסייע בהגברת הדיוק של מודלים של זיהוי דיבור בזמן אמת (זיהוי דיבור אוטומטי בסטרימינג) על ידי לה דוי חאן - מהנדס "GenZ" של Zalo AI - תוכרז לראשונה בכנס המדעי הבינלאומי, שיתקיים ביוון בספטמבר 2024.
בנושא " שיפור זיהוי דיבור בסטרימינג בעזרת קשב הקשרי מוסט-זמן ומיסוך הקשר ימני דינמי " , מאמר המחקר של מהנדס הבינה המלאכותית של Zalo, יליד שנת 2000, השיג ציון כמעט מושלם - 11/12 נקודות, ועבר את סבב הסקירה הקפדני עם יותר מ-2,000 מאמרים שהוצגו בכנס Interspeech בצורה של מושב בעל פה.
" אני גאה מאוד שהמאמר המדעי הראשון שלי זכה להכרה בכנס מדעי יוקרתי ויש לי הזדמנות להציג את הישגי המחקר של וייטנאם בפני חברות הטכנולוגיה הגדולות, מומחים והקהילה הבינלאומית ", שיתף לה דוי חאן.
בהדרכתו של ד"ר צ'או תאן דוק - ראש מחלקת המחקר והפיתוח ב-Zalo AI, מרצה באוניברסיטת מדעי הטבע (האוניברסיטה הלאומית של הו צ'י מין סיטי), פרויקט מחקר זה צפוי לתרום תרומה חשובה לשדרוג מודלים של זיהוי דיבור, להגברת דיוק ההכתבה הקולית וההמרת קול לטקסט באפליקציית Zalo.
" שילוב המחקר המעשי ביותר של Zalo AI למאמרים מדעיים והצגתם בכנסים בינלאומיים יוקרתיים הוא משמעותי ביותר. זה לא רק מדגים את יכולתם של המהנדסים הווייטנאמים, אלא גם מדגים את הרצון לשתף חוויות ולתרום לפיתוח קהילת הבינה המלאכותית העולמית", אמר ד"ר צ'או טאן דוק.
בעבר, Zalo שילבה מחקר זה באפליקציית המסרים שלה מסוף 2023, מה שסייע לשפר משמעותית את דיוק תכונת "חיבור הודעות קוליות". תכונה זו מאפשרת למשתמשים לחבר הודעות קוליות במקום להקליד ידנית, חוסכת זמן והופכת אותה לנוחה יותר במצבי שימוש רבים. במקביל, דיוק התכונה הגיע בפועל ל-95%; שיעור הצורך בעריכה מחדש של טקסט לאחר חיבור קולי ירד מ-6.4% ל-4.8% בלבד.
לפי נתוני Zalo, למרות שהתכונה עדיין בשלב הבדיקה, היא יצרה כמעט 4.5 מיליון הודעות ביום ומשכה אליה כ-3.2 מיליון משתמשים חודשיים (הנתונים עודכנו ליוני 2024).
מאז שהחלה את דרכה החלוצית במחקר בינה מלאכותית בשנת 2017, Zalo תמיד האמינה ב"העצמה" של הדור הצעיר. נכון לעכשיו, עד 31% מעובדי Zalo שייכים לדור GenZ. בשנת 2021, שני נושאי מחקר נוספים של צוות ההנדסה של Zalo בתחום הבינה המלאכותית הקשורים לטכנולוגיית עיבוד דיבור זכו להכרה גם הם בכנס הבינלאומי אסיה- פסיפיק לבינה מלאכותית (PRICAI 2021). ראוי לציין כי מחברי שני הנושאים הללו הם כולם חוקרים צעירים מתחת לגיל 30.
Interspeech הוא כנס בינלאומי ותיק, מקיף ויוקרתי בנושא עיבוד דיבור, המאורגן על ידי האגודה הבינלאומית לתקשורת דיבור. השנה, הכנס בנושא "דיבור ומעבר לו " יתקיים בין ה-1 ל-5 בספטמבר 2024 באי קוס (יוון).
תגובה (0)