Vietnam.vn - Nền tảng quảng bá Việt Nam

מהנדס צעיר משתמש בבינה מלאכותית כדי לשנות את אופן הקלדת השפה הוייטנאמית

תוכנת הקלדה וייטנאמית משולבת בבינה מלאכותית היא אחד המוצרים המשלבים בהצלחה יצירתיות עם ידע מקצועי, במטרה להביא ערך מעשי לקהילה.

ZNewsZNews14/05/2025


ממשק v7, מקלדת משולבת בינה מלאכותית. צילום: NVCC .

בשיתוף עם טרי דוק - Znews , דיבר טרי דוק (יליד 2003) על הרעיון של יישום בינה מלאכותית כדי לשנות את אופן ההקלדה של השפה הוייטנאמית. כלי ההקלדה v7, פרויקט סטודנטיאלי שלו, התפתח כעת למאמר מחקר והתקבל בכנס יוקרתי בנושא בינה מלאכותית ב-IJCAI 2025.

למרות היותה פופולרית במשך עשרות שנים, הקלדת טלקס או VNI עדיין סובלת ממגבלות רבות בחוויית המשתמש. לכן, v7 נולדה ככלי חיזוי קל משקל, המסייע לקצר את זמן ההקלדה בווייטנאמית הודות לשילוב בינה מלאכותית.

תשוקה לשפות ולטכנולוגיה

אהבתו לשפות ולטכנולוגיה הובילה אותו לתואר ראשון בבינה מלאכותית יישומית באוניברסיטת הו צ'י מין סיטי לטכנולוגיה.

במהלך לימודיו, הוא ניגש לפרויקטים כמו מודל שפה גדול (LLM) לווייטנאמים, תוכנה לתרגום שפות מיעוטים אתניים, או צ'אטבוט לתמיכה בקבלה. "החוויות הללו עזרו לי לצבור בסיס ידע מוצק, לטפח את התשוקה והרצון שלי ליישם בינה מלאכותית כדי ליצור מוצרים שימושיים עבור הקהילה", הוא שיתף.

תמונה 1 של עץ משולבת בבינה מלאכותית

טרי דוק רוצה להביא ערך מיישום בינה מלאכותית לחיים. צילום: NVCC.

בנוסף, עם רקע במנדרינית וקנטונזית, דוק זיהה את המתאם בין פיניין/ג'יוטפינג לאיות וייטנאמי. גורם זה גם גורם לך לראות שבניגוד למורכבות של ההירוגליפים, מערכת ההקלדה הסינית בפיניין דורשת רק הקלדת "yn" כדי לקבל את שם המדינה שלנו באותיות סיניות. בעוד שטלקס או VNI דורשים 10 מקשים כדי לקבל את המילה "וייטנאם".

באמצעות תצפיותיו, דוק הבין שכאשר משתמשים מתקשרים במהירות, משתמשים נוטים לקצר את האות הראשונה, כמו "hs" עבור "סטודנט". "אם בני אדם יכולים להבין בקלות את סגנון הכתיבה הזה, בינה מלאכותית יכולה להבין אותו לחלוטין אם תאומן עם הנתונים הנכונים", אמר על הנסיבות שהולידו את הרעיון.

במקום לכתוב את התו המלא ולאחר מכן להוסיף סימני הטעמה בעת שימוש בכלי הקלדה מסורתיים כמו Telex או VNI, אשר פועלים לפי מנגנון החיבור, גרסה 7 משתמשת בבינה מלאכותית כדי להציע את המילה שברצונך לכתוב. הטכנולוגיה תחזה במדויק את המילה המלאה עם מספר המקשים הקטן ביותר האפשרי.

במבנה האיות הווייטנאמי, מילה מורכבת מעיצור ראשוני, חרוז וטון. לדוגמה, המילה "Nguyen" מורכבת מ-"ng", "uyen" וטון יורד. בהתבסס על עיקרון זה, מנוע ההקלדה v7 בנוי לחיזוי מילים שלמות עם עיצור ראשוני וטון בלבד, מה שעוזר להפחית משמעותית את מספר הקשות המקשים תוך שמירה על דיוק.

האתגר של לימוד וייטנאמית לבינה מלאכותית

לדברי דוק, האתגר הגדול ביותר הוא ללמד את הבינה המלאכותית "להבין" וייטנאמית כדי לשרת את כלי ההקלדה הזה. הוא ניסה מודלים רבים לפני שבחר ב-GPT-2 כבסיס, עם ארכיטקטורת Transformers להבנת הקשר טובה וחיזוי מילים מדויק.

לאחר בחירת הארכיטקטורה הבסיסית, דוק החליף לחלוטין את ה-Tokenizer (מקודד אוצר מילים) באוצר מילים וייטנאמי שבנה בעצמו. המהנדס סינן את כל המילים הוייטנאמיות התקפות והמאויתות נכון כדי להבטיח עיבוד מקיף, וחיזה כל מילה שהמשתמש רצה לכתוב.

אתגר נוסף טמון באיזון בין ביצועי החיזוי למהירות התגובה, תוך הבטחה שהמודל יוכל לפעול בזמן אמת הן במחשבים והן בטלפונים, ועדיין להיות חזק מספיק כדי לבצע את התחזיות הטובות ביותר. לאחר חודשיים של בדיקות רציפות, הגרסה הנוכחית מביאה נכון כמעט 70% מהמילים שמשתמשים מקלידים לראש הדף, עם זמן השהייה של 0.03 שניות בלבד.

בנוגע לשיטת הקלט של המקלדת, על פי מחקרים רבים שדוק התייעץ איתם מהבלשנים קאו שואן האו או אנרי מספרו, לווייטנאמית יש לא רק 6, אלא 8 צלילים. כדי לנצל תכונה זו, v7 משתמש במערכת של 8 צלילים במקום 6 הרגילים (כולל צליל שטוח ו-5 צלילים מודגשים: חד, שטוח, שאלה, יורד, כבד). במקלדת זו, בעת הקלדת "v7", המודל יציע את המילה "וייטנאמית". זהו גם הרעיון לשם המוצר.

לאחר ששיתף את v7 ברשת החברתית שלו, אמר דוק שהוא היה שמח מאוד והופתע כשהמודל זכה לתשומת לב, תמיכה ורצון להתנסות. "זה נתן לי תחושה ברורה לגבי הצורך בכלי הקלדה וייטנאמי חכם ומהיר יותר", אמר.

לוח עץ משולב של תמונה 2 של AI

קבוצת מחברי מאמר המחקר המדעי . משמאל לימין: נאט קאנג, הייאו נגיה וטרי דוק. צילום: NVCC.

נכון לעכשיו, המקלדת עדיין בשלב האב טיפוס, עם קוד קוד פתוח ב-GitHub עבור מתכנתים או משתמשי טכנולוגיה לבדיקה ותרומה. גרסת יישום מלאה עבור Windows ו-macOS מפותחת גם כן עבור משתמשים רגילים להתקנה ושימוש קלים.

בעתיד, העדיפות העליונה עבור גרסה 7 תהיה גרסת המקלדת באייפון, כדי לשפר את אופן הזנת הטקסט הוייטנאמי בסמארטפונים. בנוסף, הדיוק של המודל ישתפר על ידי אימון רב יותר על נתוני שיחות יומיומיות, מה שיעזור לבינה מלאכותית להבין טוב יותר הקשרים נפוצים.

המסע של דוק תרם לפריחה של יצירתיות, תוך הדבקת מגמות טכנולוגיות בהקשר של השקעה רבה של וייטנאם בתשתיות בינה מלאכותית. רגע אחד שגורם לו גאווה הוא כאשר v7 יצר לראשונה משפט שלם. "זה היה כאשר מודל קטן, כנראה רק 1/10,000 מגודלו של ChatGPT כיום, עדיין יכול היה לחשוב כמו בן אדם", אמר דוק.

מקור: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


תגובה (0)

No data
No data

באותו נושא

באותה קטגוריה

עונת הזהב השלווה של הואנג סו פי בהרים הגבוהים של טאי קון לין
כפר בדאנאנג בין 50 הכפרים היפים בעולם לשנת 2025
כפר יצירת הפנסים מוצף בהזמנות במהלך פסטיבל אמצע הסתיו, ומכינים אותן מיד עם ביצוע ההזמנות.
מתנדנדים בצורה מסוכנת על הצוק, נאחזים בסלעים כדי לגרד ריבת אצות בחוף ג'יה לאי

מאת אותו מחבר

מוֹרֶשֶׁת

דְמוּת

עֵסֶק

No videos available

חֲדָשׁוֹת

מערכת פוליטית

מְקוֹמִי

מוּצָר