Vietnam.vn - Nền tảng quảng bá Việt Nam

מהנדס צעיר משתמש בבינה מלאכותית כדי לשנות את אופן הקלדת השפה הוייטנאמית.

מקלדת וייטנאמית משולבת בבינה מלאכותית היא אחד המוצרים שמשלבים בהצלחה יצירתיות עם מומחיות, במטרה להביא ערך מעשי לקהילה.

ZNewsZNews14/05/2025


ממשק v7, מקלדת משולבת בינה מלאכותית. תמונה: סופק על ידי המחבר .

בשיחה עם Tri Thức - Znews , שיתף טרי דוק (יליד 2003) את רעיונו ליישום בינה מלאכותית כדי לשנות את אופן ההקלדה של השפה הוייטנאמית. פרויקט המקלדת v7 שלו התפתח כעת למאמר מחקר והתקבל בכנס IJCAI 2025, כנס יוקרתי בנושא בינה מלאכותית.

למרות היותה פופולרית במשך עשרות שנים, לשיטת הקלט Telex או VNI עדיין יש מגבלות רבות מבחינת חוויית המשתמש. לכן, v7 נוצר ככלי קל משקל לחיזוי טקסט, המסייע לקצר את זמן ההקלדה בווייטנאמית הודות לבינה מלאכותית משולבת.

תשוקה לשפות וטכנולוגיה.

התשוקה שלו לשפות ולטכנולוגיה הובילה את דוק להתמחות בבינה מלאכותית יישומית באוניברסיטת הו צ'י מין סיטי לטכנולוגיה.

במהלך לימודיו, הוא עבד על פרויקטים כגון מידול שפה בקנה מידה גדול (LLM) עבור וייטנאמית, תוכנה לתרגום שפות מיעוטים אתניים וצ'אטבוטים לתמיכה בגיוס סטודנטים. "החוויות הללו עזרו לי לבנות בסיס ידע איתן, לטפח את התשוקה שלי ולהזין את רצוני ליישם בינה מלאכותית כדי ליצור מוצרים המועילים לקהילה", הוא שיתף.

תמונה 1 של לוח עץ משולב בינה מלאכותית

טרי דוק שואפת להביא ערך לחיים על ידי יישום בינה מלאכותית. צילום: סופק על ידי המרואיין.

יתר על כן, עם רקע במנדרינית וקנטונזית, דוק זיהה את המתאם בין פיניין/ג'יוטפינג לאיות וייטנאמי. זה גם מראה שבניגוד למורכבות של תווים אידיאוגרפיים, שיטת הקלט בפיניין הסיני דורשת רק הזנת "yn" כדי להפיק את שם המדינה שלנו בתווים סיניים. לעומת זאת, טלקס או VNI דורשים 10 מקשים כדי להפיק את "וייטנאם".

באמצעות תצפיותיו, דוק הבין שבשיחות קצרות, משתמשים נוטים לקצר את השורות על ידי שמירה על העיצור הראשוני, כגון "hs" עבור "סטודנט". "אם בני אדם יכולים להבין בקלות את סגנון הכתיבה הזה, בינה מלאכותית יכולה בהחלט להבין אותו אם תאומן עם הנתונים הנכונים", הסביר את הנסיבות שהובילו לרעיון שלו.

במקום להקליד את כל התווים ולאחר מכן להוסיף סימני דיאקריטיקה כמו בשיטות קלט מסורתיות כמו טלקס או VNI, המסתמכות על מנגנון משלים, גרסה 7 משתמשת בבינה מלאכותית כדי להציע מילים שתרצו לכתוב. הטכנולוגיה תחזה במדויק את המילה המלאה עם כמה שפחות מקשים.

באורתוגרפיה וייטנאמית, מילה מורכבת מעיצור ראשוני, תנועה וטון. לדוגמה, המילה "Nguyễn" מורכבת מ-"ng", "uyên" וטון יורד. בהתבסס על עיקרון זה, פותחה שיטת הקלט v7 כדי לחזות את המילה המלאה באמצעות העיצור והטון הראשוניים בלבד, ובכך להפחית משמעותית את מספר הקשות המקשים תוך שמירה על דיוק.

האתגר של לימוד וייטנאמית לבינה מלאכותית.

לדברי דוק, האתגר הגדול ביותר היה ללמד את הבינה המלאכותית "להבין" וייטנאמית על מנת להשתמש בשיטת קלט זו. הוא ניסה מודלים רבים לפני שבחר ב-GPT-2 כבסיס, כאשר ארכיטקטורת ה-Transformers שלה מציעה הבנה טובה של ההקשר וחיזוי מילים מדויק.

לאחר בחירת הארכיטקטורה הבסיסית, דוק החליף לחלוטין את ה-Tokenizer (מקודד אוצר מילים) באוצר מילים וייטנאמי משלו. המהנדס סינן וכלל את כל המילים הוייטנאמיות התקפות והמאויתות נכון כדי להבטיח יכולות עיבוד מקיפות ויכולת חיזוי כל מילה שהמשתמש התכוון לכתוב.

אתגר נוסף טמון באיזון בין ביצועי החיזוי למהירות התגובה, תוך הבטחה שהמודל יוכל לפעול בזמן אמת הן במחשבים והן בטלפונים, תוך שמירה על עוצמה מספקת כדי לספק את התחזיות הטובות ביותר האפשריות. לאחר חודשיים של בדיקות רציפות, הגרסה הנוכחית ממקמת נכון כמעט 70% מהמילים שהמשתמשים מזינים בראש הדף, עם עיכוב של 0.03 שניות בלבד.

בנוגע לשיטת הקלט של המקלדת, על פי מספר מחקרים שדוק התייעץ איתם, שנכתבו על ידי הבלשנים קאו שואן האו והנרי מספרו, בווייטנאמית אין רק 6, אלא עד 8 צלילים. כדי לנצל מאפיין זה, v7 משתמשת במערכת של 8 צלילים במקום 6 הרגילים (כולל צליל אחד ברמה ו-5 צלילים עם הטעמות: חריפה, גרובה, שאלה, טילדה ונקודה למטה). במקלדת זו, כאשר מזינים "v7", המודל יציע את המילה "וייטנאמית". זהו גם הרעיון העומד מאחורי שם המוצר.

לאחר ששיתף את v7 ברשתות החברתיות שלו, דוק אמר שהוא שמח מאוד ומופתע שהמודל זכה לכל כך הרבה תשומת לב, תמיכה ורצון לנסות אותו. "זה נתן לי תחושה ברורה של הצורך בשיטת קלט וייטנאמית חכמה ומהירה יותר", אמר.

לוח עץ משולב בינה מלאכותית (תמונה 2)

מחברי מאמר המחקר המדעי . משמאל לימין: נאט קאנג, הייאו נגיה וטרי דוק. צילום: באדיבות המחבר.

נכון לעכשיו, שיטת הקלט עדיין נמצאת בשלב האב טיפוס, עם קוד קוד פתוח ב-GitHub עבור מתכנתים ומשתמשי טכנולוגיה לבדיקה ותרומה. גרסת יישום מלאה עבור Windows ו-macOS מפותחת גם עבור משתמשים כלליים, מה שמקל על ההתקנה והשימוש.

בעתיד, העדיפות העליונה עבור גרסה 7 תהיה גרסת המקלדת לאייפון, במטרה לשפר את אופן הזנת הטקסט הוייטנאמי בסמארטפונים. בנוסף, דיוק המודל ישתפר על ידי אימון נוסף שלו על נתוני שיחה יומיומיים, מה שיעזור לבינה המלאכותית להבין טוב יותר הקשרים נפוצים.

המסע של דוק תרם להזרקת גל של חדשנות, תוך שמירה על קצב המגמות הטכנולוגיות בהקשר של ההשקעה החזקה של וייטנאם בתשתית בינה מלאכותית. רגע אחד שגורם לו גאווה הוא כאשר v7 יצר לראשונה משפט שלם. "זה היה הזמן שבו מודל קטן, כנראה רק אלית מגודלו של ChatGPT כיום, עדיין יכול היה לחשוב כמו בן אדם", אמר דוק.

מקור: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


תגובה (0)

השאירו תגובה כדי לשתף את התחושות שלכם!

באותו נושא

באותה קטגוריה

מאת אותו מחבר

מוֹרֶשֶׁת

דְמוּת

עסקים

ענייני היום

מערכת פוליטית

מְקוֹמִי

מוּצָר

Happy Vietnam
אהובי

אהובי

ברוכים הבאים לחברים חדשים

ברוכים הבאים לחברים חדשים

דא נאנג

דא נאנג