טרנספורמציה של בינה מלאכותית בווייטנאם מתרחשת בצורה חזקה, וטכנולוגיית OCR (זיהוי תווים אופטי) ממלאת תפקיד חשוב יותר ויותר בדיגיטציה של מסמכים. צילום: איור
לאחרונה, מכון יישומי הטכנולוגיה CMC (CMC ATI) הכריז על מודל CATI-VLM (הבנה חזותית של מסמכים) שפותח על ידי צוות המחקר ממחסן נתונים גדול בנפח 5TB, והגיע למקום ה-12 המובילים בעולם ולמקום הראשון בווייטנאם בדירוג שהוכרז לאחרונה על ידי תחרות הקריאה העממית (RRC) ביוני 2025 בקטגוריית מענה על שאלות חזותיות של מסמכים (DocVQA).
מר דאנג מין טואן, מנהל CMC ATI, שיתף: "אנו שמחים מאוד שיכולת המחקר של צוות CMC אושרה באמצעות מגרש משחקים עולמי יוקרתי כמו RRC. אנו גאים בכך שבתוך זמן קצר, הצוות יכול להגיע לדירוג גבוה, ולעמוד כתף אל כתף עם שמות גדולים ממדינות מפותחות. וחשוב מכך, זוהי הדגמה ברורה של היכולת לשלוט בטכנולוגיה כדי לפתור בעיות ספציפיות של וייטנאמים ותחומים מיוחדים בווייטנאם."
בהקשר של טרנספורמציה דיגיטלית וטרנספורמציה מבוססת בינה מלאכותית המתרחשת בתהליך חזק בווייטנאם, טכנולוגיית OCR (זיהוי תווים אופטי) ממלאת תפקיד חשוב יותר ויותר בדיגיטציה של מסמכים, אוטומציה של תהליכים עסקיים, חיסכון בעלויות ושיפור יעילות הניהול.
עם זאת, עם המאפיינים של הווייטנאמית עם מבטאים וכתב יד, בעיית הזיהוי אינה נעצרת ב'קריאת מילים', אלא דורשת מהמודל להיות בעל יכולת להבין את ההקשר בצורה מקיפה.
CATI-VLM שונה מ-OCR מסורתי בכך שהוא לא רק מחלץ תווים, אלא גם מבין שכבות מרובות של מידע: תוכן טקסט, אלמנטים שאינם טקסט (תיבות סימון, תיבות סימון, תרשימים, חתימות, נוסחאות), פריסה (מבנה עמוד, טבלאות, טפסים) וסגנון (גופנים, סימונים...).
המודל יכול לענות על שאלות ויזואליות המוצגות על תמונות מסמכים, בדומה ל-ChatGPT, מבלי שיהיה צורך ללמוד טפסים ספציפיים מראש.
תחרות הקריאה החזקה (RRC) היא מגרש משחקים מדעי יוקרתי, המאורגן על ידי מרכז הראייה הממוחשבת של האוניברסיטה האוטונומית של ברצלונה (UAB) בספרד, מתקן מחקר יוקרתי בעולם בתחום הראייה הממוחשבת.
התחרות, שהחלה בשנת 2011, מלווה תמיד את הכנס הבינלאומי לניתוח וזיהוי טקסט ICDAR - אחד הפורומים הגדולים בעולם לניתוח מסמכים וראייה ממוחשבת, הפכה לאירוע חשוב, המושך אליו חוקרים, מהנדסים מאוניברסיטאות יוקרתיות, מכוני מחקר וחברות טכנולוגיה כמו אוניברסיטת צינגהואה, קבוצת יונדאי מוטור וטנסנט...
משימותיה של RRC נועדו לקדם התקדמות טכנולוגית, הקשורה לבעיות מהעולם האמיתי, החל מתרגום וניהול נתונים ארגוניים ועד אנליטיקה עירונית ועיבוד מסמכים היסטוריים.
מעבודה להורות: כיצד מנכ"לים של חברות טכנולוגיה משתמשים בבינה מלאכותית כל יום. מג'נסן הואנג ועד טים קוק, מנכ"לי הטכנולוגיה החזקים בעולם ממנפים בינה מלאכותית בחיי היומיום שלהם.
מקור: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html
תגובה (0)