VeGraph משפר את הדיוק ב-2-5% בהשוואה לשיטות הקיימות.
NAACL 2025 (הכנס השנתי של סניף אומות אמריקה של האגודה לבלשנות חישובית) הוא הפורום המדעי היוקרתי המוביל בעולם בתחום עיבוד שפה טבעית ובלשנות חישובית.
לפי מידע שפורסם ב- Viettel אחר הצהריים של ה-16 במאי, התפוצצות האינטרנט והרשתות החברתיות הפכה תוכן שנוצר על ידי משתמשים לפופולרי יותר ויותר; במקביל, היא הובילה לגל של חדשות מזויפות וחדשות לא רשמיות שהתפשטו באופן נרחב. מידע כוזב זה לא רק גורם לבלבול בקרב אנשים בתחומים רגישים כמו בריאות, אסונות טבע, מדיניות ציבורית... אלא גם מוביל לתוצאות חמורות כגון: נזק כלכלי, ירידה במוניטין הארגוני ואיום על הביטחון הלאומי.
"בעבר, למידע הזה הייתה השפעה רק בזמן ובהיקף מסוימים, כעת הוא הופך להיות מסוכן יותר ויותר כאשר הוא הופך לחלק מנתוני הקלט עבור מערכות בינה מלאכותית (AI). בתהליך החיפוש והאיסוף של מידע כדי להגיב למשתמשים, מערכות כמו צ'אטבוטים ועוזרים וירטואליים מסוגלות לחלוטין להשתמש, ליצור או להפיץ מידע כוזב אם אין להן את היכולת לאמת את עצמן", אמר נציג של Viettel.
בדיקת עובדות היא תהליך של אימות האמת או השקר של פיסת מידע. לדוגמה, מטרת בדיקת העובדות של ההצהרה "נאס"א מצאה חיים על מאדים" היא לבדוק האם המידע מבוסס על עובדות שפורסמו באמצעות מקורות אמינים כמו עיתונים, נתונים מדעיים או מאגרי ידע. כדי לאמת את עצמה מידע, מערכות בינה מלאכותית חייבות להיות מסוגלות להבין את המשפט, למצוא מידע רלוונטי ולהסיק מסקנות הגיוניות על סמך נתונים אובייקטיביים.
VeGraph (Verify-in-the-Graph) היא שיטת אימות מידע שנחקרה, פותחה והוצגה על ידי צוות מהנדסים במרכז שירותי הנתונים והבינה המלאכותית של Viettel AI (Viettel AI) בכנס NAACL 2025 - אחד משלושת הכנסים הבינלאומיים היוקרתיים ביותר לעיבוד שפה טבעית. תוצאות ניסוייות על שני מערכי נתונים פופולריים לאימות, HoVer ו-FEVEROUS, מראות כי VeGraph משפרת את הדיוק ב-2-5% בהשוואה לשיטות הקיימות.
לדברי מומחי Viettel בתחום הבינה המלאכותית, רוב שיטות אימות המידע הנוכחיות עדיין מתקשות להתמודד עם הצהרות דו-משמעיות, מטאפוריות או רב-שכבתיות, המשמשות לעתים קרובות כדי "להסוות" מידע כוזב; יחד עם זאת, הן אינן יכולות להסביר בבירור מדוע פיסת תוכן נחשבת כוזבת, מה שמקשה על המשתמשים לסמוך על התוצאות. שיטות רבות מסתמכות בעיקר על מודלים של שפה גדולה (LLM) ללא יכולת לבצע בדיקה הצלבה עם מקורות ידע רשמיים, מה שמוביל לסיכון של יצירת מסקנות שגויות או תופעת "הזיות".
בניגוד לכלים שמבצעים רק מסקנות פנימיות בתוך המודל, VeGraph מפרידה באופן יזום את בקשת אימות המידע לסעיפים קטנים ולאחר מכן משווה אותה עם מקורות אמינים כגון מסמכים משפטיים, מאגרי מידע ממשלתיים , מסמכים מיוחדים וכו'. כל תהליך האימות מסודר לשלבים ברורים, מה שמקל על המשתמשים לנטר ולבדוק, ומגביר את הדיוק והשקיפות - גורם חשוב יותר ויותר ביישומי בינה מלאכותית. תכונה זו גם מאפשרת לארגונים להתאים ולשפר במהירות את המערכת בעת הצורך.
VeGraph, שמטרתה ליצור סביבה דיגיטלית שקופה ומאובטחת, מוערכת מאוד בזכות היישום המעשי שלה. בנוסף ליכולת להשתלב במערכות בינה מלאכותית כדי להגביר את הדיוק והאמינות, ניתן לפתח טכנולוגיה זו למערכת אימות מידע בתחומים רבים כגון בריאות, עיתונאות, משפטים או ניהול מדינה... הודות לכך, אנשים יכולים לאמת את עצמם מידע חשוב הדורש אותנטיות גבוהה כגון חדשות עדכניות, מידע על תרופות, חיסונים, תרופות או תקנות משפטיות...
בעתיד, VeGraph יורחב ותוכל להתמודד עם פורמטים מגוונים של נתונים כגון תמונות, סרטונים, אודיו וכו', לזהות צורות שפה מורכבות כגון מטאפורות, השלכות, ולשלב גרפי ידע נוספים לשיפור יכולות החשיבה.
השנה, NAACL 2025 משכה מספר שיא של מאמרים, שהגיעו ליותר מ-3,000, עם שיעור קבלה תחרותי מאוד למאמרים ראשוניים (כ-22%), המאגד את המחקר פורץ הדרך ביותר. NAACL 2025 מתמקדת במיוחד בהתקדמות פורצת דרך בפיתוח מודלים גדולים של שפה, עיבוד שפה טבעית רב-תרבותית ורב-לשונית, יכולות הסקה מתפתחות ובינה מלאכותית אחראית.
לפי עיתון News and People
מקור: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067
תגובה (0)