वेग्राफ मौजूदा तरीकों की तुलना में सटीकता में 2-5% सुधार करता है।
एनएएसीएल 2025 (कम्प्यूटेशनल भाषाविज्ञान संघ के अमेरिकी अध्याय के राष्ट्रों का वार्षिक सम्मेलन) प्राकृतिक भाषा प्रसंस्करण और कम्प्यूटेशनल भाषाविज्ञान के क्षेत्र में दुनिया का अग्रणी प्रतिष्ठित वैज्ञानिक मंच है।
16 मई की दोपहर विएटेल से मिली जानकारी के अनुसार, इंटरनेट और सोशल नेटवर्क के विस्फोट ने उपयोगकर्ता-जनित सामग्री को तेज़ी से लोकप्रिय बना दिया है; साथ ही, इसने फ़र्ज़ी ख़बरों और अनौपचारिक ख़बरों की एक लहर को भी व्यापक रूप से फैला दिया है। यह झूठी जानकारी न केवल स्वास्थ्य, प्राकृतिक आपदाओं, सार्वजनिक नीति जैसे संवेदनशील क्षेत्रों में लोगों के लिए भ्रम पैदा करती है... बल्कि आर्थिक क्षति, संगठनात्मक प्रतिष्ठा में गिरावट और राष्ट्रीय सुरक्षा के लिए ख़तरा जैसे गंभीर परिणाम भी पैदा करती है।
"अतीत में, यह जानकारी केवल एक निश्चित समय और दायरे तक ही प्रभावी होती थी, अब यह कृत्रिम बुद्धिमत्ता (एआई) प्रणालियों के लिए इनपुट डेटा का हिस्सा बनकर तेज़ी से खतरनाक होती जा रही है। उपयोगकर्ताओं को जवाब देने के लिए जानकारी खोजने और एकत्र करने की प्रक्रिया में, चैटबॉट और वर्चुअल असिस्टेंट जैसे सिस्टम, अगर स्वयं सत्यापन की क्षमता नहीं रखते, तो झूठी जानकारी का उपयोग करने, बनाने या फैलाने में पूरी तरह सक्षम हैं," विएटेल के एक प्रतिनिधि ने कहा।
तथ्य-जांच किसी जानकारी की सत्यता या असत्यता की पुष्टि करने की प्रक्रिया है। उदाहरण के लिए, "नासा ने मंगल ग्रह पर जीवन पाया है" कथन की तथ्य-जांच का उद्देश्य यह जाँचना है कि क्या दी गई जानकारी समाचार पत्रों, वैज्ञानिक आँकड़ों या ज्ञानकोषों जैसे विश्वसनीय स्रोतों के माध्यम से प्रकाशित तथ्यों पर आधारित है। जानकारी की स्व-सत्यापन के लिए, AI प्रणालियों को वाक्य को समझने, प्रासंगिक जानकारी खोजने और वस्तुनिष्ठ आँकड़ों के आधार पर तार्किक निष्कर्ष निकालने में सक्षम होना चाहिए।
वेग्राफ (वेरिफाई-इन-द-ग्राफ) एक सूचना सत्यापन विधि है जिसका अनुसंधान, विकास और प्रस्तुतिकरण विएटेल एआई डेटा सर्विसेज एंड आर्टिफिशियल इंटेलिजेंस सेंटर (विएटेल एआई) के इंजीनियरों की एक टीम ने NAACL 2025 में किया है - जो प्राकृतिक भाषा प्रसंस्करण पर तीन सबसे प्रतिष्ठित अंतरराष्ट्रीय सम्मेलनों में से एक है। दो लोकप्रिय सत्यापन डेटासेट, होवर और फीवरस पर किए गए प्रायोगिक परिणामों से पता चलता है कि वेग्राफ मौजूदा विधियों की तुलना में सटीकता में 2 - 5% की वृद्धि करता है।
विएटेल एआई विशेषज्ञों के अनुसार, अधिकांश मौजूदा सूचना सत्यापन विधियों में अभी भी अस्पष्ट, रूपकात्मक या बहुस्तरीय कथनों को संभालने में कठिनाई होती है, जिनका उपयोग अक्सर नकली जानकारी को "छिपाने" के लिए किया जाता है; साथ ही, वे स्पष्ट रूप से यह नहीं बता पाते कि किसी सामग्री को गलत क्यों माना जाता है, जिससे उपयोगकर्ताओं के लिए परिणामों पर भरोसा करना मुश्किल हो जाता है। कई विधियाँ मुख्य रूप से बड़े भाषा मॉडल (एलएलएम) पर निर्भर करती हैं, जिनमें आधिकारिक ज्ञान स्रोतों से क्रॉस-चेक करने की क्षमता नहीं होती है, जिससे गलत निष्कर्ष या तथाकथित "मतिभ्रम" की स्थिति पैदा होने का जोखिम होता है।
मॉडल के भीतर केवल आंतरिक अनुमान लगाने वाले उपकरणों के विपरीत, VeGraph सूचना सत्यापन अनुरोध को सक्रिय रूप से छोटे-छोटे खंडों में विभाजित करता है और फिर उसकी तुलना कानूनी दस्तावेज़ों, सरकारी डेटाबेस , विशेष दस्तावेज़ों आदि जैसे विश्वसनीय संदर्भों से करता है। पूरी सत्यापन प्रक्रिया को स्पष्ट चरणों में व्यवस्थित किया गया है, जिससे उपयोगकर्ताओं के लिए निगरानी और जाँच करना आसान हो जाता है, जिससे सटीकता और पारदर्शिता बढ़ती है - जो AI अनुप्रयोगों में एक महत्वपूर्ण कारक है। यह सुविधा संगठनों को ज़रूरत पड़ने पर सिस्टम को जल्दी से समायोजित और बेहतर बनाने में भी सक्षम बनाती है।
एक पारदर्शी और सुरक्षित डिजिटल वातावरण के निर्माण के उद्देश्य से, VeGraph को इसके व्यावहारिक अनुप्रयोग के लिए अत्यधिक सराहा जाता है। सटीकता और विश्वसनीयता बढ़ाने के लिए AI प्रणालियों में एकीकृत होने की क्षमता के अलावा, इस तकनीक को स्वास्थ्य सेवा, पत्रकारिता, कानून या राज्य प्रबंधन जैसे कई क्षेत्रों में सूचना सत्यापन प्रणाली के रूप में विकसित किया जा सकता है... इसकी बदौलत, लोग महत्वपूर्ण जानकारी का स्वयं सत्यापन कर सकते हैं जिसके लिए उच्च प्रामाणिकता की आवश्यकता होती है, जैसे कि वर्तमान समाचार, दवाओं, टीकों, फार्मास्यूटिकल्स या कानूनी नियमों से संबंधित जानकारी...
भविष्य में, वेग्राफ को विविध डेटा प्रारूपों जैसे चित्र, वीडियो, ऑडियो आदि को संभालने के लिए विस्तारित किया जाएगा, रूपकों, निहितार्थों जैसे जटिल भाषा रूपों को पहचाना जाएगा, तथा तर्क क्षमताओं में सुधार के लिए अतिरिक्त ज्ञान ग्राफ को शामिल किया जाएगा।
इस वर्ष, NAACL 2025 में रिकॉर्ड संख्या में शोध-पत्र प्रस्तुत हुए, जिनकी संख्या 3,000 से भी ज़्यादा थी, प्राथमिक शोध-पत्रों के लिए स्वीकृति दर बेहद प्रतिस्पर्धी (लगभग 22%) रही, जिससे सबसे अभूतपूर्व शोध-कार्य एक साथ आए। NAACL 2025 विशेष रूप से वृहद भाषा मॉडल विकास, अंतर-सांस्कृतिक और बहुभाषी प्राकृतिक भाषा प्रसंस्करण, उभरती अनुमान क्षमताओं और उत्तरदायी कृत्रिम बुद्धिमत्ता (AI) में अभूतपूर्व प्रगति पर केंद्रित है।
न्यूज एंड पीपल न्यूजपेपर के अनुसार
स्रोत: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067
टिप्पणी (0)