v7 کا انٹرفیس، AI سے مربوط کی بورڈ۔ تصویر: مصنف کے ذریعہ فراہم کردہ ۔ |
Tri Thức - Znews سے بات کرتے ہوئے ، Tri Duc (پیدائش 2003) نے مصنوعی ذہانت کا استعمال کرتے ہوئے ویتنامی کے داخلے کے طریقے کو تبدیل کرنے کا اپنا خیال شیئر کیا۔ اس کا v7 کی بورڈ پروجیکٹ اب ایک تحقیقی مقالے کی شکل اختیار کر چکا ہے اور اسے IJCAI 2025 میں قبول کیا گیا ہے، جو کہ ایک باوقار AI کانفرنس ہے۔
کئی دہائیوں سے مقبول ہونے کے باوجود، Telex یا VNI ان پٹ طریقہ میں صارف کے تجربے کے لحاظ سے اب بھی بہت سی حدود ہیں۔ لہذا، v7 کو ایک ہلکا پھلکا پیشن گوئی کرنے والے ٹیکسٹ ٹول کے طور پر بنایا گیا تھا، جو مربوط AI کی بدولت ویتنامی ٹائپنگ کے وقت کو کم کرنے میں مدد کرتا ہے۔
زبانوں اور ٹیکنالوجی کا شوق۔
زبانوں اور ٹکنالوجی کے بارے میں اس کا شوق ڈک کو ہو چی منہ سٹی یونیورسٹی آف ٹکنالوجی میں اپلائیڈ آرٹیفیشل انٹیلی جنس میں اہم مقام پر لے گیا۔
اپنی تعلیم کے دوران، اس نے ویتنامی کے لیے بڑے پیمانے پر لینگویج ماڈلنگ (LLM)، نسلی اقلیتی زبانوں کا ترجمہ کرنے کے لیے سافٹ ویئر، اور طلبہ کی بھرتی میں مدد کے لیے چیٹ بوٹس جیسے منصوبوں پر کام کیا۔ "ان تجربات نے مجھے علم کی ایک مضبوط بنیاد بنانے، اپنے جذبے کو پروان چڑھانے، اور کمیونٹی کو فائدہ پہنچانے والی مصنوعات بنانے کے لیے AI کو لاگو کرنے کی میری خواہش کو ہوا دینے میں مدد کی۔"
Tri Duc کا مقصد AI کو لاگو کرکے زندگی کو اہمیت دینا ہے۔ تصویر: انٹرویو لینے والے کے ذریعہ فراہم کردہ۔ |
مزید برآں، مینڈارن اور کینٹونیز میں پس منظر کے ساتھ، Duc نے پنین/جیوٹپنگ اور ویتنامی ہجے کے درمیان ارتباط کو تسلیم کیا۔ اس سے یہ بھی ظاہر ہوتا ہے کہ نظریاتی حروف کی پیچیدگی کے برعکس، چینی پنین ان پٹ طریقہ چینی حروف میں ہمارے ملک کا نام بنانے کے لیے صرف "yn" درج کرنے کی ضرورت ہے۔ اس کے برعکس، Telex یا VNI کو "ویتنام" تیار کرنے کے لیے 10 کلیدوں کی ضرورت ہوتی ہے۔
اپنے مشاہدات کے ذریعے، Duc نے محسوس کیا کہ فوری بات چیت میں، صارفین اکثر ابتدائی حرف کو برقرار رکھتے ہوئے مختصر کرتے ہیں، جیسے کہ "طالب علم" کے لیے "hs"۔ "اگر انسان آسانی سے لکھنے کے اس انداز کو سمجھ سکتے ہیں، اگر صحیح ڈیٹا کے ساتھ تربیت دی جائے تو AI اسے بالکل سمجھ سکتا ہے،" انہوں نے ان حالات کے بارے میں وضاحت کی جن کی وجہ سے اس کا خیال آیا۔
تمام حروف کو ٹائپ کرنے اور پھر روایتی ان پٹ طریقوں جیسے Telex یا VNI، جو ایک تکمیلی طریقہ کار پر انحصار کرتے ہیں، کے ساتھ ڈائیکرٹکس شامل کرنے کے بجائے، v7 ان الفاظ کو تجویز کرنے کے لیے AI کا استعمال کرتا ہے جنہیں آپ لکھنا چاہتے ہیں۔ ٹیکنالوجی کم سے کم کلیدوں کے ساتھ مکمل لفظ کی درست پیش گوئی کرے گی۔
ویتنامی آرتھوگرافی میں، ایک لفظ ایک ابتدائی کنوننٹ، ایک سر، اور ایک ٹون پر مشتمل ہوتا ہے۔ مثال کے طور پر، لفظ "Nguyễn" "ng," "uyên" اور گرتے ہوئے لہجے پر مشتمل ہے۔ اس اصول کی بنیاد پر، v7 ان پٹ طریقہ تیار کیا گیا تھا تاکہ صرف ابتدائی کنوننٹ اور ٹون کا استعمال کرتے ہوئے مکمل لفظ کی پیشین گوئی کی جا سکے، درستگی کو برقرار رکھتے ہوئے کلیدی اسٹروک کی تعداد کو نمایاں طور پر کم کیا جائے۔
ویتنامی کو AI سکھانے کا چیلنج۔
Duc کے مطابق، سب سے بڑا چیلنج AI کو اس ان پٹ طریقہ کو استعمال کرنے کے لیے ویتنامی کو "سمجھنا" سکھانا تھا۔ اس نے GPT-2 کو فاؤنڈیشن کے طور پر منتخب کرنے سے پہلے بہت سے ماڈلز آزمائے، اس کے ٹرانسفارمرز فن تعمیر میں اچھی سیاق و سباق کی سمجھ اور درست لفظی پیشین گوئی کی پیشکش کی گئی ہے۔
بنیادی فن تعمیر کو منتخب کرنے کے بعد، Duc نے مکمل طور پر Tokenizer (vocabulary encoder) کو ویتنامی الفاظ کے اپنے سیٹ سے بدل دیا۔ انجینئر نے جامع پروسیسنگ کی صلاحیتوں اور صارف کے لکھنے کا ارادہ رکھنے والے کسی بھی لفظ کی پیش گوئی کرنے کی صلاحیت کو یقینی بنانے کے لیے تمام درست، درست ہجے والے ویتنامی الفاظ کو فلٹر کیا اور شامل کیا۔
ایک اور چیلنج پیشین گوئی کی کارکردگی اور ردعمل کی رفتار کو متوازن کرنے میں ہے، اس بات کو یقینی بنانا کہ ماڈل کمپیوٹر اور فون دونوں پر حقیقی وقت میں چل سکتا ہے جبکہ بہترین ممکنہ پیشین گوئیاں فراہم کرنے کے لیے کافی طاقتور رہتا ہے۔ دو ماہ کی مسلسل جانچ کے بعد، موجودہ ورژن صرف 0.03 سیکنڈ کی تاخیر کے ساتھ، صارفین کے درج کردہ تقریباً 70% الفاظ کو درست طریقے سے رکھتا ہے۔
کی بورڈ کے ان پٹ طریقہ کے بارے میں، کئی مطالعات کے مطابق جو Duc نے ماہر لسانیات Cao Xuan Hao اور Henri Maspero سے مشورہ کیا، ویتنامی میں صرف 6 نہیں، بلکہ 8 ٹن تک ہیں۔ اس خصوصیت سے فائدہ اٹھانے کے لیے، v7 معمول کے 6 کی بجائے 8 ٹون سسٹم کا استعمال کرتا ہے (بشمول ایک لیول ٹون اور 5 ٹونز کے ساتھ: ایکیوٹ، گریو، سوال، ٹلڈ، اور ڈاٹ نیچے)۔ اس کی بورڈ میں، جب آپ "v7" درج کریں گے، تو ماڈل لفظ "Viet" تجویز کرے گا۔ پروڈکٹ کے نام کے پیچھے بھی یہی خیال ہے۔
اپنے سوشل میڈیا پر v7 شیئر کرنے کے بعد، Duc نے کہا کہ وہ بہت خوش اور حیران ہیں کہ ماڈل کو اتنی توجہ، حمایت اور اسے آزمانے کی خواہش ملی۔ انہوں نے کہا کہ "اس نے مجھے ایک ہوشیار اور تیز تر ویتنامی ان پٹ طریقہ کی ضرورت کا واضح احساس دلایا،" انہوں نے کہا۔
سائنسی تحقیقی مقالے کے مصنفین۔ بائیں سے دائیں: ناٹ کھنگ، ہیو اینگھیا، اور ٹرائی ڈک۔ تصویر: مصنف کے ذریعہ فراہم کردہ۔ |
فی الحال، ان پٹ طریقہ ابھی بھی پروٹو ٹائپ مرحلے میں ہے، GitHub پر اوپن سورس کوڈ کے ساتھ پروگرامرز اور ٹیک صارفین کو جانچنے اور تعاون کرنے کے لیے۔ ونڈوز اور میک او ایس کے لیے ایک مکمل ایپلیکیشن ورژن بھی عام صارفین کے لیے تیار کیا جا رہا ہے، جس سے اسے انسٹال اور استعمال کرنا آسان ہو گیا ہے۔
مستقبل میں، v7 کی اولین ترجیح آئی فون کی بورڈ ورژن ہے، جس کا مقصد اسمارٹ فونز پر ویتنامی ٹیکسٹ داخل کرنے کے طریقے کو بہتر بنانا ہے۔ مزید برآں، ماڈل کی درستگی کو روزمرہ کے گفتگو کے ڈیٹا پر مزید تربیت دے کر بہتر بنایا جائے گا، جس سے AI کو عام سیاق و سباق کو بہتر طور پر سمجھنے میں مدد ملے گی۔
Duc کے سفر نے AI انفراسٹرکچر میں ویتنام کی مضبوط سرمایہ کاری کے تناظر میں تکنیکی رجحانات کے ساتھ رفتار کو برقرار رکھتے ہوئے جدت کی لہر کو انجیکشن کرنے میں اہم کردار ادا کیا ہے۔ ایک لمحہ جو اسے فخر کرتا ہے وہ ہے جب v7 نے پہلی بار ایک مکمل جملہ تخلیق کیا۔ Duc نے کہا، "یہ تب ہے جب ایک چھوٹا ماڈل، شاید آج کے ChatGPT کا صرف 1/10000 واں سائز، اب بھی انسان کی طرح سوچ سکتا ہے۔"
ماخذ: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html






تبصرہ (0)