v7 এর ইন্টারফেস, AI ইন্টিগ্রেটেড কীবোর্ড। ছবি: NVCC । |
ট্রাই থুক - জেডনিউজের সাথে শেয়ার করে , ট্রাই ডুক (জন্ম ২০০৩) ভিয়েতনামী ভাষা ব্যবহারের ধরণ পরিবর্তনের জন্য কৃত্রিম বুদ্ধিমত্তা প্রয়োগের ধারণা সম্পর্কে কথা বলেছেন। তার ছাত্র প্রকল্প, v7 টাইপিং টুলটি এখন একটি গবেষণাপত্রে পরিণত হয়েছে এবং AI বিষয়ক একটি মর্যাদাপূর্ণ সম্মেলন IJCAI 2025-এ গৃহীত হয়েছে।
কয়েক দশক ধরে জনপ্রিয় থাকা সত্ত্বেও, টেলেক্স বা ভিএনআই টাইপিং এখনও ব্যবহারকারীর অভিজ্ঞতার অনেক সীমাবদ্ধতা রয়েছে। অতএব, v7 একটি হালকা ভবিষ্যদ্বাণীমূলক সরঞ্জাম হয়ে ওঠার জন্য জন্মগ্রহণ করেছিল, যা এআই ইন্টিগ্রেশনের জন্য ভিয়েতনামী টাইপিংয়ের সময় কমাতে সাহায্য করেছিল।
ভাষা এবং প্রযুক্তির প্রতি আগ্রহ
ভাষা এবং প্রযুক্তির প্রতি তার ভালোবাসা তাকে হো চি মিন সিটি ইউনিভার্সিটি অফ টেকনোলজিতে অ্যাপ্লাইড আর্টিফিশিয়াল ইন্টেলিজেন্সে মেজর ডিগ্রি অর্জন করতে পরিচালিত করে।
পড়াশোনার সময়, তিনি ভিয়েতনামিদের জন্য একটি বৃহৎ ভাষা মডেল (LLM), জাতিগত সংখ্যালঘু ভাষা অনুবাদ করার জন্য একটি সফ্টওয়্যার, অথবা ভর্তির জন্য একটি চ্যাটবটের মতো প্রকল্পগুলির সাথে যোগাযোগ করেছিলেন। "এই অভিজ্ঞতাগুলি আমাকে জ্ঞানের একটি শক্ত ভিত্তি সংগ্রহ করতে, সম্প্রদায়ের জন্য দরকারী পণ্য তৈরিতে AI প্রয়োগ করার আমার আবেগ এবং আকাঙ্ক্ষাকে লালন করতে সাহায্য করেছে," তিনি ভাগ করে নেন।
ট্রাই ডুক কৃত্রিম বুদ্ধিমত্তা (এআই) প্রয়োগের মাধ্যমে মূল্যবোধ আনতে চায়। ছবি: এনভিসিসি। |
এছাড়াও, ম্যান্ডারিন এবং ক্যান্টোনিজ ভাষার পটভূমির কারণে, ডুক ভিয়েতনামী বানানের সাথে পিনয়িন/জ্যুটপিংয়ের সম্পর্ককে স্বীকৃতি দিয়েছেন। এই বিষয়টি আপনাকে আরও দেখতে সাহায্য করে যে, হায়রোগ্লিফের জটিলতার বিপরীতে, চীনা পিনয়িন টাইপিং সিস্টেমে চীনা অক্ষরে আমাদের দেশের নাম পেতে কেবল "yn" টাইপ করতে হয়। অন্যদিকে, "ভিয়েতনাম" শব্দটি পেতে টেলেক্স বা ভিএনআই-এর ১০টি কী প্রয়োজন।
তার পর্যবেক্ষণের মাধ্যমে, ডুক বুঝতে পেরেছিলেন যে দ্রুত যোগাযোগ করার সময়, ব্যবহারকারীরা প্রায়শই প্রথম ব্যঞ্জনবর্ণটি সংক্ষেপে ব্যবহার করেন, যেমন "ছাত্র" এর জন্য "hs"। "মানুষ যদি এই লেখার ধরণটি সহজেই বুঝতে পারে, তাহলে সঠিক তথ্য দিয়ে প্রশিক্ষিত হলে AI এটি সম্পূর্ণরূপে বুঝতে পারবে", তিনি এই ধারণার জন্ম দেওয়ার পরিস্থিতি সম্পর্কে বলেছিলেন।
টেলেক্স বা ভিএনআই-এর মতো ঐতিহ্যবাহী টাইপিং টুল ব্যবহার করে পূর্ণ অক্ষর লিখে তারপর উচ্চারণ যোগ করার পরিবর্তে, যা সংযোজন প্রক্রিয়া অনুসরণ করে, v7 আপনি যে শব্দটি লিখতে চান তা নির্দেশ করার জন্য এআই ব্যবহার করে। প্রযুক্তিটি সম্ভাব্য সবচেয়ে কম কী ব্যবহার করে সম্পূর্ণ শব্দটি সঠিকভাবে ভবিষ্যদ্বাণী করবে।
ভিয়েতনামী বানান কাঠামোতে, একটি শব্দ প্রাথমিক ব্যঞ্জনবর্ণ, ছন্দ এবং স্বর দ্বারা গঠিত। উদাহরণস্বরূপ, "Nguyen" শব্দটি "ng", "uyen" এবং একটি পতিত স্বর দ্বারা গঠিত। এই নীতির উপর ভিত্তি করে, v7 টাইপিং ইঞ্জিনটি শুধুমাত্র প্রাথমিক ব্যঞ্জনবর্ণ এবং স্বর দিয়ে সম্পূর্ণ শব্দের পূর্বাভাস দেওয়ার জন্য তৈরি করা হয়েছে, যা নির্ভুলতা বজায় রেখে কীস্ট্রোকের সংখ্যা উল্লেখযোগ্যভাবে হ্রাস করতে সহায়তা করে।
ভিয়েতনামী ভাষায় কৃত্রিম বুদ্ধিমত্তা শেখানোর চ্যালেঞ্জ
ডুকের মতে, সবচেয়ে বড় চ্যালেঞ্জ হল এই টাইপিং টুলটি পরিবেশন করার জন্য ভিয়েতনামী ভাষা "বোঝা" শেখানো। GPT-2 কে ভিত্তি হিসেবে বেছে নেওয়ার আগে তিনি অনেক মডেল চেষ্টা করেছিলেন, যার মধ্যে ট্রান্সফরমার আর্কিটেকচার ছিল ভালো প্রেক্ষাপট বোঝার এবং সঠিক শব্দ ভবিষ্যদ্বাণীর জন্য।
অন্তর্নিহিত স্থাপত্য বেছে নেওয়ার পর, ডুক সম্পূর্ণরূপে টোকেনাইজার (শব্দভান্ডার এনকোডার) কে নিজের তৈরি ভিয়েতনামী শব্দভাণ্ডার দিয়ে প্রতিস্থাপন করেন। প্রকৌশলী সমস্ত বৈধ, সঠিকভাবে বানান করা ভিয়েতনামী শব্দ ফিল্টার করে ব্যাপক প্রক্রিয়াকরণ নিশ্চিত করেন, ব্যবহারকারী যে কোনও শব্দ লিখতে চান তা ভবিষ্যদ্বাণী করেন।
আরেকটি চ্যালেঞ্জ হলো ভবিষ্যদ্বাণীমূলক কর্মক্ষমতা এবং প্রতিক্রিয়ার গতির ভারসাম্য বজায় রাখা, যাতে নিশ্চিত করা যায় যে মডেলটি কম্পিউটার এবং ফোন উভয় ক্ষেত্রেই রিয়েল টাইমে চলতে পারে, কিন্তু তবুও সেরা ভবিষ্যদ্বাণী করার জন্য যথেষ্ট শক্তিশালী হতে পারে। 2 মাস ধরে ক্রমাগত পরীক্ষার পর, বর্তমান সংস্করণটি ব্যবহারকারীদের টাইপ করা প্রায় 70% শব্দকে সঠিকভাবে শীর্ষে নিয়ে আসে, মাত্র 0.03 সেকেন্ডের ল্যাটেন্সি সহ।
কীবোর্ডের ইনপুট পদ্ধতি সম্পর্কে, ভাষাবিদ কাও জুয়ান হাও বা হেনরি মাসপেরোর সাথে ডুকের পরামর্শে করা অনেক গবেষণা অনুসারে, ভিয়েতনামী ভাষায় কেবল ৬টি নয়, ৮টি টোন রয়েছে। এই বৈশিষ্ট্যের সুবিধা নিতে, v7 সাধারণ ৬টির পরিবর্তে ৮টি টোনের একটি সিস্টেম ব্যবহার করে (একটি সমতল টোন এবং ৫টি উচ্চারিত টোন সহ: তীক্ষ্ণ, সমতল, প্রশ্ন, পতনশীল, ভারী)। এই কীবোর্ডে, "v7" টাইপ করার সময়, মডেলটি "ভিয়েত" শব্দটির পরামর্শ দেবে। পণ্যের নামের জন্যও এটিই ধারণা।
তার সোশ্যাল নেটওয়ার্কে v7 শেয়ার করার পর, ডুক বলেন যে মডেলটি মনোযোগ, সমর্থন এবং অভিজ্ঞতা অর্জনের আকাঙ্ক্ষা পেয়ে তিনি খুব খুশি এবং অবাক হয়েছিলেন। "এটি আমাকে একটি স্মার্ট এবং দ্রুত ভিয়েতনামী টাইপিং টুলের প্রয়োজনীয়তা সম্পর্কে স্পষ্ট ধারণা দিয়েছে," তিনি বলেন।
বৈজ্ঞানিক গবেষণা প্রবন্ধের লেখকদের দল। বাম থেকে ডানে: নাট খাং, হিউ নঘিয়া এবং ট্রাই ডুক। ছবি: এনভিসিসি। |
বর্তমানে, কীবোর্ডটি এখনও প্রোটোটাইপ পর্যায়ে রয়েছে, প্রোগ্রামার বা প্রযুক্তি ব্যবহারকারীদের পরীক্ষা এবং অবদান রাখার জন্য GitHub-এ ওপেন সোর্স কোড রয়েছে। সাধারণ ব্যবহারকারীদের সহজেই ইনস্টল এবং ব্যবহারের জন্য উইন্ডোজ এবং ম্যাকওএসের জন্য একটি সম্পূর্ণ অ্যাপ্লিকেশন সংস্করণও তৈরি করা হচ্ছে।
ভবিষ্যতে, v7-এর জন্য সর্বোচ্চ অগ্রাধিকার হবে আইফোনের কীবোর্ড সংস্করণ, যাতে স্মার্টফোনে ভিয়েতনামী টেক্সট প্রবেশের পদ্ধতি উন্নত করা যায়। এছাড়াও, প্রতিদিনের কথোপকথনের ডেটা সম্পর্কে আরও প্রশিক্ষণের মাধ্যমে মডেলটির নির্ভুলতা উন্নত করা হবে, যা AI-কে সাধারণ প্রেক্ষাপটগুলি আরও ভালভাবে বুঝতে সাহায্য করবে।
ভিয়েতনাম যখন AI অবকাঠামোতে ব্যাপক বিনিয়োগ করছে, তখন প্রযুক্তির প্রবণতার সাথে তাল মিলিয়ে Duc-এর যাত্রা সৃজনশীলতার এক শ্বাসরুদ্ধকর অভিজ্ঞতা এনে দিয়েছে। V7 যখন প্রথম একটি সম্পূর্ণ বাক্য তৈরি করেছিল, তখন তাকে গর্বিত করে এমন একটি মুহূর্ত। "সেই সময় একটি ছোট মডেল, সম্ভবত আজকের ChatGPT-এর আকারের মাত্র 1/10,000, এখনও মানুষের মতো চিন্তা করতে পারত," Duc বলেন।
সূত্র: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html






মন্তব্য (0)