v7 এর ইন্টারফেস, AI ইন্টিগ্রেটেড কীবোর্ড। ছবি: NVCC । |
ট্রাই থুক - জেডনিউজের সাথে শেয়ার করে , ট্রাই ডুক (জন্ম ২০০৩) ভিয়েতনামী ভাষা ব্যবহারের ধরণ পরিবর্তনের জন্য কৃত্রিম বুদ্ধিমত্তা প্রয়োগের ধারণা সম্পর্কে কথা বলেছেন। তার ছাত্র প্রকল্প, v7 টাইপিং টুলটি এখন একটি গবেষণাপত্রে পরিণত হয়েছে এবং AI বিষয়ক একটি মর্যাদাপূর্ণ সম্মেলন IJCAI 2025-এ গৃহীত হয়েছে।
কয়েক দশক ধরে জনপ্রিয় থাকা সত্ত্বেও, টেলেক্স বা ভিএনআই টাইপিং এখনও ব্যবহারকারীর অভিজ্ঞতার অনেক সীমাবদ্ধতা রয়েছে। অতএব, v7 একটি হালকা ভবিষ্যদ্বাণীমূলক সরঞ্জাম হয়ে ওঠার জন্য জন্মগ্রহণ করেছিল, যা এআই ইন্টিগ্রেশনের জন্য ভিয়েতনামী টাইপ করার সময় কমাতে সাহায্য করেছিল।
ভাষা এবং প্রযুক্তির প্রতি আগ্রহ
ভাষা এবং প্রযুক্তির প্রতি তার ভালোবাসা তাকে হো চি মিন সিটি ইউনিভার্সিটি অফ টেকনোলজিতে অ্যাপ্লাইড আর্টিফিশিয়াল ইন্টেলিজেন্সে মেজর ডিগ্রি অর্জন করতে পরিচালিত করে।
পড়াশোনার সময়, তিনি ভিয়েতনামিদের জন্য একটি বৃহৎ ভাষা মডেল (LLM), জাতিগত সংখ্যালঘু ভাষা অনুবাদের জন্য একটি সফ্টওয়্যার, অথবা ভর্তির জন্য একটি চ্যাটবটের মতো প্রকল্পগুলির সাথে যোগাযোগ করেছিলেন। "এই অভিজ্ঞতাগুলি আমাকে জ্ঞানের একটি শক্ত ভিত্তি সংগ্রহ করতে, সম্প্রদায়ের জন্য দরকারী পণ্য তৈরিতে AI প্রয়োগ করার আমার আবেগ এবং আকাঙ্ক্ষাকে লালন করতে সাহায্য করেছে," তিনি ভাগ করে নেন।
ট্রাই ডুক কৃত্রিম বুদ্ধিমত্তা (এআই) প্রয়োগের মাধ্যমে মূল্যবোধ আনতে চায়। ছবি: এনভিসিসি। |
এছাড়াও, ম্যান্ডারিন এবং ক্যান্টোনিজ ভাষার পটভূমির কারণে, ডুক ভিয়েতনামী বানানের সাথে পিনয়িন/জ্যুটপিংয়ের সম্পর্ক উপলব্ধি করেছিলেন। এই বিষয়টি আপনাকে আরও দেখতে সাহায্য করে যে হায়ারোগ্লিফের জটিলতার বিপরীতে, চীনা পিনয়িন টাইপিং সিস্টেমে হান অক্ষরগুলিতে আমাদের দেশের নাম পেতে কেবল "yn" প্রবেশ করতে হয়। যেখানে "ভিয়েতনাম" শব্দটি পেতে টেলেক্স বা ভিএনআই-এর 10 টি কী প্রয়োজন।
তার পর্যবেক্ষণের মাধ্যমে, ডুক বুঝতে পেরেছিলেন যে দ্রুত যোগাযোগ করার সময়, ব্যবহারকারীরা প্রায়শই প্রথম ব্যঞ্জনবর্ণটি ব্যবহার করে সংক্ষিপ্ত করে, যেমন "ছাত্র" এর জন্য "hs"। "মানুষ যদি এই লেখার ধরণটি সহজেই বুঝতে পারে, তাহলে সঠিক তথ্য দিয়ে প্রশিক্ষিত হলে AI এটি সম্পূর্ণরূপে বুঝতে পারবে," তিনি এই ধারণার উদ্ভব ঘটানো পরিস্থিতি সম্পর্কে বলেন।
টেলেক্স বা ভিএনআই-এর মতো ঐতিহ্যবাহী টাইপিং টুল ব্যবহার করার সময় পূর্ণ অক্ষর লিখে তারপর উচ্চারণ যোগ করার পরিবর্তে, যা পরিপূরক প্রক্রিয়া অনুসরণ করে, v7 আপনি যে শব্দটি লিখতে চান তা নির্দেশ করার জন্য AI ব্যবহার করে। প্রযুক্তিটি সম্ভাব্য সবচেয়ে কম কী ব্যবহার করে সম্পূর্ণ শব্দটি সঠিকভাবে ভবিষ্যদ্বাণী করবে।
ভিয়েতনামী বানান কাঠামোতে, একটি শব্দ প্রাথমিক ব্যঞ্জনবর্ণ, ছন্দ এবং স্বর দ্বারা গঠিত। উদাহরণস্বরূপ, "Nguyen" শব্দটি "ng", "uyen" এবং একটি পতিত স্বর দ্বারা গঠিত। এই নীতির উপর ভিত্তি করে, v7 টাইপিং ইঞ্জিনটি শুধুমাত্র প্রাথমিক ব্যঞ্জনবর্ণ এবং স্বর দিয়ে সম্পূর্ণ শব্দের পূর্বাভাস দেওয়ার জন্য তৈরি করা হয়েছে, যা নির্ভুলতা বজায় রেখে কীস্ট্রোকের সংখ্যা উল্লেখযোগ্যভাবে হ্রাস করতে সহায়তা করে।
ভিয়েতনামী ভাষায় কৃত্রিম বুদ্ধিমত্তা শেখানোর চ্যালেঞ্জ
ডুকের মতে, সবচেয়ে বড় চ্যালেঞ্জ ছিল এই টাইপিং টুলটি পরিবেশন করার জন্য ভিয়েতনামী ভাষা "বোঝা" শেখানো। GPT-2 কে ভিত্তি হিসেবে বেছে নেওয়ার আগে তিনি অনেক মডেল চেষ্টা করেছিলেন, যার মধ্যে ট্রান্সফরমার আর্কিটেকচার ছিল ভালো প্রেক্ষাপট বোঝার এবং সঠিক শব্দ ভবিষ্যদ্বাণীর জন্য।
অন্তর্নিহিত স্থাপত্য বেছে নেওয়ার পর, ডুক সম্পূর্ণরূপে টোকেনাইজার (শব্দভান্ডার এনকোডার) কে নিজের তৈরি ভিয়েতনামী শব্দভাণ্ডার দিয়ে প্রতিস্থাপন করেন। প্রকৌশলী সমস্ত বৈধ, সঠিকভাবে বানান করা ভিয়েতনামী শব্দ ফিল্টার করে ব্যাপক প্রক্রিয়াকরণ নিশ্চিত করেন, ব্যবহারকারী যে কোনও শব্দ লিখতে চান তা ভবিষ্যদ্বাণী করেন।
আরেকটি চ্যালেঞ্জ হলো ভবিষ্যদ্বাণীমূলক কর্মক্ষমতা এবং প্রতিক্রিয়ার গতির ভারসাম্য বজায় রাখা, যাতে নিশ্চিত করা যায় যে মডেলটি কম্পিউটার এবং ফোন উভয় ক্ষেত্রেই রিয়েল টাইমে চলতে পারে, তবে সর্বোত্তম ভবিষ্যদ্বাণী করার জন্য যথেষ্ট শক্তিশালী। দুই মাস ধরে ক্রমাগত পরীক্ষার পর, বর্তমান সংস্করণটি ব্যবহারকারীরা যে শব্দগুলি টাইপ করেন তার প্রায় ৭০% সঠিকভাবে শীর্ষে নিয়ে আসে, মাত্র ০.০৩ সেকেন্ডের ল্যাটেন্সি সহ।
কীবোর্ডের ইনপুট পদ্ধতি সম্পর্কে, ভাষাবিদ কাও জুয়ান হাও বা হেনরি মাসপেরোর সাথে ডুকের পরামর্শে করা অনেক গবেষণা অনুসারে, ভিয়েতনামী ভাষায় কেবল ৬টি নয়, ৮টি টোন রয়েছে। এই বৈশিষ্ট্যের সুবিধা নিতে, v7 সাধারণ ৬টির পরিবর্তে ৮-টোন সিস্টেম ব্যবহার করে (একটি সমতল টোন এবং ৫টি উচ্চারিত টোন সহ: তীক্ষ্ণ, সমতল, প্রশ্ন, পতনশীল, ভারী)। এই কীবোর্ডে, "v7" টাইপ করার সময়, মডেলটি "ভিয়েত" শব্দটির পরামর্শ দেবে। পণ্যের নামের জন্যও এটিই ধারণা।
তার সোশ্যাল নেটওয়ার্কে v7 শেয়ার করার পর, ডুক বলেন যে মডেলটি মনোযোগ, সমর্থন এবং অভিজ্ঞতা অর্জনের আকাঙ্ক্ষা পেয়ে তিনি খুব খুশি এবং অবাক হয়েছিলেন। "এটি আমাকে একটি স্মার্ট এবং দ্রুত ভিয়েতনামী টাইপিং টুলের প্রয়োজনীয়তা সম্পর্কে স্পষ্ট ধারণা দিয়েছে," তিনি বলেন।
বৈজ্ঞানিক গবেষণা প্রবন্ধের লেখকদের দল। বাম দিক থেকে: নাট খাং, হিউ নঘিয়া এবং ট্রাই ডুক। ছবি: এনভিসিসি। |
বর্তমানে, কীবোর্ডটি এখনও প্রোটোটাইপ পর্যায়ে রয়েছে, প্রোগ্রামার বা প্রযুক্তি ব্যবহারকারীদের পরীক্ষা এবং অবদান রাখার জন্য GitHub-এ ওপেন সোর্স কোড রয়েছে। সাধারণ ব্যবহারকারীদের সহজেই ইনস্টল এবং ব্যবহারের জন্য উইন্ডোজ এবং ম্যাকওএসের জন্য একটি সম্পূর্ণ অ্যাপ্লিকেশন সংস্করণও তৈরি করা হচ্ছে।
ভবিষ্যতে, v7-এর জন্য সর্বোচ্চ অগ্রাধিকার হবে আইফোনের কীবোর্ড সংস্করণ, যাতে স্মার্টফোনে ভিয়েতনামী টেক্সট প্রবেশের পদ্ধতি উন্নত করা যায়। এছাড়াও, প্রতিদিনের কথোপকথনের ডেটার উপর আরও প্রশিক্ষণের মাধ্যমে মডেলটির নির্ভুলতা উন্নত করা হবে, যা AI-কে সাধারণ প্রেক্ষাপটগুলি আরও ভালভাবে বুঝতে সাহায্য করবে।
ভিয়েতনাম যখন AI অবকাঠামোতে ব্যাপক বিনিয়োগ করছে, তখন প্রযুক্তির প্রবণতার সাথে তাল মিলিয়ে Duc-এর যাত্রা সৃজনশীলতার এক শ্বাসরুদ্ধকর অভিজ্ঞতা এনে দিয়েছে। V7 যখন প্রথম একটি সম্পূর্ণ বাক্য তৈরি করেছিল, তখন তাকে গর্বিত করে এমন একটি মুহূর্ত। "সেই সময় একটি ছোট মডেল, সম্ভবত আজকের ChatGPT-এর আকারের মাত্র 1/10,000, এখনও মানুষের মতো চিন্তা করতে পারত," Duc বলেন।
সূত্র: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
মন্তব্য (0)