জালো এআই-এর "জেনজেড" প্রকৌশলী লে ডুই খান- এর রিয়েল-টাইম স্পিচ রিকগনিশন মডেলের (স্ট্রিমিং অটোমেটিক স্পিচ রিকগনিশন) নির্ভুলতা বৃদ্ধিতে সহায়তা করার জন্য গবেষণা কাজটি প্রথমবারের মতো ২০২৪ সালের সেপ্টেম্বরে গ্রীসে অনুষ্ঠিত আন্তর্জাতিক বৈজ্ঞানিক সম্মেলনে ঘোষণা করা হবে।
" সময়-পরিবর্তিত প্রেক্ষাপট মনোযোগ এবং গতিশীল ডান প্রেক্ষাপট মাস্কিং সহ স্ট্রিমিং স্পিচ রিকগনিশন উন্নত করা " বিষয় নিয়ে , ২০০০ সালে জন্মগ্রহণকারী জালো এআই ইঞ্জিনিয়ারের গবেষণাপত্রটি প্রায় নিখুঁত স্কোর অর্জন করেছে - ১১/১২ পয়েন্ট, ইন্টারস্পিচ কনফারেন্সে মৌখিক অধিবেশন আকারে উপস্থাপিত ২০০০ টিরও বেশি অংশগ্রহণকারী প্রবন্ধের সাথে কঠোর পর্যালোচনা রাউন্ডে উত্তীর্ণ হয়েছে।
“ আমি খুবই গর্বিত যে আমার প্রথম বৈজ্ঞানিক প্রবন্ধটি একটি মর্যাদাপূর্ণ বৈজ্ঞানিক সম্মেলন দ্বারা স্বীকৃত হয়েছে এবং আমার কাছে ভিয়েতনামের গবেষণা সাফল্যগুলি বৃহৎ প্রযুক্তিবিদ, বিশেষজ্ঞ এবং আন্তর্জাতিক সম্প্রদায়ের কাছে পরিচয় করিয়ে দেওয়ার সুযোগ রয়েছে ,” লে ডুই খান শেয়ার করেছেন।
জালো এআই-এর গবেষণা ও উন্নয়ন বিভাগের প্রধান এবং প্রাকৃতিক বিজ্ঞান বিশ্ববিদ্যালয়ের (হো চি মিন সিটি ন্যাশনাল ইউনিভার্সিটি) প্রভাষক ডঃ চৌ থানহ ডাকের নির্দেশনায় , এই গবেষণা প্রকল্পটি জালো অ্যাপ্লিকেশনে বক্তৃতা স্বীকৃতি মডেলগুলিকে উন্নত করতে, ভয়েস ডিকটেশন এবং ভয়েস-টু-টেক্সটের নির্ভুলতা বৃদ্ধিতে গুরুত্বপূর্ণ অবদান রাখবে বলে আশা করা হচ্ছে।
" জালো এআই-এর অত্যন্ত ব্যবহারিক গবেষণাকে বৈজ্ঞানিক গবেষণাপত্রে সংশ্লেষিত করা এবং মর্যাদাপূর্ণ আন্তর্জাতিক সম্মেলনে উপস্থাপন করা খুবই অর্থবহ। এটি কেবল ভিয়েতনামী প্রকৌশলীদের দক্ষতাই প্রদর্শন করে না, বরং অভিজ্ঞতা ভাগ করে নেওয়ার এবং বিশ্বব্যাপী এআই সম্প্রদায়ের উন্নয়নে অবদান রাখার আকাঙ্ক্ষাও প্রদর্শন করে," ডঃ চাউ থানহ ডুক বলেন।
পূর্বে, জালো ২০২৩ সালের শেষের দিকে তাদের মেসেজিং অ্যাপ্লিকেশনে এই গবেষণাটি একীভূত করে, যা "ভয়েস মেসেজ কম্পোজিশন" বৈশিষ্ট্যের নির্ভুলতা উল্লেখযোগ্যভাবে উন্নত করতে সাহায্য করে। এই বৈশিষ্ট্যটি ব্যবহারকারীদের হাতে টাইপ করার পরিবর্তে ভয়েস দ্বারা বার্তা রচনা করতে দেয়, সময় সাশ্রয় করে এবং অনেক ব্যবহারের পরিস্থিতিতে এটিকে আরও সুবিধাজনক করে তোলে। একই সময়ে, বাস্তবে এই বৈশিষ্ট্যের নির্ভুলতা ৯৫% এ পৌঁছেছে; ভয়েস দ্বারা রচনা করার পরে পাঠ্য পুনরায় সম্পাদনা করার প্রয়োজনের হার ৬.৪% থেকে কমে মাত্র ৪.৮% হয়েছে।
জালো পরিসংখ্যান অনুসারে, যদিও বৈশিষ্ট্যটি এখনও পরীক্ষার পর্যায়ে রয়েছে, এটি প্রতিদিন প্রায় ৪.৫ মিলিয়ন বার্তা তৈরি করেছে এবং প্রায় ৩.২ মিলিয়ন মাসিক ব্যবহারকারীকে আকর্ষণ করেছে (ডেটা ২০২৪ সালের জুন পর্যন্ত আপডেট করা হয়েছে)।
২০১৭ সালে AI গবেষণায় অগ্রণী যাত্রা শুরু করার পর থেকে, Zalo সর্বদা তরুণ প্রজন্মকে "ক্ষমতায়ন" করার উপর বিশ্বাস করে। বর্তমানে, Zalo কর্মীদের ৩১% পর্যন্ত GenZ প্রজন্মের। ২০২১ সালে, Zalo AI ইঞ্জিনিয়ারিং দলের স্পিচ প্রসেসিং প্রযুক্তি সম্পর্কিত আরও দুটি গবেষণা বিষয়ও এশিয়া- প্যাসিফিক আন্তর্জাতিক কৃত্রিম বুদ্ধিমত্তা সম্মেলনে (PRICAI ২০২১) স্বীকৃতি পায়। উল্লেখযোগ্যভাবে, এই দুটি বিষয়ের লেখকরা সকলেই ৩০ বছরের কম বয়সী তরুণ গবেষক।
ইন্টারস্পিচ হল ইন্টারন্যাশনাল স্পিচ কমিউনিকেশন অ্যাসোসিয়েশন কর্তৃক আয়োজিত স্পিচ প্রসেসিং-এর উপর একটি দীর্ঘস্থায়ী, ব্যাপক এবং মর্যাদাপূর্ণ আন্তর্জাতিক সম্মেলন। এই বছর, "স্পিচ অ্যান্ড বিয়ন্ড " থিম নিয়ে সম্মেলনটি ১-৫ সেপ্টেম্বর, ২০২৪ তারিখে কোস (গ্রীস) দ্বীপে অনুষ্ঠিত হবে।






মন্তব্য (0)