১০ ঘন্টার কথোপকথনের তথ্য এবং এক ঘন্টার রেকর্ডিং সহ, সল্টলাক্স এমন একজন এমসি এবং এআই সহকারী তৈরি করবে যিনি ভিয়েতনামী ভাষা সাবলীলভাবে বুঝতে এবং যোগাযোগ করতে পারবেন।
হো চি মিন সিটিতে অনুষ্ঠিত ভিয়েতনাম কৃত্রিম বুদ্ধিমত্তা উৎসব ( AI4VN 2023 ) এর কাঠামোর মধ্যে AI এক্সপো প্রদর্শনীতে দর্শকদের কাছ থেকে ব্যাপক মনোযোগ আকর্ষণ করেছে এমন মডেলগুলির মধ্যে সল্টলাক্সের AI সহকারী এবং মেটাহিউম্যান (ভার্চুয়াল স্পেসে প্রকৃত মানুষকে পুনর্নির্মাণ) অন্যতম।
এআই সহকারীরা চ্যাটজিপিটির মতো জনপ্রিয় চ্যাটবটের মতোই কাজ করতে পারে তবে অনেক প্রসঙ্গে ভিয়েতনামী ভাষায় নমনীয় এবং নির্ভুলভাবে যোগাযোগ করতে পারে। এদিকে, মেটাহিউম্যান ডিজিটাল পরিবেশে যেকোনো ব্যক্তির অনুলিপি তৈরি করার সময় অনেক মানুষকে উত্তেজিত করে তোলে।
এই দুটি মডেলকে একত্রিত করে একটি আকর্ষণীয় MC AI সংস্করণ তৈরি করা যেতে পারে যা রিয়েল টাইমে আপডেট করা তথ্যের সাথে ভিয়েতনামী ভাষায় যোগাযোগ করতে পারে।

২১শে সেপ্টেম্বর হো চি মিন সিটিতে অনুষ্ঠিত AI4VN প্রদর্শনীতে দর্শনার্থীরা AI সহকারী এবং মেটাহিউম্যান মডেলগুলি উপভোগ করছেন। ছবি: খুওং নাহা
সল্টলাক্সের প্রযুক্তি একজন ব্যক্তিকে এক ঘন্টা রেকর্ডিং এবং প্রায় ১০ ঘন্টা কথোপকথনের পরে নিজের একটি অনুলিপি তৈরি করতে দেয়। পর্যাপ্ত চিত্র ডেটা সংগ্রহ করার পরে, এআই স্বয়ংক্রিয়ভাবে একজন বাস্তব ব্যক্তির চিত্র, অভিব্যক্তি, গতিবিধি এবং স্বরলিপি অনুলিপি করবে, ভার্চুয়াল এমসি হিসাবে অনুকরণ করবে এবং বিভিন্ন প্রসঙ্গে ব্যবহার করবে।
প্রতিটি ব্যক্তির মুখের বৈশিষ্ট্য এবং অভিব্যক্তি সঠিকভাবে বর্ণনা করার জন্য, ডেভেলপার অনেক জ্ঞান গ্রাফ স্বীকৃতি প্রযুক্তি একীভূত করেছেন, যার ফলে শব্দার্থিক বিভাজন, ভঙ্গি অনুমান, মুখের স্বীকৃতি, হাতের অঙ্গভঙ্গি, বয়সের শ্রেণিবিন্যাস, লিঙ্গ... সম্ভব হয়েছে যাতে ভার্চুয়াল এমসি সংস্করণটি প্রায় আসল সংস্করণের মতো দেখায় এবং সাধারণ ব্যবহারকারীরা পার্থক্যটি খুব কমই চিনতে পারেন।
এরপর, ভয়েস বিশ্লেষণ প্রযুক্তি ভার্চুয়াল এমসি মডেলে সন্নিবেশিত করার আগে প্রকৃত ব্যক্তির কণ্ঠস্বর এবং স্বরধ্বনি সঠিকভাবে পুনরুত্পাদন করার জন্য প্রাকৃতিক ভাষা প্রক্রিয়া করবে। সল্টলাক্স হাইব্রিড-ট্যাকোট্রন ডিপ লার্নিং মডেল ব্যবহার করে, যা এআইকে প্রকৃত মানুষের মধ্যম এবং উচ্চ-পিচ উভয় কণ্ঠস্বর পুনরায় তৈরি করতে দেয়, সর্বাধিক স্থিতিশীলতা এবং ব্যক্তিগতকরণ নিশ্চিত করে।
তারপর, স্পিচ সিন্থেসিস ইঞ্জিন যা টেক্সট টু স্পিচ এবং তদ্বিপরীত - স্পিচ টু টেক্সট - এর অনুমতি দেবে AI MC এবং ব্যক্তিকে সরাসরি ভিয়েতনামী ভাষায় মসৃণভাবে যোগাযোগ করতে।
কোলাহলপূর্ণ পরিবেশে বাস্তব জীবনের অভিজ্ঞতায়, সল্টলাক্সের এমসি এআই এখনও দৃশ্যে সরাসরি বলা লাইনগুলি সম্পূর্ণরূপে শুনতে পায় এবং নির্ধারিত কমান্ডগুলি কার্যকর করার আগে সেগুলিকে লিখিত টেক্সটে রূপান্তরিত করে। এআই বিভিন্ন অঞ্চলের উচ্চারণগুলিকে ভালভাবে চিনতে পারে এবং ব্যবহারকারীরা হঠাৎ বিষয় পরিবর্তন করলে কন্টেন্টে দ্রুত সাড়া দেয়। ব্যবহারকারীরা ভয়েসের মাধ্যমে এআই-এর সাথে যোগাযোগ করতে পারেন, কমান্ড টেনে আনতে পারেন অথবা চ্যাট বক্সে কন্টেন্ট টাইপ করতে পারেন।
এই ভিয়েতনামী ভাষাভাষী AI MC-এর একটি প্লাস পয়েন্ট হল উত্তরের নির্ভুলতা। ChatGPT-এর মতো উত্তরের কথা চিন্তা করার পরিবর্তে, Saltlux প্রতিটি ক্ষেত্র ভাগ করে উত্তরের উপর সর্বাধিক নিয়ন্ত্রণ রাখে। উদাহরণস্বরূপ, বর্তমান সংবাদের ক্ষেত্রে, AI শুধুমাত্র নামী সংবাদপত্র থেকে খবর পাবে। সংশ্লেষণ এবং ফলাফল দেওয়ার পরে, AI নিবন্ধগুলি উদ্ধৃত করবে যাতে ব্যবহারকারীরা গভীরভাবে পড়তে চাইলে সরাসরি লিঙ্কটি অ্যাক্সেস করতে পারেন।
পর্যটন কেন্দ্র সম্পর্কিত প্রশ্ন জিজ্ঞাসা করার সময়, ডেভেলপার আগে থেকেই কন্টেন্ট প্রস্তুত করবেন, ব্যবহারকারীর প্রশ্নের পূর্বাভাস দেওয়ার জন্য এটিকে বিভিন্ন প্রসঙ্গে রাখবেন, যার ফলে উচ্চ নির্ভুলতার সাথে উপযুক্ত উত্তর প্রদান করবেন। প্রতিটি কন্টেন্ট এলাকা ভাগ করে নেওয়া এবং ইনপুট এবং আউটপুট ফিল্টার তৈরিতে নমনীয় হওয়া AI চ্যাটবটগুলির স্ব-রচিত উত্তরের "ভ্রম" উল্লেখযোগ্যভাবে হ্রাস করতে সহায়তা করে।
কোরিয়ায়, এই AI মডেলটি "Goodpy National Assistant" তৈরি করেছে, যা সরকার 20 মিলিয়ন মানুষকে জনসাধারণের প্রশাসনিক পরিষেবা প্রদানের জন্য ব্যবহার করে। ভিয়েতনামে, AI মডেল এবং ভার্চুয়াল MC নিয়ে দুই বছর আগে Saltlux গবেষণা এবং পরিচালনা করেছিল। এর মধ্যে একটি উল্লেখযোগ্য অ্যাপ্লিকেশন হল Tam Chuc Pagoda কমপ্লেক্সের ভার্চুয়াল ট্যুর গাইড। এই সিস্টেমটি কেবল দর্শনার্থীদের প্রশ্নের উত্তর দিতে, গাইড করতে, দিকনির্দেশনা দিতে এবং প্রতিটি অবস্থান সম্পর্কে ব্যাখ্যা করতে সহায়তা করে না, বরং রিয়েল টাইমে প্রতিটি ব্যক্তির অবস্থান সঠিকভাবে নির্ধারণ করতে পারে, যার ফলে উপযুক্ত নির্দেশনা প্রদান করা হয়।

প্লুনেট স্টুডিও প্ল্যাটফর্ম ইন্টারফেস ব্যবহারকারীদের শক্তিশালী ডিভাইসের প্রয়োজন ছাড়াই AI দিয়ে কন্টেন্ট তৈরি করতে সাহায্য করে। ছবি: খুওং নাহা
একবার আপনার কাছে একটি ভার্চুয়াল এমসি এবং ভয়েস থাকলে, ব্যবহারকারীরা প্লুনেট স্টুডিও প্ল্যাটফর্মে ভিডিও তৈরির জন্য কন্টেন্ট এবং হোস্টিং স্টাইল কাস্টমাইজ করতে পারবেন।
প্লুনেট স্টুডিও ইন্টারফেসটিও সহজ, ব্যবহারকারীদের কেবল ক্লিক করতে হবে এবং প্রায় দুই মিনিট অপেক্ষা করতে হবে, সিস্টেম দ্বারা একটি নতুন ভিডিও প্রকাশিত হবে। সবকিছু ক্লাউড সার্ভারে করা হয় তাই টার্মিনাল কনফিগারেশনের জন্য কোনও প্রয়োজন নেই। লাস ভেগাসে CES 2023-এ, প্লুনেট স্টুডিও প্ল্যাটফর্মকে ইনোভেশন অ্যাওয়ার্ডে সম্মানিত করা হয়েছিল।
সল্টলাক্সের প্রতিনিধি বলেন যে তাদের এআই মডেলটি কাজের দক্ষতা ২০% উন্নত করতে এবং পরিচালন ব্যয় ৩০% এরও বেশি কমাতে সাহায্য করে, যা ২৪/৭ উচ্চ প্রাপ্যতা নিশ্চিত করে।
এই MC AI মডেলটি পরিচালনা করার জন্য, ব্যবহারকারীদের দুটি ফি দিতে হবে। ভার্চুয়াল স্পেসে প্রকৃত মানুষদের পুনর্নির্মাণের জন্য একটি নির্দিষ্ট ফি। প্যাকেজের মূল্য গ্রাহকের প্রয়োজনীয় অসুবিধার উপর নির্ভর করে পরিবর্তিত হবে। দ্বিতীয় ফি হল Ploonet Studio-তে ভিডিও তৈরির জন্য ফি, যা ঘন্টা অনুসারে নেওয়া হয়। Saltlux পৃথক গ্রাহকদের জন্য নির্দিষ্ট মূল্য প্রকাশ করেনি। কোম্পানিটি ব্যবসায়িক গ্রাহকদের একটি গ্রুপ এবং সংস্থা, সরকারকে লক্ষ্য করে।
Vnexpress.net সম্পর্কে
মন্তব্য (0)