رابط کاربری نسخه ۷، صفحه کلید یکپارچه با هوش مصنوعی. عکس: NVCC . |
تری دوک (متولد ۲۰۰۳) در گفتگو با تری توک - Znews درباره ایده استفاده از هوش مصنوعی برای تغییر نحوه ورود اطلاعات به زبان ویتنامی صحبت کرد. ابزار تایپ v7، پروژه دانشجویی او، اکنون به یک مقاله تحقیقاتی تبدیل شده و در IJCAI 2025، یک کنفرانس معتبر در زمینه هوش مصنوعی، پذیرفته شده است.
با وجود محبوبیت چندین دهه، تایپ تلکس یا VNI هنوز محدودیتهای زیادی در تجربه کاربری دارد. بنابراین، نسخه ۷ متولد شد تا به یک ابزار پیشبینی سبک تبدیل شود و به لطف ادغام هوش مصنوعی، به کوتاه شدن زمان تایپ ویتنامی کمک کند.
اشتیاق به زبانها و فناوری
عشق او به زبانها و فناوری او را به سمت رشته هوش مصنوعی کاربردی در دانشگاه فناوری شهر هوشی مین سوق داد.
او در طول تحصیل، به پروژههایی مانند یک مدل زبان گسترده (LLM) برای زبان ویتنامی، نرمافزاری برای ترجمه زبانهای اقلیتهای قومی یا یک ربات چت برای پشتیبانی از پذیرش پرداخت. او به اشتراک گذاشت: «این تجربیات به من کمک کرد تا پایه محکمی از دانش را جمعآوری کنم، اشتیاق و تمایل خود را برای بهکارگیری هوش مصنوعی برای ایجاد محصولات مفید برای جامعه پرورش دهم.»
تری دوک میخواهد از بهکارگیری هوش مصنوعی در زندگی، ارزش ایجاد کند. عکس: NVCC |
علاوه بر این، با پیشینهای در زبان ماندارین و کانتونی، دوک ارتباط پینیین/جیوتپینگ را با املای ویتنامی تشخیص داد. این عامل همچنین باعث میشود که ببینید برخلاف پیچیدگی هیروگلیفها، سیستم تایپ پینیین چینی فقط به تایپ «yn» نیاز دارد تا نام کشور ما را به حروف چینی نشان دهد. در حالی که Telex یا VNI برای دریافت کلمه «ویتنام» به 10 کلید نیاز دارند.
دوک از طریق مشاهدات خود متوجه شد که هنگام برقراری ارتباط سریع، کاربران اغلب با حفظ اولین صامت، مانند «hs» برای «student»، کلمات را خلاصه میکنند. او در مورد شرایطی که باعث ایجاد این ایده شد، گفت: «اگر انسانها میتوانند به راحتی این سبک نوشتاری را درک کنند، هوش مصنوعی نیز در صورت آموزش با دادههای مناسب میتواند آن را کاملاً درک کند.»
به جای اینکه هنگام استفاده از ابزارهای تایپ سنتی مانند Telex یا VNI که از مکانیسم جمع پیروی میکنند، مجبور باشید کل کاراکتر را بنویسید و سپس لهجهها را اضافه کنید، نسخه ۷ از هوش مصنوعی برای پیشنهاد کلمهای که میخواهید بنویسید استفاده میکند. این فناوری با کمترین کلیدهای ممکن، کلمه کامل را به طور دقیق پیشبینی میکند.
در ساختار املایی ویتنامی، یک کلمه از صامت اولیه، قافیه و آهنگ تشکیل شده است. به عنوان مثال، کلمه "Nguyen" از "ng"، "uyen" و یک آهنگ نزولی تشکیل شده است. بر اساس این اصل، موتور تایپ v7 برای پیشبینی کلمات کامل تنها با صامت اولیه و آهنگ ساخته شده است که به کاهش قابل توجه تعداد ضربات کلید در عین حفظ دقت کمک میکند.
چالش آموزش زبان ویتنامی به هوش مصنوعی
به گفته دوک، بزرگترین چالش، آموزش هوش مصنوعی برای "درک" زبان ویتنامی برای خدمت به این ابزار تایپ است. او قبل از انتخاب GPT-2 به عنوان پایه، مدلهای زیادی را امتحان کرد و از معماری Transformers برای درک خوب متن و پیشبینی دقیق کلمات استفاده کرد.
دوک پس از انتخاب معماری زیربنایی، توکنایزر (رمزگذار واژگان) را به طور کامل با یک واژگان ویتنامی ساخته شده توسط خودش جایگزین کرد. این مهندس تمام کلمات ویتنامی معتبر و با املای صحیح را فیلتر کرد تا از پردازش جامع اطمینان حاصل کند و هر کلمهای را که کاربر میخواست بنویسد، پیشبینی کند.
چالش دیگر، ایجاد تعادل بین عملکرد پیشبینیکننده و سرعت پاسخدهی است، به طوری که تضمین شود مدل میتواند به صورت بلادرنگ هم روی کامپیوترها و هم روی تلفنها اجرا شود، اما همچنان به اندازه کافی قدرتمند باشد تا بهترین پیشبینیها را انجام دهد. پس از ۲ ماه آزمایش مداوم، نسخه فعلی به درستی تقریباً ۷۰٪ از کلماتی را که کاربران تایپ میکنند، با تأخیر تنها ۰.۰۳ ثانیه، به بالای صفحه میآورد.
در مورد روش ورودی صفحهکلید، طبق مطالعات بسیاری که دوک با زبانشناسانی مانند کائو شوان هائو یا هنری ماسپرو مشورت کرده است، زبان ویتنامی نه تنها ۶، بلکه ۸ تُن دارد. برای بهرهگیری از این ویژگی، نسخه ۷ از سیستمی ۸ تُنی به جای ۶ تُن معمول (شامل یک تُن صاف و ۵ تُن برجسته: تیز، صاف، سوالی، نزولی، سنگین) استفاده میکند. در این صفحهکلید، هنگام تایپ "v7"، مدل کلمه "ویت" را پیشنهاد میدهد. این ایده برای نام محصول نیز مطرح شده است.
دوک پس از به اشتراک گذاشتن نسخه ۷ در شبکه اجتماعی خود، گفت که از توجه، حمایت و تمایل به تجربه این مدل بسیار خوشحال و شگفتزده شده است. او گفت: «این موضوع به من احساس روشنی در مورد نیاز به یک ابزار تایپ ویتنامی هوشمندتر و سریعتر داد.»
گروه نویسندگان مقاله علمی- پژوهشی. از چپ به راست: نات خانگ، هیو نگییا، و تری دوک. عکس: NVCC. |
در حال حاضر، این کیبورد هنوز در مرحله نمونه اولیه است و کد منبع آن در گیتهاب برای برنامهنویسان یا کاربران فناوری جهت آزمایش و مشارکت در دسترس است. یک نسخه کامل از برنامه برای ویندوز و macOS نیز در حال توسعه است تا کاربران عادی بتوانند به راحتی آن را نصب و استفاده کنند.
در آینده، اولویت اصلی نسخه ۷، نسخه کیبورد روی آیفون است تا نحوه وارد کردن متن ویتنامی در تلفنهای هوشمند بهبود یابد. علاوه بر این، با آموزش بیشتر روی دادههای مکالمات روزانه، دقت مدل بهبود مییابد و به هوش مصنوعی کمک میکند تا زمینههای رایج را بهتر درک کند.
سفر دوک به ایجاد خلاقیت و همگام شدن با روندهای فناوری در زمینه سرمایهگذاری سنگین ویتنام در زیرساختهای هوش مصنوعی کمک کرده است. یکی از لحظاتی که او را مفتخر میکند، زمانی است که نسخه ۷ برای اولین بار یک جمله کامل ایجاد کرد. دوک گفت: «آن زمان بود که یک مدل کوچک، احتمالاً تنها ۱/۱۰۰۰۰ اندازه ChatGPT امروزی، هنوز میتوانست مانند یک انسان فکر کند.»
منبع: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
نظر (0)