یوتیوب بر توسعه هوش مصنوعی برای بهبود تجربه کاربری تمرکز دارد. عکس: Digiwatch . |
به عنوان بزرگترین پلتفرم ویدیویی آنلاین جهان، یکی از بزرگترین محدودیتها برای بینندگان یوتیوب، مانع زبانی است. در بحبوحه توسعه سریع محتوای تولید شده توسط هوش مصنوعی، یوتیوب به تازگی ویژگی صدای خارج از قاب خودکار را معرفی کرده است که اکنون از زبان ویتنامی نیز پشتیبانی میکند.
در ویدیوی تأثیرگذار MKBHD درباره سامسونگ گلکسی S25 Edge، وقتی زبان را به ویتنامی تغییر میدهیم، صدای ویتنامی نسبتاً قابل فهم و واضح به نظر میرسد. این تجربه کاملاً شبیه به خواندن صدای حرفهای هوش مصنوعی است که معمولاً در نرمافزارهای تبدیل متن به گفتار مانند Google Text-to-Speech و FPT Play Voice استفاده میشود.
هنگام تغییر به نسخه اصلی انگلیسی، نسخه دوبله شده کاملاً دقیق است و ظرافتها و حالات چهره خالق اثر را به خوبی حفظ میکند. صدا آهنگ ملایمی دارد و گاهی اوقات از عبارات تعجبی مانند «بله، همین است» استفاده میکند که تقریباً حس یک مکالمه مستقیم را ایجاد میکند.
با این حال، ترجمههای تولید شده توسط هوش مصنوعی اغلب مکانیکی و کلمه به کلمه هستند و در نتیجه جملات غیرطبیعی و نادرستی تولید میکنند. بینندگان باید با دقت گوش دهند تا معنای مورد نظر خالق اثر را تفسیر کنند.
اگرچه صداگذاری کاملاً بر اساس زیرنویسهای ویتنامی انجام شده است، اما هوش مصنوعی هنوز کلماتی مانند "super"، "customer" و "trade-off" را اشتباه تلفظ میکند و باعث سردرگمی شنوندگان میشود. این میتواند منجر به یکنواختی، ارتباط نادرست یا محتوای ناقص از منبع اصلی شود.
قبل از آپلود ویدیو، سازندگان میتوانند به پیشنمایشهای صدای ارائه شده توسط هوش مصنوعی گوش دهند. ویدیوهایی که از صدای ویتنامی پشتیبانی میکنند، معمولاً عنوان ویتنامی دارند و عبارت «صدای ویتنامی» درست در زیر آن نوشته شده است.
هوش مصنوعی در هر مرحله، از ایدهپردازی و تحلیل اجرای ویدیو گرفته تا ساخت زیرنویس و تقلید صدا، حضور دارد. یوتیوب انتظار دارد که طی پنج سال آینده، تمام ویدیوهای آپلود شده بتوانند به طور خودکار به چندین زبان دوبله شوند و در عین حال صدای اصلی و حالات چهره خالق ویدیو حفظ شود.
تا پایان دسامبر ۲۰۲۴، این ویژگی هنگام ترجمه از انگلیسی از نه زبان پشتیبانی میکرد. در اوایل سال ۲۰۲۵، نیل موهان، مدیرعامل یوتیوب، رسماً تأیید کرد که دوبله خودکار هوش مصنوعی برای همه شرکا ارائه خواهد شد. تا آوریل، این ویژگی بیسروصدا برای همه کانالهای درآمدزا فعال شد.
یک پست در ردیت که نارضایتی خود را از این ویژگی ابراز میکرد، بیش از ۱۰۰ نظر و ۴۵۰ لایک دریافت کرد. یکی از کاربران استدلال کرد که بسیاری از نرمافزارهای صداگذاری از قبل کار خود را به خوبی انجام میدهند و خود یوتیوب هم زیرنویس دارد و نیازهای ترجمه زبان کاربران را برآورده میکند.
در نظر دیگری آمده است که هوش مصنوعی «spacetime» را با «spare time» اشتباه گرفته است که منجر به ترجمههای نادرست شده است. بسیاری از کاربران دیگر نیز گزارش دادهاند که این ویژگی بیاثر بوده و به دنبال راههایی برای غیرفعال کردن آن در داخل برنامه بودهاند.
یوتیوب خود اذعان دارد که دوبله خودکار هوش مصنوعی هنوز نسبتاً جدید است و از بازخورد کاربران استقبال میکند. این پلتفرم قبل از انتشار ویدیو، سازندگان را از محدودیتهای هوش مصنوعی در درک معنا، تلفظ و تشخیص نویز مطلع میکند. آنها باید قبل از انتشار دوبله برای بینندگان، صحت آن را تأیید کنند.
با این حال، طبق گفته Air.io ، این ویژگی ارزش امتحان کردن را دارد. این یک روش کمهزینه برای آزمایش این است که آیا مخاطبان از محتوای یک سازنده لذت میبرند یا خیر و اینکه آیا کانال میتواند با این نسخههای دوبله شده بینندگان جدیدی را جذب کند یا خیر. اگرچه این فناوری کامل نیست، اما پتانسیل گسترش دسترسی به محتوا را دارد.
در حال حاضر، همه ویدیوها نسخه دوبله شده ندارند و کاربران نمیتوانند این ویژگی را به طور پیشفرض غیرفعال کنند. در عوض، سعی کنید زبان مرورگر خود را به انگلیسی تغییر دهید تا تعداد نسخههای دوبله شده با هوش مصنوعی کاهش یابد.
منبع: https://znews.vn/youtube-vua-dung-ai-de-pha-vo-rao-can-ngon-ngu-post1553547.html






نظر (0)