يركز يوتيوب على تطوير الذكاء الاصطناعي لتحسين تجربة المستخدم. الصورة: Digwatch . |
بصفتها أكبر منصة فيديو على الإنترنت في العالم، يُعدّ حاجز اللغة أحد أكبر القيود التي تواجه مُشاهدي يوتيوب. في سياق التطور الكبير للذكاء الاصطناعي التوليدي، أطلقت يوتيوب مؤخرًا ميزة "الدبلجة" التلقائية، والتي تدعم الآن اللغة الفيتنامية.
في فيديو MKBHD الرائع حول هاتف Samsung Galaxy S25 Edge، عند التبديل إلى اللغة الفيتنامية، يُلاحظ أن الصوت الفيتنامي سهل السماع وواضح نسبيًا. تُشبه هذه التجربة إلى حد كبير صوت الذكاء الاصطناعي الاحترافي المُستخدم عادةً في برامج تحويل النص إلى كلام، مثل Google Text-to-Speech و FPT Play Voice.
عند التبديل بين اللغة الإنجليزية الأصلية واللغة الإنجليزية التقليدية، تُعدّ الدبلجة متقنة الصنع، محتفظةً ببراعة بتفاصيلها الدقيقة وتعبيرات المؤلف. الصوت مُعَزَّز، ويستخدم أحيانًا عبارات تعجب مثل "ها هو ذا"، مما يُشعِرك وكأن أحدهم يُخاطبك مباشرةً.
مع ذلك، لا تزال ترجمة الذكاء الاصطناعي تعتمد على كلمة بكلمة، مما يجعل الجمل غير طبيعية وغير قريبة من المعنى. سيتعين على المشاهدين الإنصات بانتباه لفهم المعنى الذي يريد المُبدع إيصاله.
على الرغم من أن الدبلجة مأخوذة بالكامل من الترجمة الفيتنامية، إلا أن الذكاء الاصطناعي لا يزال لا ينطق كلمات مثل "super، customer، exchange" بشكل صحيح، مما يُصعّب على المستمعين فهمها. قد يؤدي هذا إلى الملل، أو سوء الفهم، أو نقص المحتوى الأصلي.
قبل تحميل أي فيديو، سيتمكن منشئو المحتوى من الاستماع إلى الدبلجة المدعومة بالذكاء الاصطناعي. عادةً ما تحمل الفيديوهات المدعومة باللغة الفيتنامية عناوين فيتنامية، مع كلمة "دبلجة" أسفلها مباشرةً.
يتواجد الذكاء الاصطناعي في كل مرحلة، من الفكرة، وتحليل أداء الفيديو، إلى الترجمة وتقليد الصوت. ويأمل يوتيوب أنه خلال السنوات الخمس المقبلة، سيتم دبلجة كل فيديو يُحمّل تلقائيًا إلى لغات متعددة، مع الحفاظ على صوت المُنشئ وتعبيراته.
بحلول نهاية ديسمبر 2024، أصبحت الميزة متاحة بتسع لغات عند الترجمة من الإنجليزية. وفي أوائل عام 2025، أكد نيل موهان، الرئيس التنفيذي لشركة يوتيوب، رسميًا أن الدبلجة التلقائية بالذكاء الاصطناعي ستُطرح لجميع الشركاء. وبحلول أبريل، تم تفعيل الميزة تدريجيًا لجميع القنوات التي فعّلت ميزة تحقيق الدخل.
حاز منشورٌ على ريديت يُعرب عن عدم الرضا عن هذه الميزة على أكثر من 100 تعليق و450 إعجابًا. وقال أحد المستخدمين إن هناك العديد من برامج التعليق الصوتي التي تُحقق أداءً جيدًا، أو أن يوتيوب نفسه يُوفر ترجمةً مُلائمةً لتلبية احتياجات المستخدمين في ترجمة اللغات.
قال معلق آخر إن الذكاء الاصطناعي أخطأ في فهم كلمة "الزمكان" على أنها "وقت فراغ"، مما أدى إلى خطأ في الترجمة. كما اشتكى العديد من المستخدمين الآخرين من عدم عمل الميزة بشكل صحيح، وحاولوا تعطيلها في التطبيق.
يُقرّ يوتيوب نفسه بأن الدبلجة التلقائية بالذكاء الاصطناعي لا تزال حديثة العهد نسبيًا، ويرغب في الحصول على آراء المستخدمين. قبل نشر الفيديوهات، ستُخطر المنصة مُنشئي المحتوى بمحدودية قدرة الذكاء الاصطناعي على فهم المعنى والنطق وتمييز الضوضاء. وسيتعين عليهم التحقق من دقة الدبلجة قبل توزيعها على المشاهدين.
مع ذلك، ووفقًا لموقع Air.io ، فإن هذه الميزة تستحق التجربة. إنها طريقة منخفضة التكلفة لاختبار مدى إعجاب منشئي المحتوى بمحتواهم، ومدى قدرتهم على جذب مشاهدين جدد باستخدام هذه النسخ المدبلجة. ورغم أن هذه التقنية ليست مثالية، إلا أنها قادرة على توسيع نطاق وصول المحتوى.
حاليًا، لا تتوفر ميزة الدبلجة لجميع الفيديوهات، ولا يمكن للمستخدمين تعطيل هذه الميزة افتراضيًا. بدلًا من ذلك، جرّب تغيير لغة متصفحك إلى الإنجليزية لتقليل تكرار الدبلجة بالذكاء الاصطناعي.
المصدر: https://znews.vn/youtube-vua-dung-ai-de-pha-vo-rao-can-ngon-ngu-post1553547.html
تعليق (0)