Vietnam.vn - Nền tảng quảng bá Việt Nam

كما تعمل أدوات تحويل الكلام إلى نص باستخدام الذكاء الاصطناعي على "تشويه"

Công LuậnCông Luận29/10/2024

يتم الإعلان عن أداة تحويل الكلام إلى نص Whisper من OpenAI على أنها "قوية ودقيقة على مستوى الإنسان تقريبًا"، ولكن لديها عيب رئيسي واحد: إنها عرضة لتزييف أجزاء نصية أو حتى جمل كاملة!


ويقول الخبراء إن بعض النصوص التي تفبركها، والمعروفة في هذه الصناعة بأنها نصوص هلوسة، يمكن أن تتضمن تعليقات عنصرية وعنفًا وحتى علاجات طبية خيالية.

ويقول الخبراء إن مثل هذه التلفيقات خطيرة لأن برنامج Whisper يستخدم في العديد من الصناعات حول العالم لترجمة ونسخ المقابلات وإنشاء النصوص ومقاطع الفيديو المصاحبة.

والأمر الأكثر إثارة للقلق هو أن المراكز الطبية تستخدم أدوات تعتمد على Whisper لتسجيل استشارات المرضى والأطباء، على الرغم من تحذير OpenAI من أنه لا ينبغي استخدام الأداة في "المناطق عالية الخطورة".

أداة تحويل الكلام إلى نص يمكن لأي شخص قراءتها - الصورة 1

الجمل التي تبدأ بـ "#Groundtruth" هي ما قيل بالفعل، والجمل التي تبدأ بـ "#text" هي ما نقله ويسبر. الصورة: أسوشيتد برس

يقول باحثون ومهندسون إن جهاز ويسبر يُسبب هلوسات متكررة أثناء استخدامه. على سبيل المثال، قال باحث من جامعة ميشيغان إنه وجد هلوسات في ثمانية من أصل عشرة تسجيلات فحصها.

اكتشف أحد مهندسي التعلم الآلي الأوائل تلاعبًا في حوالي نصف نصوص ويسبر التي حللها، والتي تجاوزت مئة ساعة. وقال مطور ثالث إنه وجد هلوسات في كل نص تقريبًا من النصوص الستة والعشرين ألفًا التي أُنتجت باستخدام ويسبر.

يستمر هذا الوهم حتى في عينات صوتية قصيرة ومُسجلة جيدًا. وقد وجدت دراسة حديثة أجراها علماء حاسوب 187 تشويشًا في أكثر من 13,000 مقطع صوتي واضح فحصوه.

وقال الباحثون إن هذا الاتجاه من شأنه أن يؤدي إلى عشرات الآلاف من الأخطاء عبر ملايين التسجيلات.

وقالت ألوندرا نيلسون، أستاذة في كلية العلوم الاجتماعية في معهد الدراسات المتقدمة، إن مثل هذه الأخطاء يمكن أن يكون لها "عواقب وخيمة حقًا"، خاصة في بيئة المستشفى.

لا أحد يرغب في أن يُشخَّص خطأً. يجب أن يكون هناك حاجز أعلى، كما قال نيلسون.

قامت الأستاذتان أليسون كوينيكي من جامعة كورنيل ومونا سلون من جامعة فرجينيا بفحص آلاف المقتطفات القصيرة التي استرجعتاها من "توك بانك"، وهو أرشيف بحثي في ​​جامعة كارنيجي ميلون. وخلصتا إلى أن ما يقرب من 40% من الهلوسات كانت ضارة أو مزعجة، إذ قد يُساء فهم المتحدث أو يُحرض على تصرفاته.

في أحد التسجيلات، وصف أحد المتحدثين "فتاتين أخريين وامرأة"، لكن ويسبر اختلق تعليقًا عنصريًا إضافيًا، مضيفًا "فتاتين أخريين وامرأة، أممم، كانت سوداء".

في نسخة أخرى، اخترع ويسبر دواءً غير موجود يُسمى "المضادات الحيوية ذات النشاط المتزايد".

في حين يعترف معظم المطورين بأن أدوات النسخ يمكن أن ترتكب أخطاء إملائية أو أخطاء أخرى، يقول المهندسون والباحثون إنهم لم يروا أبدًا أداة نسخ مدعومة بالذكاء الاصطناعي مهلوسة مثل Whisper.

تم دمج هذه الأداة في عدة إصدارات من برنامج ChatGPT، روبوت الدردشة الرائد من OpenAI، وهي خدمة متكاملة ضمن منصة الحوسبة السحابية من Oracle وMicrosoft، تخدم آلاف الشركات حول العالم. كما تُستخدم لنسخ النصوص وترجمتها إلى العديد من اللغات.

نغوك آنه (وفقًا لوكالة أسوشيتد برس)


[إعلان 2]
المصدر: https://www.congluan.vn/cong-cu-chuyen-giong-noi-thanh-van-ban-ai-cung-co-the-xuyen-tac-post319008.html

تعليق (0)

No data
No data

نفس الموضوع

نفس الفئة

يذهب الشباب إلى الشمال الغربي للتحقق خلال موسم الأرز الأكثر جمالًا في العام
في موسم صيد عشبة القصب في بينه ليو
في وسط غابة المانغروف في كان جيو
يجني صيادو كوانج نجاي ملايين الدونغ يوميًا بعد الفوز بالجائزة الكبرى في صيد الروبيان

نفس المؤلف

إرث

شكل

عمل

كوم لانغ فونغ - طعم الخريف في هانوي

الأحداث الجارية

النظام السياسي

محلي

منتج