توصل تحقيق أجرته Proof News إلى أن هذه الشركات استخدمت مجموعة بيانات أنشأتها منظمة غير ربحية تسمى EleutherAI، والتي تحتوي على تسجيلات لمحتوى فيديو YouTube من أكثر من 48000 قناة دون طلب إذن من مالكي المحتوى أو المبدعين.
مع أن مجموعة البيانات لا تحتوي على صور أو مقاطع فيديو، إلا أنها تتضمن محتوى من كبار المبدعين على المنصة، مثل ماركيز براونلي ومستر بيست، بالإضافة إلى ناشري أخبار رئيسيين مثل نيويورك تايمز وبي بي سي وإيه بي سي نيوز. كما تتضمن تعليقات توضيحية من مقاطع فيديو مملوكة لشركة إنغادجيت.
"تحصل شركة Apple على بيانات الذكاء الاصطناعي من عدد من الشركات"، هذا ما نشره براونلي، أحد مستخدمي YouTube المشهورين، على X. "أحدها هو كميات هائلة من البيانات/التسجيلات من مقاطع فيديو YouTube، بما في ذلك مقاطع الفيديو الخاصة بي."
وفي وقت سابق، أكد الرئيس التنفيذي لشركة يوتيوب، نيل موهان، أن الشركات التي تستخدم بيانات يوتيوب لتدريب نماذج الذكاء الاصطناعي تعد انتهاكًا لشروط وخدمات المنصة.
لم تُبدِ شركات الذكاء الاصطناعي شفافيةً بعد بشأن البيانات التي تستخدمها لتدريب خوارزمياتها. في وقتٍ سابق من هذا الشهر، انتقد فنانون ومصورون شركة آبل لعدم كشفها بيانات التدريب الخاصة بـ Apple Intelligence، وهي ميزة ذكاء اصطناعي جديدة ستتوفر على ملايين أجهزة آبل هذا العام.
يُعد موقع YouTube، وهو أكبر مستودع للفيديو في العالم ، منجمًا ذهبيًا للبيانات اللازمة لتدريب الذكاء الاصطناعي، بما في ذلك النصوص المكتوبة والصوت والفيديو والصور.
في وقت سابق من هذا العام، تجنبت ميرا موراتي، كبيرة مسؤولي التكنولوجيا في شركة OpenAI، أسئلة من صحيفة وول ستريت جورنال حول ما إذا كانت الشركة تستخدم مقاطع فيديو يوتيوب لتدريب Sora، أداة إنشاء الفيديو بالذكاء الاصطناعي القادمة من OpenAI.
قال موراتي آنذاك: "لن أخوض في تفاصيل البيانات المستخدمة، لكنها بيانات مرخصة أو متاحة للعامة". في غضون ذلك، أكد سوندار بيتشاي، الرئيس التنفيذي لشركة ألفابت، أن الشركات التي تستخدم بيانات من يوتيوب لتدريب نماذج الذكاء الاصطناعي تنتهك شروط خدمة المنصة.
(وفقا لـ Proof News، WSJ)
[إعلان 2]
المصدر: https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html
تعليق (0)