توصل تحقيق أجرته Proof News إلى أن هذه الشركات استخدمت مجموعة بيانات أنشأتها منظمة غير ربحية تسمى EleutherAI، والتي تحتوي على تسجيلات لمحتوى فيديو YouTube من أكثر من 48000 قناة دون طلب إذن من مالكي المحتوى أو المبدعين.
ورغم أن مجموعة البيانات لا تحتوي على صور أو مقاطع فيديو، فإن المحتوى يتم سحبه من كبار منشئي المحتوى على المنصة، مثل ماركيز براونلي وMrBeast، بالإضافة إلى كبار ناشري الأخبار مثل نيويورك تايمز، وبي بي سي، وأيه بي سي نيوز. بالإضافة إلى ذلك، هناك ترجمات من مقاطع الفيديو المملوكة لشركة Engadget.
"تحصل شركة Apple على بيانات الذكاء الاصطناعي من عدد من الشركات"، هذا ما نشره براونلي، أحد مستخدمي YouTube المشهورين، على X. "أحدها هو كميات هائلة من البيانات/التسجيلات من مقاطع فيديو YouTube، بما في ذلك مقاطع الفيديو الخاصة بي."
وفي وقت سابق، أكد الرئيس التنفيذي لشركة يوتيوب، نيل موهان، أن الشركات التي تستخدم بيانات يوتيوب لتدريب نماذج الذكاء الاصطناعي تعد انتهاكًا لشروط وخدمات المنصة.
في الوقت الحالي، لا تتمتع شركات الذكاء الاصطناعي بالشفافية بشأن البيانات المستخدمة لتدريب الخوارزميات. في وقت سابق من هذا الشهر، انتقد الفنانون والمصورون شركة Apple لعدم الكشف عن مصدر بيانات التدريب لـ Apple Intelligence - وهي ميزة الذكاء الاصطناعي الجديدة التي ستكون متاحة على ملايين أجهزة Apple هذا العام.
يُعد موقع YouTube، وهو أكبر مستودع للفيديو في العالم، منجمًا ذهبيًا للبيانات اللازمة لتدريب الذكاء الاصطناعي، بما في ذلك النصوص المكتوبة والصوت والفيديو والصور.
في وقت سابق من هذا العام، تجنبت ميرا موراتي، كبيرة مسؤولي التكنولوجيا في شركة OpenAI، أسئلة من صحيفة وول ستريت جورنال حول ما إذا كانت الشركة تستخدم مقاطع فيديو يوتيوب لتدريب Sora، أداة إنشاء الفيديو بالذكاء الاصطناعي القادمة من OpenAI.
وقال موراتي في ذلك الوقت: "لن أدخل في تفاصيل البيانات التي تم استخدامها، ولكنها كانت بيانات مرخصة أو متاحة للعامة". وفي الوقت نفسه، أكد الرئيس التنفيذي لشركة Alphabet، سوندار بيتشاي، أيضًا أن الشركات التي تستخدم البيانات من YouTube لتدريب نماذج الذكاء الاصطناعي تنتهك شروط خدمة المنصة.
(وفقا لـ Proof News، WSJ)
[إعلان 2]
المصدر: https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html
تعليق (0)