تحقیقات انجام شده توسط Proof News نشان داد که این شرکتها از مجموعه دادههایی که توسط یک شرکت غیرانتفاعی به نام EleutherAI ایجاد شده بود، استفاده میکردند که شامل ضبط محتوای ویدیویی یوتیوب از بیش از ۴۸۰۰۰ کانال بدون درخواست اجازه از صاحبان یا سازندگان محتوا بود.
اگرچه این مجموعه دادهها شامل تصاویر یا ویدیوها نیست، اما شامل محتوایی از تولیدکنندگان برتر محتوا در این پلتفرم، مانند Marques Brownlee و MrBeast، و همچنین ناشران بزرگ اخبار مانند The New York Times، BBC و ABC News میشود. همچنین شامل زیرنویسهایی از ویدیوهای متعلق به Engadget نیز میشود.
براونلی، یوتیوبر محبوب، در X پست گذاشت: «اپل برای هوش مصنوعی خود از تعدادی شرکت داده دریافت میکند. یکی از آنها انبوهی از دادهها/ضبطها از ویدیوهای یوتیوب، از جمله ویدیوهای من است.»
پیش از این، نیل موهان، مدیرعامل یوتیوب، تأیید کرده بود که شرکتهایی که از دادههای یوتیوب برای آموزش مدلهای هوش مصنوعی استفاده میکنند، نقض شرایط و ضوابط این پلتفرم هستند.
شرکتهای هوش مصنوعی هنوز در مورد دادههایی که برای آموزش الگوریتمهای خود استفاده میکنند، شفافسازی نکردهاند. اوایل این ماه، هنرمندان و عکاسان از اپل به دلیل عدم افشای دادههای آموزشی برای Apple Intelligence، یک ویژگی جدید هوش مصنوعی که امسال در میلیونها دستگاه اپل در دسترس خواهد بود، انتقاد کردند.
یوتیوب، بزرگترین مخزن ویدیویی جهان ، همچنین معدن طلایی از دادهها برای آموزش هوش مصنوعی است، از جمله متنها، صدا، ویدیو و تصاویر.
اوایل امسال، میرا موراتی، مدیر ارشد فناوری OpenAI، از پاسخ به سوالات وال استریت ژورنال در مورد اینکه آیا این شرکت از ویدیوهای یوتیوب برای آموزش Sora، ابزار ساخت ویدیوی هوش مصنوعی آینده OpenAI، استفاده کرده است یا خیر، طفره رفت.
موراتی در آن زمان گفت: «من وارد جزئیات دادههای مورد استفاده نمیشوم، اما این دادهها دارای مجوز یا دادههای در دسترس عموم بودند.» در همین حال، ساندار پیچای، مدیرعامل آلفابت، نیز تأکید کرد که شرکتهایی که از دادههای یوتیوب برای آموزش مدلهای هوش مصنوعی استفاده میکنند، شرایط خدمات این پلتفرم را نقض کردهاند.
(طبق گزارش Proof News، وال استریت ژورنال)
منبع: https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html
نظر (0)