חקירה של Proof News מצאה כי חברות אלו השתמשו במערך נתונים שנוצר על ידי חברה ללא מטרות רווח בשם EleutherAI, שהכיל הקלטות של תוכן וידאו ביוטיוב מיותר מ-48,000 ערוצים מבלי לבקש אישור מהבעלים או מיוצרי התוכן.
למרות שמאגר הנתונים אינו מכיל תמונות או סרטונים, הוא כולל תוכן מיוצרי תוכן מובילים בפלטפורמה, כגון Marques Brownlee ו-MrBeast, כמו גם מוציאים לאור חדשות גדולים כמו The New York Times, BBC ו-ABC News. הוא כולל גם כיתובים מסרטונים שבבעלות Engadget.
"אפל מקבלת נתונים עבור הבינה המלאכותית שלה ממספר חברות", פרסם בראונלי, יוטיובר פופולרי, ב-X. "אחד מהם הוא טונות של נתונים/הקלטות מסרטוני יוטיוב, כולל שלי".
בעבר, מנכ"ל יוטיוב, ניל מוהאן, אישר כי חברות המשתמשות בנתוני יוטיוב כדי לאמן מודלים של בינה מלאכותית מהוות הפרה של תנאי השירות של הפלטפורמה.
חברות בינה מלאכותית טרם היו שקופות לגבי הנתונים שהן משתמשות בהם כדי לאמן את האלגוריתמים שלהן. מוקדם יותר החודש, אמנים וצלמים ביקרו את אפל על כך שלא חשפה את נתוני האימון עבור Apple Intelligence, תכונה חדשה של בינה מלאכותית שתהיה זמינה במיליוני מכשירי אפל השנה.
יוטיוב, מאגר הסרטונים הגדול בעולם , הוא גם מכרה זהב של נתונים לאימון בינה מלאכותית, כולל תמלולים, אודיו, וידאו ותמונות.
מוקדם יותר השנה, מירה מוראטי, סמנכ"לית הטכנולוגיה של OpenAI, התחמקה משאלות של הוול סטריט ג'ורנל בנוגע לשאלה האם החברה השתמשה בסרטוני יוטיוב כדי לאמן את Sora, כלי יצירת הסרטונים הבינה המלאכותית הקרוב של OpenAI.
"לא אכנס לפרטים על הנתונים שבהם נעשה שימוש, אבל אלו היו נתונים ברישיון או זמינים לציבור", אמר מוראטי באותה עת. בינתיים, מנכ"ל אלפבית, סונדר פיצ'אי, הדגיש גם כי חברות המשתמשות בנתונים מיוטיוב כדי לאמן מודלים של בינה מלאכותית הפרו את תנאי השירות של הפלטפורמה.
(על פי Proof News, WSJ)
[מודעה_2]
מקור: https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html
תגובה (0)