Eine Untersuchung von Proof News ergab, dass diese Unternehmen einen von einer gemeinnützigen Organisation namens EleutherAI erstellten Datensatz verwendeten, der Aufzeichnungen von YouTube-Videoinhalten aus mehr als 48.000 Kanälen enthielt, ohne die Erlaubnis der Inhaltseigentümer oder -ersteller einzuholen.

Obwohl der Datensatz keine Bilder oder Videos enthält, stammen die Inhalte von den Top-Inhaltserstellern der Plattform, wie Marques Brownlee und MrBeast, sowie von großen Nachrichtenverlagen wie der New York Times, BBC und ABC News. Darüber hinaus gibt es Untertitel von Videos im Besitz von Engadget.

8d541010 38d9 11ef b7fd 2183e5dd7ce6.jpg
Apple Intelligence wird vorgeworfen, Daten der Kreativ-Community von YouTube illegal zu verwenden. Foto: Yahoo Tech

„Apple erhält Daten für seine KI von einer Reihe von Unternehmen“, postete Brownlee, ein beliebter YouTuber, auf X. „Eines davon sind Unmengen an Daten/Aufzeichnungen von YouTube-Videos, darunter auch meines.“

Zuvor hatte YouTube-CEO Neal Mohan bekräftigt, dass die Verwendung von YouTube-Daten durch Unternehmen zum Trainieren von KI-Modellen einen Verstoß gegen die Geschäftsbedingungen und Dienste der Plattform darstelle.

Derzeit sind KI-Unternehmen nicht transparent, was die Daten angeht, die zum Trainieren ihrer Algorithmen verwendet werden. Anfang des Monats kritisierten Künstler und Fotografen Apple dafür, dass das Unternehmen die Trainingsdatenquelle für Apple Intelligence nicht offengelegt habe – eine neue KI-Funktion, die in diesem Jahr auf Millionen von Apple-Geräten verfügbar sein wird.

YouTube, das weltweit größte Videoarchiv, ist außerdem eine Goldgrube an Daten für das Training von KI, darunter Transkripte, Audio-, Video- und Bilddaten.

Anfang des Jahres wich Mira Murati, Chief Technology Officer von OpenAI, den Fragen des Wall Street Journal aus, ob das Unternehmen YouTube-Videos zum Trainieren von Sora, dem kommenden KI-Tool zur Videoerstellung von OpenAI, verwendet habe.

„Ich werde nicht näher auf die verwendeten Daten eingehen, aber es waren lizenzierte oder öffentlich verfügbare Daten“, sagte Murati damals. Unterdessen betonte auch Alphabet-CEO Sundar Pichai, dass Unternehmen, die Daten von YouTube zum Trainieren von KI-Modellen verwenden, gegen die Nutzungsbedingungen der Plattform verstoßen.

(Laut Proof News, WSJ)

Apple und Samsung überholen chinesische Smartphone-Marken . Daten von Counterpoint Research zeigen, dass der globale Smartphone-Markt im zweiten Quartal 2024 um 6 % gewachsen ist, wobei Apple und Samsung die ersten beiden Plätze belegen, gefolgt von chinesischen Marken wie Xiaomi, Vivo und Oppo.