Eine Untersuchung von Proof News ergab, dass diese Unternehmen einen von einer gemeinnützigen Organisation namens EleutherAI erstellten Datensatz verwendeten, der Aufzeichnungen von YouTube-Videoinhalten aus mehr als 48.000 Kanälen enthielt, ohne die Erlaubnis der Inhaltseigentümer oder -ersteller einzuholen.
Obwohl der Datensatz keine Bilder oder Videos enthält, stammen die Inhalte von den Top-Inhaltserstellern der Plattform, wie Marques Brownlee und MrBeast, sowie von großen Nachrichtenverlagen wie der New York Times, BBC und ABC News. Darüber hinaus gibt es Untertitel von Videos im Besitz von Engadget.
„Apple erhält Daten für seine KI von einer Reihe von Unternehmen“, postete Brownlee, ein beliebter YouTuber, auf X. „Eines davon sind Unmengen an Daten/Aufzeichnungen von YouTube-Videos, darunter auch meines.“
Zuvor hatte YouTube-CEO Neal Mohan bekräftigt, dass die Verwendung von YouTube-Daten durch Unternehmen zum Trainieren von KI-Modellen einen Verstoß gegen die Geschäftsbedingungen und Dienste der Plattform darstelle.
Derzeit sind KI-Unternehmen nicht transparent, was die Daten angeht, die zum Trainieren ihrer Algorithmen verwendet werden. Anfang des Monats kritisierten Künstler und Fotografen Apple dafür, dass das Unternehmen die Trainingsdatenquelle für Apple Intelligence nicht offengelegt habe – eine neue KI-Funktion, die in diesem Jahr auf Millionen von Apple-Geräten verfügbar sein wird.
YouTube, das weltweit größte Videoarchiv, ist außerdem eine Goldgrube an Daten für das Training von KI, darunter Transkripte, Audio-, Video- und Bilddaten.
Anfang des Jahres wich Mira Murati, Chief Technology Officer von OpenAI, den Fragen des Wall Street Journal aus, ob das Unternehmen YouTube-Videos zum Trainieren von Sora, dem kommenden KI-Tool zur Videoerstellung von OpenAI, verwendet habe.
„Ich werde nicht näher auf die verwendeten Daten eingehen, aber es waren lizenzierte oder öffentlich verfügbare Daten“, sagte Murati damals. Unterdessen betonte auch Alphabet-CEO Sundar Pichai, dass Unternehmen, die Daten von YouTube zum Trainieren von KI-Modellen verwenden, gegen die Nutzungsbedingungen der Plattform verstoßen.
(Laut Proof News, WSJ)
[Anzeige_2]
Quelle: https://vietnamnet.vn/apple-nvidia-va-anthropic-su-dung-trai-phep-du-lieu-youtube-de-dao-tao-ai-2303028.html
Kommentar (0)