En rad AI-företag anklagade för olaglig datainsamling

[annons_1]

AI-utvecklare förlitar sig på att samla in stora mängder data från många olika källor för att skapa stora språkmodeller. Det här är tekniken bakom chattrobotar som OpenAI:s ChatGPT och Anthropics konkurrent Claude.

Anthropic grundades av en grupp tidigare OpenAI-forskare med löfte om att utveckla "ansvarsfulla" AI-system.

Matt Barrie, VD för Freelancer.com, har dock anklagat det San Francisco-baserade företaget för att ha hackat sig in på frilansjournalistportalen, som får miljontals besökare varje dag.

En rad företag anklagades för olaglig insamling av data, foto 1 — Anthropic har skapat några av världens mest avancerade chatbotar, som konkurrerar med OpenAI:s ChatGPT. Foto: Jakub Porzycki

Enligt data som delats med Financial Times fick Freelancer.com 3,5 miljoner besök från en webb-"crawler" kopplad till Anthropic inom fyra timmar.

Barrie tillade att trafiken från dessa bottar fortsatte att öka även efter att Freelancer.com försökte neka åtkomstförfrågningarna med hjälp av standardwebbprotokoll för att instruera sökroboten. Barrie beslutade sedan att blockera trafik från Anthropics internetadresser helt och hållet.

Kyle Wiens, VD för iFixit.com, sa att hans webbplats för elektronikreparationer fick 1 miljon besök från Anthropic-robotar på 24 timmar. ”Vi fick många varningar (på grund av den höga trafiken)”, sa han.

Wiens sa att iFixits användarvillkor förbjuder användning av dess data för maskininlärningsändamål. "Mitt första meddelande till Anthropic är: Om du använder dessa data för att träna din modell är det olagligt. Mitt andra meddelande är: Det är inte artigt beteende på internet", sa han.

Datainsamling är inget nytt, men det har ökat dramatiskt de senaste två åren på grund av AI-kapplöpningen. Det har skapat nya kostnader för webbplatser.

En rad företag anklagades för olaglig insamling av data, bild 2 — Sociala nätverket X:s drag att automatiskt samla in användardata för att träna chattrobotar kan bryta mot europeiska integritetsregler. Foto: Reuters

Europas dataskyddsmyndighet utreder det sociala nätverket X:s beslut att tillåta att användardata automatiskt matas in till artificiell intelligens-startupen xAI.

Mer specifikt upptäckte X-användare den 26 juli att de av misstag hade tillåtit att deras inlägg och interaktioner med Grok-chatboten användes för att "träna och förfina" xAI-system.

Denna åtgärd gjordes utan användarnas uttryckliga samtycke till att dela data. Inställningarna kan inte ändras i X:s mobilapp, endast i datorversionen.

Integritetsexperter har ifrågasatt om X:s åtgärd bryter mot reglerna i EU:s allmänna dataskyddsförordning, som kräver att företag som samlar in eller använder personuppgifter först inhämtar en individs samtycke och uppger sina skäl för att göra det. Om irländska tillsynsmyndigheter inleder en utredning kan X få böter eller påföljder.

Förra månaden pausade Meta sina planer på att utbilda AI på data från Facebook- och Instagram-plattformar i Europa efter att ha mottagit en begäran från Irlands dataskyddsrådgivningscentral gällande GDPR-efterlevnadsfrågor. Meta sa att detta markerade "ett bakslag för europeisk innovation och konkurrens inom AI-utveckling".

Ngoc Anh (enligt FT)

[annons_2]
Källa: https://www.congluan.vn/hang-loat-cong-ty-ai-bi-cao-buoc-thu-thap-du-lieu-trai-phep-post305394.html