Les développeurs d'IA s'appuient sur la collecte de grandes quantités de données provenant de sources variées pour créer de vastes modèles linguistiques. C'est la technologie qui sous-tend des chatbots comme ChatGPT d'OpenAI et Claude, concurrent d'Anthropic.
Anthropic a été fondée par un groupe d’anciens chercheurs d’OpenAI avec la promesse de développer des systèmes d’IA « responsables ».
Cependant, Matt Barrie, PDG de Freelancer.com, a accusé la société basée à San Francisco d'avoir piraté le portail de journalisme indépendant, qui reçoit des millions de visiteurs par jour.
Anthropic a créé certains des chatbots les plus avancés au monde , rivalisant avec ChatGPT d'OpenAI. Photo : Jakub Porzycki
Selon les données partagées avec le Financial Times, Freelancer.com a reçu 3,5 millions de visites d'un « robot d'exploration » Web lié à Anthropic en quatre heures.
Barrie a ajouté que le trafic provenant de ces robots a continué d'augmenter même après que Freelancer.com a tenté de refuser les requêtes en utilisant les protocoles web standards pour donner des instructions au robot. Barrie a alors décidé de bloquer complètement le trafic provenant des adresses internet d'Anthropic.
Kyle Wiens, PDG d'iFixit.com, a déclaré que son site de réparation électronique avait reçu un million de visites de robots Anthropic en 24 heures. « Nous avons reçu de nombreuses alertes (en raison du trafic important) », a-t-il précisé.
Wiens a déclaré que les conditions d'utilisation d'iFixit interdisent l'utilisation de leurs données à des fins d'apprentissage automatique. « Mon premier message à Anthropic est le suivant : utiliser ces données pour entraîner votre modèle est illégal. Mon deuxième message est le suivant : ce n'est pas un comportement poli sur Internet », a-t-il déclaré.
La collecte de données n'est pas nouvelle, mais elle a connu une croissance spectaculaire ces deux dernières années en raison de la course à l'IA. Cela a engendré de nouveaux coûts pour les sites web.
La décision du réseau social X de collecter automatiquement les données des utilisateurs pour former des chatbots pourrait enfreindre les règles européennes de confidentialité. Photo : Reuters
L'autorité européenne de protection des données enquête sur la décision du réseau social X d'autoriser l'alimentation automatique des données des utilisateurs à la startup d'intelligence artificielle xAI.
Plus précisément, le 26 juillet, les utilisateurs de X ont découvert qu'ils avaient accidentellement autorisé l'utilisation de leurs publications et interactions avec le chatbot Grok pour « former et affiner » les systèmes de xAI.
Ce transfert a été effectué sans le consentement explicite de l'utilisateur pour le partage de données. Ce paramètre ne peut pas être modifié sur l'application mobile X, mais uniquement sur la version bureau.
Des experts en protection de la vie privée se demandent si la démarche de X viole le Règlement général sur la protection des données (RGPD) de l'UE, qui oblige les entreprises qui collectent ou utilisent des données personnelles à obtenir au préalable le consentement de la personne concernée et à en expliquer les raisons. Si l'autorité de régulation irlandaise ouvre une enquête, X pourrait se voir infliger des amendes ou des pénalités.
Le mois dernier, Meta a suspendu son projet d'entraînement de l'IA sur les données des plateformes Facebook et Instagram en Europe après avoir reçu une demande de la DPC irlandaise concernant des problèmes de conformité au RGPD. Meta a déclaré que cela constituait « un revers pour l'innovation et la concurrence européennes dans le développement de l'IA ».
Ngoc Anh (selon le FT)
Source : https://www.congluan.vn/hang-loat-cong-ty-ai-bi-cao-buoc-thu-thap-du-lieu-trai-phep-post305394.html
Comment (0)