Les développeurs d'IA s'appuient sur la collecte de grandes quantités de données provenant de sources diverses pour créer des modèles de langage complexes. C'est la technologie qui sous-tend les chatbots comme ChatGPT d'OpenAI et Claude, son concurrent chez Anthropic.
Anthropic a été fondée par un groupe d'anciens chercheurs d'OpenAI avec la promesse de développer des systèmes d'IA « responsables ».
Cependant, Matt Barrie, directeur général de Freelancer.com, a accusé la société basée à San Francisco d'avoir piraté le portail des journalistes indépendants, qui reçoit des millions de visiteurs par jour.
Anthropic a créé certains des chatbots les plus avancés au monde , rivalisant avec ChatGPT d'OpenAI. Photo : Jakub Porzycki
Selon des données communiquées au Financial Times, Freelancer.com a reçu 3,5 millions de visites d'un robot d'exploration Web lié à Anthropic en l'espace de quatre heures.
Barrie a ajouté que le trafic provenant de ces robots a continué d'augmenter même après que Freelancer.com a tenté de bloquer les demandes d'accès, en utilisant les protocoles web standard pour donner des instructions au robot d'exploration. Barrie a alors décidé de bloquer complètement le trafic provenant des adresses internet d'Anthropic.
Kyle Wiens, PDG d'iFixit.com, a déclaré que son site de réparation électronique avait reçu un million de visites de bots Anthropic en 24 heures. « Nous avons reçu de nombreuses alertes (en raison du trafic important) », a-t-il indiqué.
Wiens a déclaré que les conditions d'utilisation d'iFixit interdisent l'utilisation de ses données à des fins d'apprentissage automatique. « Mon premier message à Anthropic est le suivant : si vous utilisez ces données pour entraîner votre modèle, c'est illégal. Mon deuxième message est le suivant : ce n'est pas un comportement respectueux sur Internet », a-t-il affirmé.
La collecte de données n'est pas nouvelle, mais elle a connu une augmentation spectaculaire ces deux dernières années en raison de la course à l'IA. Cela a engendré de nouveaux coûts pour les sites web.
La décision du réseau social X de collecter automatiquement les données des utilisateurs pour entraîner ses chatbots pourrait enfreindre la réglementation européenne sur la protection des données. Photo : Reuters
L'autorité européenne de protection des données enquête sur la décision du réseau social X d'autoriser le transfert automatique des données des utilisateurs à la start-up d'intelligence artificielle xAI.
Plus précisément, le 26 juillet, les utilisateurs de X ont découvert qu'ils avaient accidentellement autorisé l'utilisation de leurs publications et interactions avec le chatbot Grok pour « entraîner et affiner » les systèmes xAI.
Cette décision a été prise sans le consentement explicite des utilisateurs quant au partage de leurs données. Ces paramètres ne peuvent être modifiés que sur la version de bureau de l'application mobile X.
Des experts en protection de la vie privée s'interrogent sur la conformité de la démarche de X avec le Règlement général sur la protection des données (RGPD) de l'UE, qui impose aux entreprises collectant ou utilisant des données personnelles d'obtenir au préalable le consentement des personnes concernées et d'en indiquer les raisons. Si les autorités irlandaises ouvrent une enquête, X pourrait se voir infliger des amendes ou des sanctions.
Le mois dernier, Meta a suspendu son projet d'entraînement d'IA sur les données des plateformes Facebook et Instagram en Europe suite à une demande de la CNIL (Commission irlandaise de protection des données) concernant des problèmes de conformité au RGPD. Meta a déclaré que cela constituait « un revers pour l'innovation et la concurrence européennes dans le développement de l'IA ».
Ngoc Anh (selon le FT)
Source : https://www.congluan.vn/hang-loat-cong-ty-ai-bi-cao-buoc-thu-thap-du-lieu-trai-phep-post305394.html






Comment (0)