Début impressionnant
Les expériences de La Nación en matière d'IA ont débuté par une enquête sur les énergies renouvelables en Argentine. En 2016, le président argentin de l'époque, Mauricio Macri, a lancé un programme visant à développer les sources d'énergie propres du pays, s'appuyant largement sur l'investissement social et la coopération internationale.
Inspirée par une initiative visant à cartographier chaque panneau solaire aux États-Unis, Florencia Coelho, spécialiste de la communication de premier plan à La Nación, a proposé un projet visant à cartographier les progrès du programme quatre ans après son lancement.
L'équipe de données de La Nación a lancé le projet en collaboration avec Mathias Felipe, partenaire invité de l'Université de Navarre, en Espagne. L'équipe a utilisé l'apprentissage automatique (ML) et la vision par ordinateur, et a collaboré avec un laboratoire tiers spécialisé dans l'analyse géospatiale et l'IA.
La rédaction de La Nación est pionnière dans l’apprentissage et l’application de l’IA dans la production d’informations. Photo de : La Nation
L'algorithme de La Nación a été entraîné pour identifier les formes des parcs solaires en Argentine. La vision par ordinateur entraîne les ordinateurs à analyser et comprendre les images. 10 999 images ont été utilisées pour entraîner l'algorithme, avant de traiter 7 millions d'images et d'analyser 2 780 400 kilomètres carrés de terres. Le résultat est une série riche en données qui montre à quel point le programme argentin d'énergie propre de l'époque n'atteignait pas ses objectifs déclarés.
Soyez patient et coopératif
En réalité, le projet d'IA de La Nación a rencontré de nombreux défis. L'accès aux images satellite était coûteux. Les parcs solaires ressemblaient beaucoup à des fermes agricoles . En 2019, les images des parcs solaires argentins manquaient pour entraîner le modèle d'IA ; ils ont donc dû se les procurer au Chili.
Coelho a partagé un autre défi et expliqué comment le relever : « L’infrastructure et les compétences éditoriales de La Nación n’étaient pas suffisantes pour mener à bien ce projet. Nous ne disposions ni du matériel ni de la puissance de calcul nécessaires, c’est pourquoi nous avons collaboré. »
Grâce à cette collaboration initiale, l'équipe data de La Nación a compris les avantages de la collaboration. Elle a également compris qu'une mauvaise compréhension de l'IA risquait de cibler les mauvaises personnes. Elle a donc créé un laboratoire d'IA composé de journalistes, d'analystes de données et d'autres professionnels pour aider La Nación à accélérer l'adoption de cette technologie.
Le premier projet du laboratoire consistait à analyser les paroles de la musique trap, un genre hip-hop né dans le sud des États-Unis à la fin des années 1990. Il leur a fallu sept mois pour y parvenir. L'équipe a utilisé l'apprentissage automatique, des modèles de traitement automatique du langage naturel (TALN), l'API Spotify et d'autres outils pour analyser 692 chansons et comprendre les thèmes, les tendances et les messages de ce genre musical de plus en plus populaire en Argentine.
La Nación a utilisé diverses technologies d'IA pour analyser des images satellites dans le cadre d'un projet de cartographie de parcs solaires en Argentine. Photo : La Nación
Cependant, l'IA utilisée par les journalistes a dû gérer plusieurs problèmes linguistiques, notamment l'apparition de nouveaux mots dans les chansons trap, ainsi que de nombreuses autres caractéristiques du genre. Les tests de La Nación ont également montré que l'IA était presque exclusivement conçue pour l'anglais. « Tous les modèles de traitement du langage naturel sont conçus pour l'anglais », a déclaré Bouret. « Il nous a été très difficile de trouver des bibliothèques et des routines capables de résoudre le problème de l'espagnol. »
Un autre défi majeur pour les rédactions qui souhaitent mettre en œuvre des projets d'IA est le temps. « Certains projets prennent cinq à sept mois ; ce sont des projets à long terme. Les rédactions sont très difficiles à comprendre, car elles sont toujours pressées. Il faut être patient », a déclaré Bouret, ajoutant : « Les journalistes d'investigation peuvent passer un an à enquêter sur la corruption ou un événement. Nous sommes pareils, nous sommes des journalistes d'investigation sur la technologie. »
Par conséquent, cet expert a déclaré que la collaboration, que ce soit avec des experts en IA tiers, des universités ou des scientifiques , aidera les salles de rédaction à accélérer le processus et à réduire les coûts liés à l'adoption de nouvelles technologies.
« Nous devons tous apprendre »
La collaboration entre les organes de presse peut également contribuer à promouvoir l'adoption de l'IA et à révéler davantage de ressources, comme le montre l'expérience de La Nación. L'équipe IA de La Nación travaille sur un outil de suivi des inégalités entre les sexes hébergé par le JournalismAI Collab de la London School of Economics .
Ils l'ont appliqué à des projets spécifiques à La Nación, notamment pour mieux comprendre les préjugés sexistes dans le journalisme. Ce travail aidera le service commercial de la rédaction à évaluer l'impact du genre sur la performance des articles, notamment l'impact des articles écrits par des hommes ou des femmes sur les lecteurs, ainsi que d'autres problématiques.
Dans le prolongement de son projet de suivi du genre, La Nación a également participé à un projet d'IA open source qui rassemble des organes de presse du monde entier pour travailler sur la détection du genre dans les visages. En partageant une cinquantaine de portraits d'Argentins et d'Amérique latine avec l'équipe de formation, ils ont aidé le modèle d'IA à détecter des visages plus diversifiés en termes de couleur de peau et d'origine ethnique.
Cela dit, que ce soit entre entreprises technologiques ou entre rédactions, la collaboration sur les projets d'IA est essentielle pour les organes de presse. « Les compétences en IA sont difficiles à acquérir, il est donc préférable d'apprendre les uns des autres, même de publications concurrentes », conseille Coelho.
Enfin, l'expert a insisté : « Nous sommes en concurrence avec Google et Facebook pour regagner l'attention des lecteurs. Il est regrettable qu'il nous ait fallu une décennie pour le comprendre. Par conséquent, notre journalisme doit accélérer le processus d'apprentissage et de partage, tout en travaillant ensemble, même entre pays. Nous devrons tous apprendre, car l'IA est trop vaste pour une seule personne. »
Bui Huy
Source
Comment (0)