Une partie d'Internet a complètement disparu. Photo : Yale Alumni Magazine . |
Nous vivons à l'ère du numérique, avec un espace de stockage illimité. Aujourd'hui, la plupart des générations publient des photos et des vidéos en ligne pour conserver leurs souvenirs en toute sécurité. Cependant, paradoxalement, les informations se perdent plus facilement que jamais.
Selon IDC, d'ici 2025, le monde générera plus de 180 zettaoctets de données par an, mais une grande partie de ces données sera éphémère et mal gérée. Aujourd'hui, chaque personne dispose de 4 000 fois plus de contenu qu'il y a 15 ans, sans parler d'une boîte de réception contenant des milliers d'e-mails.
Les archivistes numériques craignent un âge sombre du numérique, où les données d'une période donnée seront si rares ou introuvables qu'elles disparaîtront complètement. De plus, avec l'essor de l'IA, les contenus originaux créés par l'homme deviennent particulièrement rares.
Débordement de la mémoire numérique
Près de 90 à 95 % des données mondiales ont été créées ces dernières années. Avec l'arrivée de nombreuses plateformes de médias sociaux, Digital Silk prévoit que la quantité de contenu va plus que doubler d'ici 2028, pour atteindre 394 zettaoctets.
Chaque personne produit et consomme une quantité incroyable de données. Digital Silk rapporte que les utilisateurs d'Instagram publient 95 millions de photos et de vidéos sur la plateforme chaque jour. Chaque heure passée sur TikTok consomme 840 Mo de données. Écouter de la musique et regarder des vidéos sur Spotify et YouTube consomme également d'innombrables ressources numériques.
L'archivage des données est une tâche incessante et de plus en plus difficile. La société actuelle produit tellement de données que nous en supprimons nous-mêmes un peu plus chaque année pour perpétuer le cycle. Les archivistes doivent également choisir ce qu'ils conservent et ce qu'ils jettent pour faire de la place.
Les informations provenant de célébrités sont parmi les plus difficiles à archiver. À la British Library, lorsqu'une personne influente reçoit son ordinateur portable ou son téléphone, Callum McKean, archiviste numérique en chef de la bibliothèque, copie l'intégralité du disque dur pour créer une copie originale.
![]() |
La quantité de données devient écrasante pour les archivistes. Photo : The Atlantic. |
Les archivistes créent ensuite une version organisée, nettoyant les informations sensibles, de la même manière qu'ils traitent les documents papier. Certains logiciels prétendent faciliter cette tâche, mais ils ne sont pas parfaits. Dans certains cas, ils doivent parcourir chaque fichier manuellement.
Des millions de messages et d'images sont envoyés chaque heure via d'innombrables applications de messagerie. Le magazine MIT Technology affirme que l'information est aujourd'hui plus fragile que jamais, des plateformes comme YouTube et Facebook étant susceptibles de disparaître un jour.
Cela s'est déjà produit. MySpace, le premier grand réseau social, a apparemment supprimé par erreur toutes les photos, vidéos et fichiers audio publiés avant 2016. En juin 2024, plus de vingt ans de journalisme musical ont disparu lorsque les archives de MTV News ont été retirées d'Internet.
Contenu de l'IA indiscernable
Ailleurs, malgré la prolifération récente de contenus, l'authenticité de tous les contenus n'est pas garantie. Les experts de Cloudflare, qui exploite l'un des plus grands réseaux Internet au monde, craignent que l'IA générative ne « pollue » les données humaines originales.
L'intelligence artificielle est entraînée à apprendre des humains. Mais la plupart des contenus en ligne étant générés par l'IA, elle est plus susceptible de se copier elle-même, ce qui en dilue la qualité.
Les scientifiques ont comparé ce phénomène à la catastrophe de la pollution de l'acier après la Seconde Guerre mondiale, lorsque tout l'acier au sol a été affecté par les radiations, rendant impossible toute garantie d'exactitude. Les documents antérieurs à 2022, date du lancement de l'IA, se font de plus en plus rares et risquent fortement de disparaître s'ils ne sont pas conservés à temps.
De nombreux forums, autrefois lieux de partage et d'activités culturelles numériques pour les jeunes, comme Yahoo 360, ont disparu d'Internet. Parallèlement, des plateformes modernes comme Facebook, TikTok et même Reddit, autrefois lieux d'échange, sont désormais dominées par des algorithmes et des contenus générés par l'IA.
![]() |
Wayback Machine, l'un des projets qui archive les captures d'écran de sites web disparus. Photo : Internet Archive. |
Aujourd'hui, les contenus originaux créés par l'homme sont rapidement supprimés en raison des politiques de confidentialité ou des réglementations sur le stockage à court terme. De nombreuses applications de messagerie comme Instagram, WhatsApp et Snapchat permettent aux utilisateurs de programmer la disparition des messages après un certain temps. De nombreuses fonctionnalités, comme les stories et le mode disparition, sont également conçues pour encourager le contenu à court terme.
Le contenu original est important, car il constitue le fondement de la plupart des découvertes ultérieures. Selon Business Insider, préserver ces données nous permet de bâtir un avenir digne de confiance.
De plus en plus d'informations brutes sont créées chaque jour, remplaçant des contenus obsolètes. The Atlantic souligne que les historiens pourraient perdre l'accès à des documents privés très révélateurs, ouvrant la voie à un « âge des ténèbres numériques ».
Source : https://znews.vn/ky-nguyen-den-toi-ky-thuat-so-dang-den-post1560393.html
Comment (0)