Vietnam.vn - Nền tảng quảng bá Việt Nam

L'Église ancienne détient plus de 1 000 milliards de pages web mondiales

L'Église de la Science Chrétienne, qui existe depuis 10 ans, abrite désormais l'Internet Archive, la plus grande bibliothèque numérique à but non lucratif au monde.

VTC NewsVTC News19/11/2025

À quelques pâtés de maisons du Golden Gate Bridge (San Francisco, États-Unis), le bâtiment blanc aux 8 piliers massifs qui se dresse à l'extérieur accomplit discrètement la plus grande mission de l'histoire d'Internet : stocker plus de 1 000 milliards de pages web, soit plus de 100 000 téraoctets de données, de quoi remplir des dizaines de millions de DVD.

Ce bâtiment, qui abritait autrefois une église de la Science Chrétienne vieille d'un siècle, accueille aujourd'hui l'Internet Archive, la plus grande bibliothèque numérique à but non lucratif au monde .

Le siège d'Internet Archive se trouve à San Francisco (États-Unis). (Photo : KALW)

Le siège d'Internet Archive se trouve à San Francisco (États-Unis). (Photo : KALW)

Le son familier des lectures bibliques a été remplacé par le bruit des ventilateurs de refroidissement de milliers de serveurs situés en plein centre de l'église principale, sous les magnifiques vitraux.

C’est ici que la Wayback Machine, utilisée quotidiennement par des millions de personnes, a préservé près de trois décennies d’histoire d’Internet. En octobre dernier, cet immense répertoire a officiellement franchi le cap du billion de pages web archivées depuis que Brewster Kahle, fondateur d’Internet Archive, a lancé le projet en 1996.

À l'époque, une année de données web occupait environ 2 téraoctets, soit la même capacité de stockage qu'un iPhone actuel. Aujourd'hui, la Wayback Machine collecte près de 150 téraoctets par jour, l'équivalent de centaines de millions de nouvelles pages web.

Brewster Kahle, avec ses cheveux argentés et son sourire permanent, tel un professeur de sciences enthousiaste, a choisi d'acheter la vieille église car elle ressemblait au symbole de son organisation : des colonnes grecques antiques, symbole de longévité.

« Nous voulons rappeler aux gens qu'Internet a lui aussi besoin d'une "Grande Bibliothèque d'Alexandrie" des temps modernes », a-t-il déclaré, assis sur le même banc en bois qui subsiste de l'époque où l'église était en pleine activité.

Préserver les « souvenirs numériques »

Brewster Kahle, fondateur d'Internet Archive. (Photo : AP)

Brewster Kahle, fondateur d'Internet Archive. (Photo : AP)

La Wayback Machine ne se contente pas de prendre des captures d'écran de sites web qui étaient et sont encore actifs ; elle sauvegarde l'intégralité du code source HTML, CSS et JavaScript afin de pouvoir recréer le site web exactement tel qu'il était à l'époque, même si le serveur d'origine a été fermé depuis longtemps.

Grâce à cela, les journalistes peuvent retrouver des articles supprimés, les chercheurs peuvent comparer les informations de chaque mandat gouvernemental , ou les internautes peuvent revisiter leurs sites web préférés qui ont disparu, tels que Geocities, Gawker et MTV News.

Alors même que l'intelligence artificielle (IA) brouille la frontière entre le réel et le faux, l'Internet Archive a une autre mission : archiver le contenu généré par l'IA.

Chaque jour, l'équipe d'ingénieurs et de bibliothécaires de la bibliothèque élabore des centaines de questions à partir de l'actualité, les soumet à ChatGPT, Gemini ou d'autres modèles d'IA, puis stocke les questions et les réponses. Les résumés qui apparaissent en haut des résultats de recherche Google sont également archivés avec soin.

Le fondateur, Brewster Kahle, ne cache pas ses raisons : « Les bibliothèques sont toujours la première cible de chaque nouvelle administration qui arrive au pouvoir. » (Photo : Amber Hughes)

Le fondateur, Brewster Kahle, ne cache pas ses raisons : « Les bibliothèques sont toujours la première cible de chaque nouvelle administration qui arrive au pouvoir. » (Photo : Amber Hughes)

Pour se prémunir contre les risques naturels ou politiques, des copies des données sont disséminées dans de nombreux endroits à travers le monde. Le fondateur, Brewster Kahle, ne cache pas la raison de cette stratégie : « Les bibliothèques sont toujours la première cible lors de l’arrivée au pouvoir d’un nouveau gouvernement. Nous tirons les leçons du passé pour préparer l’avenir. »

En 2017, puis plus récemment sous l'administration Trump, plusieurs sites web du gouvernement américain ont été vidés de toute information relative au changement climatique, aux droits des personnes LGBTQ+ et aux réalisations des militaires noirs. Grâce à Internet Archive, la presse a pu rétablir fidèlement ces informations.

Le foyer des « esprits cyberpunk »

En pénétrant au siège d'Internet Archive, les visiteurs peuvent aisément se croire plongés dans un musée vivant d'Internet. Plus de cent statues en terre cuite d'un mètre de haut, représentant chacune un employé ayant travaillé ici pendant au moins trois ans, sont alignées à la manière de l'armée de terre cuite du mausolée de Qin Shi Huang.

Environ 200 personnes travaillent à l'Internet Archive. (Photo : CNN)

Environ 200 personnes travaillent à l'Internet Archive. (Photo : CNN)

Pendant ce temps, les scanners de livres internes d'Internet Archive travaillent sans relâche, feuilletant chaque livre physique et le numérisant un par un, le tout étant diffusé en direct sur YouTube avec une douce bande-son lo-fi en fond sonore.

Juste à côté, un tourne-disque des années 1920 tourne encore. On y entend des airs classiques, mêlés à ceux d'autres appareils de lecture anciens : projecteurs de microfilms, vieux lecteurs de CD, voire récepteurs de télévision par satellite des débuts du numérique… L'ensemble crée un espace à la fois nostalgique et moderne, où tous les formats d'information de l'humanité sont respectés et préservés.

Les deux cents personnes présentes ici, des programmeurs aux bibliothécaires, sont toutes « cyberpunk », comme l'a dit un invité lors d'une fête célébrant le cap du billionième site web archivé par la Wayback Machine. Elles ne travaillent pas pour des salaires élevés, mais parce qu'elles sont convaincues que si personne ne les archive, toute la mémoire numérique de l'humanité disparaîtrait du jour au lendemain.

Brewster Kahle réaffirme que l'Internet Archive n'est ni un musée racontant une histoire unique, ni un organisme de censure. Il s'agit simplement d'une ressource permettant à chacun de construire son propre récit à partir du passé numérique intact. Et avec déjà mille milliards de pages sauvegardées, la protection de la mémoire collective de l'humanité ne fait que commencer.

Viet Anh

Source : https://vtcnews.vn/nha-tho-co-luu-giu-hon-1-000-ty-trang-web-toan-cau-ar988112.html


Comment (0)

No data
No data

Même sujet

Même catégorie

Magnifique lever de soleil sur les mers du Vietnam
Voyage à « Sapa miniature » : Immergez-vous dans la beauté majestueuse et poétique des montagnes et des forêts de Binh Lieu
Un café d'Hanoï se transforme en décor européen, projette de la neige artificielle et attire les clients.
Le bilan humain « zéro mort » des habitants de la zone inondée de Khanh Hoa, le 5e jour des mesures de prévention des inondations

Même auteur

Patrimoine

Chiffre

Entreprise

Maison sur pilotis thaïlandaise - Là où les racines touchent le ciel

Actualités

Système politique

Locale

Produit