Op slechts een paar blokken van de Golden Gate Bridge (San Francisco, VS) staat het witte gebouw met 8 enorme pilaren dat in alle stilte de grootste missie in de geschiedenis van het internet vervult: de opslag van meer dan 1.000 miljard webpagina's, wat gelijkstaat aan meer dan 100.000 terabyte aan gegevens. Genoeg om tientallen miljoenen dvd's mee te vullen.
Het gebouw, ooit een eeuwenoude Christian Science-kerk, is nu de thuisbasis van het Internet Archive, 's werelds grootste non-profit digitale bibliotheek.

Hoofdkantoor van het Internet Archive in San Francisco (VS). (Foto: KALW)
Het oude geluid van Bijbellezingen maakte plaats voor het geluid van de koelventilatoren van duizenden servers die midden in de hoofdkerk stonden, onder de schitterende glas-in-loodramen.
Hier bewaart de Wayback Machine, die dagelijks door miljoenen mensen wordt gebruikt, bijna drie decennia aan internetgeschiedenis. Afgelopen oktober bereikte de enorme databank officieel de mijlpaal van één biljoen gearchiveerde webpagina's sinds Brewster Kahle, oprichter van het Internet Archive, in 1996 met het project begon.
Destijds nam een jaar aan webdata slechts ongeveer 2 terabyte in beslag, evenveel opslagruimte als een iPhone nu. Nu verzamelt de Wayback Machine bijna 150 terabyte per dag, wat overeenkomt met honderden miljoenen nieuwe webpagina's.
Brewster Kahle, met zijn zilveren haar en altijd aanwezige glimlach als een enthousiaste wetenschapsleraar , besloot de oude kerk te kopen omdat deze leek op het symbool van zijn organisatie: oude Griekse zuilen, een symbool van een lang leven.
"We willen mensen eraan herinneren dat het internet ook een moderne 'Grote Bibliotheek van Alexandrië' nodig heeft", zei hij, zittend op dezelfde houten bank die nog over is uit de actieve tijd van de kerk.
Behoud van “digitale herinneringen”

Brewster Kahle, oprichter van het Internet Archive. (Foto: AP)
Wayback Machine maakt niet alleen screenshots van websites die actief waren en nog steeds zijn, maar slaat ook de volledige HTML-, CSS- en JavaScript-broncode op. Zo kan de website precies zo worden hersteld als op dat moment, zelfs als de oorspronkelijke server al lang uit de lucht is.
Dankzij deze technologie kunnen journalisten verwijderde artikelen terugvinden, kunnen onderzoekers informatie uit verschillende overheidstermijnen vergelijken en kunnen internetgebruikers hun favoriete websites die zijn verdwenen, zoals Geocities, Gawker en MTV News, opnieuw bezoeken.
Terwijl kunstmatige intelligentie (AI) de grens tussen echt en nep doet vervagen, heeft het Internet Archive nog een andere missie: het archiveren van door AI gegenereerde content.
Het team van technici en bibliothecarissen van de bibliotheek bedenkt dagelijks honderden vragen op basis van actueel nieuws. Deze worden ingevoerd in ChatGPT, Gemini of andere AI-modellen en vervolgens worden zowel de vragen als de antwoorden opgeslagen. De samenvattingen die bovenaan de zoekresultaten van Google verschijnen, worden ook zorgvuldig gearchiveerd.

Oprichter Brewster Kahle maakt geen geheim van zijn motieven: "Bibliotheken zijn altijd het eerste doelwit wanneer een nieuwe regering aan de macht komt." (Foto: Amber Hughes)
Om natuurlijke of politieke risico's te vermijden, worden datakopieën op veel plaatsen ter wereld opgeslagen. Oprichter Brewster Kahle maakt geen geheim van de reden wanneer hij zegt: "Bibliotheken zijn altijd het eerste doelwit wanneer een nieuwe regering aan de macht komt. We leren van de geschiedenis om te ontwerpen voor de toekomst."
In 2017, en recenter onder Trump, werd een reeks websites van de Amerikaanse overheid volledig ontdaan van informatie over klimaatverandering, LGBTQ+-rechten en de prestaties van zwarte militairen. Dankzij het Internet Archive kon de pers bovenstaande informatie accuraat herstellen.
Thuisbasis van de "cyberpunkgeesten"
Bij binnenkomst in het hoofdkantoor van het Internet Archive kunnen bezoekers zich gemakkelijk wanen in een levend internetmuseum. Meer dan 100 terracotta beelden van 1 meter hoog, elk met een afbeelding van een medewerker die hier minstens 3 jaar heeft gewerkt, staan in rijen opgesteld, net als het terracottaleger in het mausoleum van Qin Shi Huang.

Er werken ongeveer 200 mensen bij het Internet Archive. (Foto: CNN)
Ondertussen werken de interne boekscanners van het Internet Archive onvermoeibaar door. Ze bladeren door elk fysiek boek en scannen het één voor één. Het hele proces wordt live gestreamd op YouTube, met een rustgevende lo-fi soundtrack op de achtergrond.
Ernaast draait nog steeds een platenspeler met draaitafel uit de jaren 20. Ze spelen klassieke melodieën, afgewisseld met een reeks andere antieke medialezers zoals microfilmprojectoren, oude cd-spelers en zelfs satellietontvangers uit de begindagen van de digitale technologie... Alles creëert een ruimte die zowel nostalgisch als modern is, waar alle informatiedragers van de mensheid worden gerespecteerd en beschermd.
De tweehonderd mensen hier, van programmeurs tot bibliothecarissen, zijn allemaal 'cyberpunk', zoals een gast het verwoordde op een feestje ter ere van de 1 biljoenste webpagina van de Wayback Machine. Ze werken niet voor een hoog salaris, maar vanuit de overtuiging dat als niemand hen zou archiveren, het volledige digitale geheugen van de mensheid in één nacht zou verdwijnen.
Brewster Kahle benadrukt dat het Internet Archive geen museum is dat één verhaal vertelt, noch een censor van de waarheid. Het is simpelweg een bron waar iedereen zijn eigen verhaal kan schrijven vanuit het intacte digitale verleden. En met al 1 biljoen opgeslagen pagina's is de reis naar het beschermen van het collectieve geheugen van de mensheid nog maar net begonnen.
Bron: https://vtcnews.vn/nha-tho-co-luu-giu-hon-1-000-ty-trang-web-toan-cau-ar988112.html






Reactie (0)