Bara några kvarter från Golden Gate-bron (San Francisco, USA) utför den vita byggnaden med åtta massiva pelare som står utanför i tysthet det största uppdraget i internets historia: Att lagra mer än 1 000 miljarder webbsidor, motsvarande mer än 100 000 terabyte data, tillräckligt för att fylla tiotals miljoner DVD-skivor.
Byggnaden, en gång en sekelgammal Christian Science-kyrka, är nu hem för Internet Archive, världens största ideella digitala bibliotek.

Internet Archives huvudkontor i San Francisco (USA). (Foto: KALW)
Det gamla ljudet av bibelläsningar ersattes av ljudet av kylfläktar från tusentals servrar som var placerade mitt i huvudkyrkan, under de lysande glasmålningarna.
Det är här som Wayback Machine, som används av miljontals människor varje dag, har bevarat nästan tre decennier av internethistoria. I oktober nådde det enorma arkivet officiellt milstolpen på en biljon webbsidor arkiverade sedan Brewster Kahle, grundare av Internet Archive, startade projektet 1996.
Vid den tiden tog ett års webbdata bara upp cirka 2 terabyte, samma mängd lagringsutrymme som en iPhone idag. Nu samlar Wayback Machine in nästan 150 terabyte varje dag, vilket motsvarar hundratals miljoner nya webbsidor.
Brewster Kahle, med sitt silverfärgade hår och ständigt närvarande leende likt en entusiastisk naturvetenskapslärare , valde att köpa den gamla kyrkan eftersom den liknade hans organisations symbol: antika grekiska kolonner – en symbol för långt liv.
”Vi vill påminna folk om att internet också behöver ett modernt ’Stora biblioteket i Alexandria’”, sa han, sittande på samma träbänk som finns kvar från kyrkans aktiva dagar.
Bevarandet av "digitala minnen"

Brewster Kahle, grundare av Internetarkivet. (Foto: AP)
Wayback Machine tar inte bara skärmdumpar av webbplatser som var och fortfarande är aktiva, den sparar hela HTML-, CSS- och JavaScript-källkoden så att den kan återskapa webbplatsen exakt som den var vid den tidpunkten, även om den ursprungliga servern länge har varit avstängd.
Tack vare det kan journalister hitta borttagna artiklar, forskare kan jämföra information från varje regeringsperiod , eller internetanvändare kan återbesöka sina favoritwebbplatser som har försvunnit, såsom Geocities, Gawker och MTV News.
Även om artificiell intelligens (AI) suddar ut gränsen mellan verkligt och falskt, har Internetarkivet ett annat uppdrag: att arkivera AI-genererat innehåll.
Varje dag tar bibliotekets team av ingenjörer och bibliotekarier fram hundratals frågor baserade på senaste nytt, matar in dem i ChatGPT, Gemini eller andra AI-modeller, och lagrar sedan både frågorna och svaren. Sammanfattningarna som visas högst upp i Googles sökresultat arkiveras också noggrant.

Grundaren Brewster Kahle gör ingen hemlighet av sina skäl och säger: ”Biblioteken är alltid det första målet när varje ny administration tillträder.” (Foto: Amber Hughes)
För att undvika naturrisker eller politiska risker placeras datakopior på många platser runt om i världen. Grundaren Brewster Kahle gör ingen hemlighet av anledningen när han säger: ”Bibliotek är alltid det första målet när varje ny regering kommer till makten. Vi lär oss av historien för att utforma för framtiden.”
År 2017, och mer nyligen under Trump-administrationen, raderades en rad amerikanska myndigheters webbplatser på information om klimatförändringar, HBTQ+-rättigheter och svart militär personals prestationer. Tack vare Internet Archive kunde pressen korrekt återställa ovanstående information.
Hem för "cyberpunk-andarna"
När besökare kommer in i Internet Archives högkvarter kan de lätt föreställa sig att de har försvunnit i ett levande internetmuseum. Mer än 100 terrakottastatyer, som var och en föreställer en anställd som har arbetat här i minst 3 år, står i rader likt terrakottaarmén i Qin Shi Huangs mausoleum.

Omkring 200 personer arbetar på Internetarkivet. (Foto: CNN)
Samtidigt arbetar Internetarkivets interna bokskannrar outtröttligt, bläddrar igenom varje fysisk bok och skannar den en efter en, med hela processen livestreamad på YouTube med ett lugnande lo-fi-soundtrack som spelas i bakgrunden.
Alldeles intill snurrar fortfarande en skivspelare med skivspelare från 1920-talet. De spelar klassiska låtar, blandat med en rad andra forntida medieläsare som mikrofilmsprojektorer, gamla CD-spelare, till och med satellit-TV-mottagare från den digitala teknikens tidiga dagar… Alla skapar ett utrymme som är både nostalgiskt och modernt, där mänsklighetens alla informationsformat respekteras och skyddas.
De tvåhundra personerna här, från programmerare till bibliotekarier, är alla ”cyberpunk”, som en gäst uttryckte det på en fest som firade Wayback Machines biljonte webbsida. De arbetar inte för höga löner utan för tron att om ingen skulle arkivera dem, skulle mänsklighetens hela digitala minne försvinna över en natt.
Brewster Kahle upprepar att Internetarkivet inte är ett museum som berättar en enda historia, inte heller en censur av sanningen. Det är helt enkelt en resurs för vem som helst att skriva sin egen historia från det intakta digitala förflutna. Och med 1 biljon sidor redan sparade har resan för att skydda mänsklighetens kollektiva minne bara börjat.
Källa: https://vtcnews.vn/nha-tho-co-luu-giu-hon-1-000-ty-trang-web-toan-cau-ar988112.html






Kommentar (0)