Internet Archive, archivio della cultura moderna, compie 20 anni

Internet Archive quando è stato creato 20 anni fa, in pochi immaginava come una piccola galassia di circa 500.000 siti web si sarebbe evoluta verso il centro della comunicazione e della cultura umana. Ora, l’organizzazione no-profit di San Francisco – che ha festeggiato il traguardo con una festa mercoledì sera – cura un vasto archivio digitale che include più di 370 milioni di siti web e 273 miliardi di pagine, molti catturati prima di scomparire per sempre.
L’organizzazione, fondata da Brewster Kahle, informatico e imprenditore, è più di un archivio di siti Internet, ha un magazzino virtuale, comprende libri convertiti in digitale, pellicole storiche di memi divertenti e registrazioni audio di concerti come quello del gruppo musicale Grateful Dead.
Rick Prelinger, archivista di film, professore associato di cinema e media digitali presso l’Università della California a Santa Cruz, ha detto:
«Molte persone quando Brewster Kahle ha lanciato il suo progetto, pensavano che fosse pazzo o irrilevante, lui ha avuto un buon istinto per questo genere di cose, ha pensato che tutto il Web iniziando dal 1996, 1997 e 1998 doveva essere salvato».
Circa 600 persone erano presenti alla festa organizzata nella nuova sede di Internet Archive un’ex chiesa cristiana scientista al 300 di Funston nel distretto di Richmond a San Francisco. Tra gli ospiti l’imprenditore Marc Canter co-fondatore di quello che sarebbe diventato Macromedia, Dan Kottke uno dei primi dipendenti di Apple e la giornalista Kathy Kiely.
La folla comprendeva dipendenti passati e presenti di Internet Archive, e altri che volontariamente nel corso degli anni offrono il loro tempo o il denaro per aiutare l’organizzazione.
Brewster Kahle oltre a creare la versione digitale della Grande Biblioteca di Alessandria (la più grande e ricca biblioteca del mondo antico e uno dei principali poli culturali ellenistici, andò distrutta nell’antichità, probabilmente più volte tra l’anno 48 a.C. e il 642 d.C.; in suo ricordo è stata edificata, ed è in funzione dal 2002, la moderna Bibliotheca Alexandrina), crede che in particolare preservare l’effimero World Wide Web, come si diceva allora, sarebbe fondamentale per gli storici del futuro per comprendere i contesti di questo tempo.

Internet Archive, archivio della cultura moderna, compie 20 anni
Internet Archive è indipendente sopravvive attraverso donazioni della comunità e lavorando con circa 1.000 biblioteche di tutto il mondo che pagano il gruppo per aiutare a digitalizzare libri e altro materiale. E’ conosciuto per l’interfaccia web Wayback Machine utilizzata per l’estrapolazione dagli archivi dei dati riguardanti siti web. I siti archiviati rappresentano una sorta di “fermi immagine” raccolti al momento dell’acquisizione delle pagine tramite il software d’indicizzazione di Internet Archive. Il nome “Wayback Machine” deriva dal termine “WABAC Machine” utilizzato in una delle storie della serie animata Rocky e Bullwinkle. Il servizio, grazie allo spider di Alexa, memorizza nel tempo i cambiamenti e le evoluzioni dei diversi siti web. Per i siti minori non ha un frequente caching, ovvero le pagine vengono memorizzate solo raramente. Si rivela un servizio utile nei seguenti casi:

– studio dell’evoluzione dei siti Web;
– recupero di pagine e siti andati persi;
– ricerca di prove una volta pubblicate e quindi cancellate.

Il servizio permette di accedere a versioni archiviate di pagine web del passato, una sorta di “archivio tridimensionale” secondo le parole di Internet Archive. Milioni di siti web con i rispettivi dati (immagini, testo, documenti collegati, ecc.) sono archiviati in un gigantesco database. Non tutti i siti web sono disponibili a causa della scelta di molti proprietari di escludere i loro siti dall’indicizzazione. Come per tutti i siti basati su dati provenienti da web crawler, inoltre, mancano vaste aree del web per una serie di ragioni tecniche. Diverse problematiche legali riguardanti l’archiviazione e la copertura o meno di siti sono state infine riscontrate negli anni, sebbene queste non siano il risultato di azioni deliberate.

Pino Silvestri

About Pino Silvestri

Pino Silvestri, blogger per diletto, fondatore, autore di Virtualblognews, presente su Facebook e Twitter.
View all posts by Pino Silvestri →

Lascia un commento