Un nuovo artico di Eleonora Pantò per la rubrica Appunti Selvaggi
Luciano Gallino è stato uno dei padri della Sociologia italiana, oltre che tra i maggiori esperti del rapporto tra nuove tecnologie e formazione. Ha scritto libri sul declino dell’industria italiana, sull’impoverimento della ricerca e da anticipatore quale egli era, ha descritto le conseguenze del passaggio dalla produzione del valore (costruire un edificio) all’estrazione del valore (aumentare produttività a parità di salario). Cresciuto all’Olivetti di Ivrea, i suoi interessi scientifici erano anche rivolti al mercato del lavoro e alle sue trasformazioni. Tra le varie sue iniziative, ricordiamo il Centro online per la storia e la cultura dell’industria, un portale dedicato al patrimonio industriale e del lavoro e ricco di risorse per conoscere la storia e promuovere la cultura industriale del Nord Ovest dal 1850. Il sito contiene anche un archivio digitale interrogabile con ricerca libera e “Raccoglie e cataloga atti, verbali, libri cassa, relazioni, fotografie, disegni, filmati, manifesti, materiali editoriali custoditi in archivi, centri di documentazione, aziende, fondazioni e associazioni.”[1] Nonostante le origini e gli scopi, purtroppo il Centro non è più raggiungibile al suo indirizzo http://www.storiaindustria.it/ probabilmente a causa di scelte tecnologiche effettuate nel 2013 e che rendono onerosa la conversione alle tecnologie odierne; in rete si trovano ombre e tracce della sua esistenza, come ad esempio la pagina Facebook.
Il decadimento digitale
Nel 2024, il Pew Research Centre ha pubblicato una rapporto in cui ha confrontato le pagine web dal 2013 al 2023 e ha scoperto che il 38% di quelle pagine non erano più accessibili. La stessa ricerca dice che il 20% circa delle pagine di notizie e di siti governativi hanno link non funzionanti, mentre le pagine Wikipedia con link irraggiungibili arrivano al 54%.

La sparizione dei contenuti può avere cause diverse: pagine cancellate, spostate o che si trovavano su domini non rinnovati o link che mandano a documenti anch’essi eliminati o spostati. Questo effetto viene definito decadimento digitale e si manifesta anche sulle piattaforme social come Twitter.
Da febbraio 2026 il grande archivio World Factbook, gestito dalla CIA è stato oscurato. Si trattava di un’enciclopedia con 60 anni di storia che forniva informazioni su paesi e regioni, gratuita e accessibile. Non sono esplicitate le ragioni della chiusura, ma Il Post nel suo articolo ipotizza si tratti di tagli suggeriti dalla nuova amministrazione Trump.
Come suggerisce il blog “Project retrograde” la narrativa del decadimento digitale è che si tratti di una questione tecnologica ma non sempre è una questione di formati incompatibili.
Il decadimento digitale non è casuale. È il risultato delle scelte compiute dalle piattaforme, dai progettisti e dagli utenti. Quando i contenuti svaniscono, ciò riflette i nostri valori: ciò che abbiamo scelto di conservare e ciò che abbiamo lasciato scomparire. Riavvolgendo il progresso, scopriamo ciò che è andato perduto in nome della velocità e della praticità. Se vogliamo un futuro in cui la memoria digitale duri nel tempo, dobbiamo costruirlo. Ciò significa progettare sistemi che proteggano i contenuti, rispettino l’autonomia degli utenti e rallentino l’erosione del significato digitale. Così facendo, riscriviamo la narrazione: non come una storia di perdita, ma come una di conservazione consapevole.[2]
L’Internet Archive: la biblioteca di Alessandria digitale
Dal 2001 la Way Back Machine archivia le pagine web con l’obiettivo di creare un archivio di istantanee di pagine web e il 22 novembre 2025 ha festeggiato la trilionesima pagina salvata (1 trilione= 1 miliardo di miliardi). L’ideatore del progetto Brewster Kahle pur celebrando questo risultato non ha potuto negare la perdita dei 500 mila volumi che erano archiviati nella Open Library dell’Internet Archive, a causa delle battaglie legali sul copyright. L’Open Library aveva un servizio di prestito degli ebook con limitazioni, ma con il Covid aveva eliminato le restrizioni. Questo ha attirato l’attenzione di autori ed editori che si sentivano danneggiati. La visione di Kahle è quella di una biblioteca accessibile a chiunque per scopi di ricerca ma nell’era dell’Intelligenza artificiale tutto è rimesso in discussione.
Una questione di “Fair Use”
Alcuni editori, come il New York Times e il Guardian hanno deciso di bloccare l’accesso ai loro siti da parte dei crawler dell’Internet Archive[3], motivandola come una difesa dal data scraping effettuato dalle aziende che vogliono addestrare i loro LLM: come se ordinassero alle biblioteche di non archiviare le copie dei giornali. Secondo la EFF (Electronic Free Frontiers organizzazione non profit per la tutela delle libertà digitali) da un quarto di secolo, storici, ricercatori, giornalisti e pubblico usano l’Internet Archive per verificare come le notizie fossero state originariamente pubblicate e constatare modifiche e rimozioni: impedirne l’archiviazione da parte dell’Internet Archive significa cancellare la storia. Dato che rendere un archivio ricercabile è già considerato “fair use”, le norme per porre limiti alle attività di addestramento delle IA, dovrebbero al tempo stesso tutelare l’archiviazione pubblica[4] per scopi di ricerca o educativi.
Anthropic è la società che produce Claude (ne abbiamo parlato in un articolo precedente) e nel 2024 è stata oggetto di una class action che ha coinvolto circa 120mila autori, per l’uso piratato di libri senza averne l’autorizzazione e senza aver versato alcun compenso. La causa ha avuto una svolta a giugno 2025, quando il giudice federale William Alsup ha stabilito che l’utilizzo dei testi per addestrare Claude poteva rientrare nel concetto di fair use. Nella stessa sentenza, Alsup ha riconosciuto una violazione dei diritti d’autore per 7 milioni di libri piratati, raccolti in un archivio centrale e non usati per l’addestramento. Questa violazione avrebbe dovuto essere dibattuta a dicembre 2026, ma Anthropic, ha preferito chiudere la questione con un accordo extragiudiziale di 1,5 miliardi di dollari, scegliendo di versare circa 3000 dollari ad ognuno degli autori ricorrenti.
Internet Archive ha considerato la sentenza favorevole[5] ad Anthropic sull’uso di materiale coperto da copyright come una vittoria per le biblioteche: il giudice ha ritenuto che
il «passaggio da copie cartacee di biblioteca a copie digitali di biblioteca» operato dalla società fosse «un uso trasformativo ai sensi del primo criterio del fair use» e costituisse quindi un caso di fair use. Ha inoltre stabilito che l’utilizzo di tali copie digitalizzate per addestrare un modello di IA fosse un uso trasformativo, rientrando anch’esso nella definizione di fair use ai sensi della legislazione statunitense.[6]
Libri bruciati
La sentenza Alsup ha portato alla luce un dettaglio importante dell’operazione “Project Panama” intrapresa da Anthropic, per ridurre tempi e costi ed essere competitivi nella gara delle IA è stata intrapresa un’attività massiva di scanning distruttivo su 2 milioni di libri. Il fair use è stato concesso perché la società aveva regolarmente acquistato i libri e ha utilizzato i testi per uso interno. Secondo l’inchiesta pubblicata recentemente dal Washington Post, Anthropic era consapevole che la distruzione di libri avrebbe colpito negativamente l’opinione pubblica e per questo intendeva tenerla nascosta “We don’t want it to be known that we are working on this” “Non vogliamo che si sappia che stiamo lavorando a questo”. Usare i libri come carburante per i chatbot è legale ma al tempo stesso disturbante perché la distruzione deliberata di libri è sempre associata al disprezzo per la conoscenza e alla repressione, vedi i roghi di libri nazisti del 1933 e la distruzione delle biblioteche durante la Rivoluzione Culturale cinese.
La fine della carta o dei libri?
Nei primi anni 2000 Negroponte teorizzava una nuova carta riscrivibile “Nel giro di quattro, sei anni la carta costerà troppo e i giornali spariranno. Le notizie si leggeranno su schermi di plastica” eDick Brass (inventore degli ebook) aveva previsto che l’ultima copia stampata del New York Times sarebbe uscita nel 2018, ma prima di loro nel 1967 pare che Marshall Mc Luhan avesse detto “Print is dead”. Esagerando un pò, potremmo dire che il futuro senza carta stampata è arrivato.
I libri riassorbiti dagli LLM diventano “token”, stringhe di caratteri e l’opera culturale diventa introvabile: perdendo la fonte, si perde la possibilità di verificare, disponendo di un accesso schermato e opaco alla conoscenza (senza parlare delle limitazioni economiche e tecnologiche). Il Progetto Panama evidenzia una tensione tra preservazione del patrimonio culturale, progressi tecnologici e giurisdizione e ci mette di fronte ad una domanda cruciale: dobbiamo ancora considerare i libri come depositari di intelligenza contestualizzata e storica?
Eleonora Panto’ – 12 maggio 2026
[1] Elena Franchini (2 Giugno 2010). L’Archivio digitale del Centro per la Storia e cultura dell’industria del Nord Ovest. Filosofia & Storia. Recuperato il 11 maggio 2026 da https://doi.org/10.58079/or4t
[2] https://project-retrograde.com/2025/11/30/rewinding-progress-narratives-of-digital-decay/
[3] https://www.niemanlab.org/2026/01/news-publishers-limit-internet-archive-access-due-to-ai-scraping-concerns/
[4] https://www.eff.org/deeplinks/2026/03/blocking-internet-archive-wont-stop-ai-it-will-erase-webs-historical-record.
[5] https://archive.org/details/anthropic-fair-use
[6] https://blog.archive.org/2025/06/29/a-win-for-fair-use-is-a-win-for-libraries/
