Salvataggio di un libro

Questa attività viene svolta in collaborazione con il nostro partner Xedizioni

Realizzare la riproduzione di un testo può avere tante motivazioni. Una delle più importanti è quella di effettuare un vero e proprio "salvataggio" di un volume che non si regge più, vecchio e sfilacciato, di quelli che si sbriciolano nelle nostre mani, ma a cui siamo molto legati per qualche motivo. In genere non sono i libri più antichi a soffrire di questa sindrome, ma sono spesso i libri pubblicati tra la fine dell'800 e gli anni '50 del secolo scorso: la carta diventa sempre più gialla e si ricopre di macchie, perde elasticità e si sbriciola a partire dai bordi. Effettuare delle semplici fotocopie non riporta il libro in vita, né è sufficiente una tipica scansione di tutte le pagine: le macchie restano, il testo è poco leggibile e le figure perdono profondità e luminosità. Anche i tentativi di rilegare il volume possono solo peggiorare la situazione, data la scarsa consistenza della carta. L'unico sarebbe ricorrere a una stampa anastatica, che però ha dei costi elevati e si effettua solo nel caso in cui si preveda una certa tiratura.

Noi abbiamo messo a punto un procedimento per ottenere un testo ben leggibile su fondo bianco, delle buone riproduzioni delle figure in grigio e/o a colori e la possibilità di una buona stampa, sia in proprio sia in tipografia, anche di una singola copia al prezzo di una fotocopia. Una volta sottoposto a quest'ultima fatica il vecchio volume potrà essere conservato definitivamente, al riparo da ulteriori danneggiamenti.

Vi mostriamo il procedimento che utilizziamo per realizzare la riproduzione digitale o a stampa di un libro. Partiamo da un  tipico esemplare: un libro del 1946 in edizione economica:

Dorso allentato, pagine ingiallite, qualche macchia. Ecco come si presenta la scansione di una pagina di testo nei tre modi (colore, grigi, bianco e nero). Cliccando su ciascuna immagine la si vede ingrandita.

Nei primi due modi è praticamente impossibile separare il testo dalle ombre e dalle macchie. Nel modo in bianco e nero invece, si può notare che gran parte del testo appare ben contrastato su sfondo bianco, mentre il grosso della sporcizia è localizzato sui bordi. Quindi, se si riesce a trovare una giusta soglia e si pulisce opportunamente il bordo bianco, si può arrivare a una pagina pulita e leggibile, e che per giunta occupa poca memoria in confronto alle altre due scansioni. Ecco la stessa pagina di sopra, scansionata in bianco e nero e ripulita:

 

Ancora meglio appare la stessa pagina in formato pdf.

Una volta che l'intero libro è stato digitalizzato, è possibile eseguirvi l'OCR, ossia il riconoscimento automatico dei caratteri. Ecco per esempio la stessa pagina di prima, sempre in pdf ma con il testo ricercabile. Avendola aperta con Acrobat Reader è possibile effettuare delle ricerche (provate per esempio a cercare la parola "porzioni" o un'altra parola presente). E' anche possibile selezionarne una parte, copiarla e utilizzarla altrove. In questo piccolo file di testo abbiamo incollato tutto il contenuto selezionato dalla pagina in questione. Si possono vedere i limiti del procedimento, per esempio alcune parole non sono riconosciute correttamente e molte sono spezzate dalle troncature di fine riga. Ma una grande percentuale del testo è riconosciuta perfettamente. In alternativa si può convertire tutto il file in formato RTF (rich text format) che mantiene la formattazione e (grosso modo) il carattere originale. In questo esempio abbiamo già effettuato una piccola correzione globale, eliminando i segni "- " che spezzavano i caratteri (ma uno è rimasto). Qualche altro errore ancora rimane, per esempio la parola francese mouchard  è stata trasformata in motrchard, ma si tratta di una parola desueta. Bisogna comunque tener conto di una certa, inevitabile percentuale di errori in questo procedimento. Le parole riconosciute male non risulteranno presenti in occasione di una ricerca.

Il formato pdf assicura la massima leggibilità ed è perfettamente stampabile, oltre a essere compatibile con la maggior parte dei sistemi operativi e degli ebook readers. Resta il problema della restituzione delle immagini. La scansione in bianco e nero non produce buoni risultati, come si vede qua sotto, mentre la scansione in scala di grigi o a colori dà risultati decisamente migliori:

La soluzione quindi è quella di effettuare la scansione delle immagini a colori o in scala di grigi separatamente utilizzando un comune programma di elaborazione grafica, e inserirle nel giusto posto nelle pagine di testo, sia che l'immagine occupi un'intera pagina, come nel libro che abbiamo preso in esame, sia che trovi posto in un riquadro di una pagina stampata, come capita più di frequente. Osservate per esempio la pagina riprodotta qua sotto: in entrambe le versioni il testo è riprodotto in bianco e nero, mentre in quella di destra l'immagine è stata sostituita con una riproduzione in scala di grigi (fare clic per ingrandire)

La differenza tra i risultati è evidente. Ovviamente il lavoro necessario è maggiore, specie se le figure sono molte e di piccole dimensioni, o peggio se sono inserite nel testo in modo asimmetrico o intricato.

Il successivo passaggio è la "stampa", non una vera e propria stampa su carta, ma una procedura che riversa il file digitalizzato in un nuovo file nel quale le pagine hanno un formato uniforme e spariscono le tracce delle sovrapposizioni e delle "ripuliture". Il risultato si può vedere in questo frammento: buon testo, belle immagini, sfondo pulito, formato uniforme.

Il passaggio finale, non sempre possibile né indispensabile, è la fase del riconoscimento dei caratteri che permette l'estrazione di tutto il testo per gli scopi già visti (ricerche, operazioni di copia-incolla). Dopo questa operazione il file resta apparentemente identico nel formato e nell'aspetto, ma se l'operazione è andata a buon fine possiede questa ulteriore qualità. A richiesta si può esportare tutto il testo in formato RTF o txt facilmente utilizzabile nei principali programmi di elaborazione testi e/o nei fogli di calcolo.

Ci si potrebbe chiedere quanto possa costare un lavoro così complesso e sofisticato: nel caso del libro in esame possiamo dare una quotazione complessiva: 313 pagine con 12 figure fuori testo, digitalizzazione, creazione di un file stampabile in formato 6x9", totale € 80.00, poco più di € 0.25 a pagina. La stampa di una copia del libro ricostruito potrebbe costare in questo caso altri € 14.00. Insomma, con 94 euro + 14 per ogni copia supplementare abbiamo salvato un libro raro e a rischio (oppure semplicemente un testo fuori catalogo). Questo è solo un esempio, il costo dipende da altri fattori, ma l'ordine di grandezza resta quello.

Se pensate di poter avere bisogno del nostro aiuto per salvare o ristampare un libro, contattateci spiegandoci bene di cosa si tratta. Saremo felici di darvi una mano. Grazie per l'attenzione.

Torna alla pagina principale