ULTIM'ORA

ULTIM'ORA

Testi antichi in formato digitale col progetto europeo IMPACT

Lettura in corso:

Testi antichi in formato digitale col progetto europeo IMPACT

Dimensioni di testo Aa Aa

Hildelies Balk, Direttrice progetto IMPACT:

“Il problema della traformazione di un documento storico in un supporto informatico leggibile risiede nella datazione del testo, nell’eventualità che ogni elemento possa differire dai documenti odierni, l’anzianità delle fonti, le parole ed anche l’impaginazione realtivamente difficili”.

Ogni anno milioni di libri vengono scannerizzati e messi on line. Ma una volta scannerizzati restano molti errori perchè il computer cerca di leggere antichi testi con impaginazioni complesse per via delle fonti e delle sillabazioni diverse.

Clemens Neudecker, Manager del progetto:

“Questo è il Principia Mathematica di Isaac Newton,
vedete quello che noi chiamiamo ‘shine through’ cioè la visione in trasparenza dell’inchiostro della pagina opposta che traspare, il foglio è sformato e si puo’ vedere anche l’uso della S lunga che potrebbe essere facilmente scambiata per una f”.

I ricercatori della Biblioteca Nazionale olandese hanno lavorato 4 anni ad un progetto europeo destinato a migliorare i sistemi di lettura dei vecchi testi.

Hildelies Balk, Direttrice progetto IMPACT

“Abbiamo implementato un software per il miglioramento dell’immagine e della captazione ottica, per le fasi di correzione del documento con un linguaggio tecnologico che rende le operazioni molto piu’ agevoli”.

Questo know-how è già stato integrato nei software del principale mercato digitale e i risultati sono soddisfacenti.

Clemens Neudecker, Manager del Progetto

“ Qui abbiamo l’esempio di un’immagine raddrizzata anche se la tappa successiva è quella di ritagliare i bordi. In seguito bisogna trasformarla in una immagine in bianco e nero al fine di migliorare il contrasto relativo ai diversi piani”.
“Alla fine del processo l’utente ottiene il riconoscimento dell’intero testo comprensivo delle sue peculiarità strutturali come i paragrafi, gli accapo e quant’altro viene riconosciuto”.

Al progetto va il merito di aver migliorato del 15% il riconoscimento dei testi. Cio’ significa che gli archivi saranno disponibili molto piu’ agevolmente on line.

Hildelies Balk, Direttrice progetto IMPACT

“Un documento non traducibile in formato digitale diventa virtualmente invisibile. Ognuno si rivolge a un motore di ricerca con l’indagine su una parola chiave e se non la si trova significa che in quel contesto non esiste”

http://www.digitisation.eu/