Reti neurali per il riconoscimento di testo. Dalle immagini digitalizzate alle Digital Scholarly Editions
Il Dipartimento Scienze Umane e Sociali, Patrimonio Culturale (DSU) presenta il terzo di una serie di corsi di formazione organizzati dal Dipartimento.
Reti neurali per il riconoscimento di testo. Dalle immagini digitalizzate alle Digital Scholarly Editions
Il riconoscimento automatico del testo si colloca nell’ambito del Machine Learning ed è una delle tecnologie chiave per rendere la mole del patrimonio scritto accessibile anche ai non specialisti. Per questo costituisce uno strumento prezioso per biblioteche e archivi, ma anche per il singolo ricercatore che lavora con testi manoscritti e desidera renderli velocemente ricercabili o creare una edizione critica.
Il corso descrive le basi teoriche del riconoscimento automatico del testo (Handwritten Text Recognition) e introduce le due piattaforme più note, Transkribus ed eScriptorium. Fornirà una panoramica di un workflow tipico dall’immagine digitalizzate al riconoscimento di testo e dall’XML prodotto dalle piattaforme fino all’edizione critica digitale in XML-TEI. Il corso si articolerà in tre unità di ca. 20 min.
Obiettivi
Il corso intende:
- fornire un primo approccio al riconoscimento automatico di scrittura e alle sue basi teoriche;
- presentare due soluzioni per la realizzazione di una trascrizione automatica;
- indicare un percorso per trasformare la trascrizione automatica in una edizione critica digitale;
- dotare i partecipanti con gli strumenti necessari per intraprendere un percorso autonomo.
Programma
- 15.00-15.20 Vera Isabell Schwarz-Ricci (CNR-ISPC): Il riconoscimento automatico di scrittura – La piattaforma Transkribus;
- 15.20-15.40 Federico Boschetti (CNR-ILC): eScriptorium e l’universo HTR;
- 15.40-16.00 Angelo Mario Del Grosso (CNR-ILC): Dalla codifica XML all’edizione digitale con TEI.
Comitato organizzatore
Paola Avallone, Tommaso Ismaelli, Andrea Giovanni Nuzzolese.
Come partecipare
Il corso è online e aperto al pubblico previa registrazione attraverso questo modulo su Microsoft Forms.
Ultimo aggiornamento: 8 Maggio 2024