I notiziari televisivi: indicizzazione tramite trascrizione automatica del parlato (Giorgio Dimino - RAI)
La RAI, in collaborazione con l'Istituto di Ricerca Tecnologica e Scientifica (IRST) del Trentino, ha realizzato un'applicazione sperimentale basata sull'utilizzo di un riconoscitore di parlato in lingua italiana per l'ausilio alla documentazione di programmi radiotelevisivi. Attualmente il riconoscitore, realizzato dall'IRST, è stato ottimizzato per lavorare nel dominio delle news. Tramite questo strumento è possibile acquisire e trascrivere automaticamente un programma senza intervento manuale. La trascrizione risultante, sincronizzata con il segnale audiovisivo, può essere utilizzata direttamente per effettuare ricerche in testo libero di parole o frasi e contestualmente riprodurre il contenuto a partire dalla posizione corrispondente alle parole trovate, fornendo quindi un valido strumento di indicizzazione completamente automatica del segnale. Inoltre, utilizzando informazioni ausiliarie, in parte rilevate dal riconoscitore stesso, come il riconoscimento dei parlatori, in parte fornite dall'esterno, quali il format del programma, è possibile effettuare una segmentazione automatica del contenuto in unità logicamente distinte. Questa modalità è stata sperimentata con successo sui telegiornali RAI. Le linee di sperimentazione future di questo lavoro riguardano la possibilità di applicare tecniche di analisi automatica del linguaggio, quali estrazioni di "named entities" (nomi propri, luoghi, sigle), classificazioni tassonomiche o generazione automatica di sinopsi.
|