L'archiviazione del parlato italiano nel progetto C-ORAL-ROM
(IST 2000 – 26228)
(Emanuela Cresti - LABLITA, Università di Firenze)
Lo scopo principale del progetto C-ORAL-ROM è di produrre una serie di corpora di parlato spontaneo rappresentativi delle quattro principali lingue romanze (italiano, francese, portoghese, spagnolo). Il progetto è stato finanziato dal programma IST della UE ed è condotto dal consorzio europeo coordinato da LABLITA e formato da UAM, CLUL, UPRO.DELIC, IC, ELDA, PitchFrance, ITC-Irst, Champion, LABLITA.
La risorsa è stata realizzata durante l'ultimo anno seguendo criteri espliciti di selezione per assicurare allo stesso tempo la comparabilità e la rappresentazione della variazione del parlato spontaneo nei quattro corpora. Il corpus C-ORAL-ROM sarà prodotto in una edizione multimediale su DVD, integrata con programmi standard per l'estrazione di concordanze e per l'analisi acustica, e sarà accompagnata da studi linguistici comparativi, modelli e misure standard del parlato in ogni corpus.
La presentazione si concentrerà sulla concezione di C-ORAL-ROM come risorsa multimediale. In particolare sarà sostenuto che l'accesso all'informazione acustica in un corpus multimediale (allineamento) deve andare di pari passo con la rappresentazione della prosodia e che tale metodo può essere favorevolmente assunto come standard per l'archiviazione del linguaggio parlato nelle risorse multimediali e multimodali.
La concezione dell'archiviazione multimediale del parlato in C-ORAL-ROM è basata sulla selezione di unità di allineamento naturali che sono identificate come un livello di tagging prosodico elementare della risorsa testuale, cioè l'enunciato. C-ORAL-ROM assicura simultaneamente:
- tagging relativo al parsing prosodico e al valore azionale
- allineamento testo/segnale acustico basato sull'enunciato
- analisi acustica con funzioni speciali per l'analisi di F0 per segnale di scarsa qualità
In C-ORAL-ROM l'informazione testuale è taggata simultaneamente rispetto al parsing prosodico e al limite di enunciato, quindi ogni unità prosodica corrispondente ed un enunciato può essere facilmente e direttamente allineata alla controparte acustica, assicurando una corrispondenza testo/suono naturale e significativa. Sarà mostrato che:
- l'allineamento basato sulla parola è irrilevante per ragioni prosodiche: le parole seno coarticolate in unità prosodiche e l'effetto acustico dell'allineamento basato sulla parola è innaturale
- l'allineamento basato sulla sillaba è estremamente costoso e le unità allineate non hanno significato, ovvero una base di dati di sillabe ha scarso significato linguistico
- I limiti sintattici nel parlato sono fortemente sottodeterminati quando non sono legati agli indici prosodici
Al contrario la selezione delle entità linguistiche corrispondenti agli enunciati è basata su proprietà prosodiche altamente e immediatamente identificabili a livello percettivo. La definizione dell'enunciato nel parlato è teoricamente ben definita.
|