Industrializzazione tecnologie e piattaforme vocali
(Roberto Billi - LOQUENDO)

Loquendo è stata creata circa un anno e mezzo fa con lo scopo di industrializzare e portare sul mercato un background di tecnologie vocali ed applicazioni in ambito telecomunicazioni frutto di anni di investimenti resi possibili dai finanziamenti alla R&D che sono affluiti sia da gruppi privati sia da programmi nazionali e comunitari. In circa un anno e mezzo di vita, grazie alla prosecuzione ed intensificazione degli investimenti in R&D, Loquendo ha esteso le proprie tecnologie di sintesi e riconoscimento, inizialmente disponibili solo per la lingua italiana, ad altre 8 lingue (altre se ne aggiungeranno presto come lo svedese ed il cinese), ed ha sviluppato una piattaforma denominata VoxNauta in grado di supportare un’ampia gamma di applicazioni in ambito telecomunicazioni, dai portali vocali, alle applicazioni di Call Center, ai servizi di Unified Messaging.

Per perseguire gli ambiziosi obiettivi di valorizzazione dei risultati di ricerca che Loquendo si pone, è stato necessario mettere in piedi un’organizzazione industriale che prevede la gestione di linee di prodotto, la gestione delle attività di delivery e di assistenza tecnica con livelli di servizio garantiti, la creazione di canali commerciali diretti ed indiretti, i servizi di supporto e formazione verso i clienti e gli sviluppatori, i servizi professionali per la progettazione e lo sviluppo di soluzioni custom. Oggi Loquendo conta circa 170 persone ed è presente con sedi commerciali in Italia, Spagna, Sud America. Le realizzazioni più significative sono state i portali vocali (TIM 4444 e Telecom Italia 412), le applicazioni di Call Center in ambito bancario (Italia e Spagna), servizi informativi per i settori trasporti ed automotive, le soluzioni di unified messaging.

Obiettivi di ricerca sullo speech recognition e text-to-speech

Per preservare gli investimenti fatti e garantire la competitività dell’industria della lingua italiana negli anni a venire è indispensabile proseguire l’attività di ricerca sulle tecnologie di sintesi e riconoscimento. Le tematiche di ricerca di maggior interesse di Loquendo per quanto riguarda il riconoscimento vocale sono le tecniche per aumentare la robustezza in condizioni di elevato rumore ambientale, l’adattamento automatico sia a livello acustico che grammaticale, la discriminazione di parole fuori del vocabolario, le strategie di dialogo ad iniziativa mista in domini applicativi complessi, l’interazione uomo-macchina in contesti di multimodalità.

Per quanto riguarda la sintesi da testo, ci si pone l’obiettivo di dotare i sistemi di maggiori capacità espressive, simulando diversi stili comunicativi o emotivi, e di migliorare la prosodia attraverso una analisi testuale volta all'individuazione del focus semantico. Infine ci si propone di studiare e sviluppare, algoritmi di trasformazione prosodica e timbrica del segnale vocale, applicabili all’ambito della sintesi concatenativi, che consentano di variare il timbro di voce in modo da non rendere riconoscibile l’identità dello speaker donatore.

E' disponibile la presentazione in formato Microsoft PowerPoint (zip - 306 KB).