5.5 funzionamento di UNL
Enconversione, deconversione, editor e viewer UNL
· Enconversione (codifica in UNL), deconversione (decodifica dell’espressione UNL in un linguaggio naturale): sono essenzialmente due strumenti, un parser ed un generatore, capaci di codificare un linguaggio naturale in espressioni UNL, ed a sua volta capaci di ricondurre un’espressione ad un linguaggio naturale l’espressione precedentemente elaborata: questi due processi sono detti rispettivamente Encodifica e Decodifica.
Entrambi gli strumenti insieme alle risorse linguistiche specifiche per una lingua (dizionari di lingua e grammatiche per l’analisi e la generazione) costituiscono un Language Server, e riceve le informazioni da rielaborare attraverso il web.
· Editor e Viewer UNL per la manipolazione e la visualizzazione delle espressioni in UNL
Il Language Server si compone di:
Risorse:
o Dizionario di lingua (parole della lingua e corrispettivi concetti in Uws che esprimono)
o
Una grammatica per Enconversione
o
Una grammatica di deconversione
Software:
o
Enconverter
o
Deconverter
Encodificatore: l’encodificatore
È un software che, automaticamente o interattivamente, riesce a trasformare un testo espresso in un linguaggio naturale alla sua rappresentazione in UNL, e cioè trasforma il testo da linguaggio naturale ad espressioni UNL: il software capace di eseguire l’encodifica è stato sviluppato dall’istituto UNU/IAS, ed è stato chiamato EnCo.
La caratteristica prima di EnCo è la sua universalità, e cioè la su applicabilità ad ogni linguaggio naturale, ed è affiancato nel suo lavoro di encodifica da un dizionario di parole, un dizionario di occorrenze e, naturalmente, dalla regole di conversione per la determinata lingua.
È proprio tramite i dizionari e le regole di conversione che EnCo riceve le informazioni necessarie a manipolare il documento in linguaggio naturale ed a trasformarlo in UNL, perché i dizionari a cui si appoggia contengono informazioni come il tipo di UW, le parole del linguaggio usate per esprimere suddetta UW, le loro proprietà sintattiche, ecc...
EnCo, inoltre, riesce a produrre documenti in UNL senza che l’utente abbia la minima conoscenza della sua sintassi e delle sue regole.
Deconvertitore
È un software che riesce a ricondurre espressioni UNL in frasi espresse con un linguaggio naturale, e costituisce la parte più consolidata del processo di traduzione automatica.
Piu’ delicata è la fase di Enconversione, data l’ambiguità’ insita nel linguaggio naturale: l’espressione UNL non deve essere ambigua, perché questo determinerebbe la generazione di piu’ soluzioni in Deconversione, fatto tecnicamente di difficile gestione e che potrebbe portare a errori.. L’espressione in UNL deve essere, perciò, unica, non ambigua.
Per questo, spesso, la fase automatica di Enconversione viene sia preceduta da una fase di pre-processing, sia seguita da un post-processing manuale per disambiguare laddove si ottengono da una frase in LN piu’ soluzioni in UNL.
Un’altra strategia adottabile potrebbe consistere nel precedere la fase automatica da un pre-processing che disambiguasse le parti della frase, come nell’esempio precedente “man in the park with the telescope”: in UNL la frase darebbe 2 soluzioni rispettivamente con relazioni diverse; una di esse deve essere eliminata.
Il software sviluppato dall’istituto UNU/IAS è detto DeCo, anch’esso come EnCo equipaggiato con dizionari di lingua , di occorrenze e delle regole di deconversione per il linguaggio rispettivo, ed è anch’esso caratterizzato dall’applicabilità a tutti i linguaggi naturali.
Editor
e Viewer
Per creare dei documenti in UNL è necessario un editor che sia collegato ad un Language Server, munito di EnCo e DeCo per determinati linguaggi naturali: l’editor invierà al server i documenti scritti nel linguaggio naturale, il server rielaborerà il testo in LN in un documento UNL che tramite il Viewer sarà mandato ad un altro Language Server per essere deconvertito…. ed invierà al viewer il documento decodificato nei diversi linguaggi.
Durante questo processo le espressioni in UNL possono essere prodotte automaticamente oppure l’autore potrà interagire: difatti vi sono 4 tipi di editor UNL che, a seconda del metodo di enconversione, sono completamente automatizzati ( full automatic enconversion for natural language texts) o ad un livello di interattività sempre maggiore ( full automatic enconversion for controlled or tagged language texts, interactive enconversion for natural language texts, word by word input method ).
L’interfaccia utente-server nella fase ultimata delle decodifica è il viewer ed esso riceve il documento ormai decodificato dal Language Server: il documento è quindi tradotto nel linguaggio finale.
Il funzionamento del sistema UNL si basa dunque su una rete di Language Server interconnessi fra loro ed ai quali possono accedere gli editor – viewer di documenti UNL.
L’editor UNL
riconosce la lingua, ad esempio l’Arabo, in cui è redatto il documento, e
dunque invia la richiesta al Language
Server che supporta il determinato linguaggio.
|
L’editor/viewer è connesso al Language Server: all’editor viene proposto un
documento da tradurre
|
Il language Server esegue dunque la encodifica del documento in UNL.
|
L’editor
riconosce la lingua del testo ed invia la richiesta al Language
Server perché esegua l’encodifica
|
Una volta che il documento è stato elaborato dal software di EnCo, esso può essere visualizzato come serie di espressioni UNL, magari per una redazione del documento in modo interattivo oppure, l’applicazione finale, tramite il software di DeCo, presente sui
|
Il Language
Server esegue la decodifica del documento UNL e lo invia ai Viewer |
Language Server, riconvertito in lingue, come ad esempio lo Spagnolo, ed inviato ai viewer che visualizzeranno nel browser degli utenti connessi il documento redatto nella lingua finale.