5.5       funzionamento di  UNL

 

Enconversione, deconversione, editor e viewer UNL

 

·              Enconversione (codifica in UNL), deconversione (decodifica dell’espressione UNL in un linguaggio naturale): sono essenzialmente due strumenti, un parser ed un generatore,  capaci di codificare un linguaggio naturale in espressioni UNL, ed a sua volta capaci di ricondurre un’espressione ad un linguaggio naturale l’espressione precedentemente elaborata: questi due processi sono detti rispettivamente Encodifica e Decodifica.

         Entrambi  gli strumenti insieme alle risorse linguistiche specifiche per una lingua (dizionari di lingua e grammatiche per l’analisi e la generazione) costituiscono un Language Server, e riceve le informazioni da rielaborare attraverso il web.

 

 

·              Editor e Viewer UNL per la manipolazione e la visualizzazione delle espressioni in UNL

 

 

Il Language Server si compone di:

 

Risorse:

 

o       Dizionario di lingua (parole della lingua e corrispettivi concetti in Uws che esprimono)

 

o       Una grammatica per Enconversione

 

o       Una grammatica di deconversione

 

Software:

 

o       Enconverter

 

o       Deconverter

 

Encodificatore: l’encodificatore

 

È un software che, automaticamente o interattivamente, riesce a trasformare un testo espresso in un linguaggio naturale alla sua rappresentazione in UNL, e cioè trasforma il testo da linguaggio naturale ad espressioni UNL: il software capace di eseguire l’encodifica è stato sviluppato dall’istituto UNU/IAS, ed è stato chiamato EnCo.

La caratteristica prima di EnCo è la sua universalità, e cioè la su applicabilità ad ogni linguaggio naturale, ed è affiancato nel suo lavoro di encodifica da un dizionario di parole, un dizionario di occorrenze e, naturalmente, dalla regole di conversione per la determinata lingua.

È proprio tramite i dizionari e le regole di conversione che EnCo riceve le informazioni necessarie a manipolare il documento in linguaggio naturale ed a trasformarlo in UNL, perché i dizionari a cui si appoggia contengono informazioni come il tipo di UW, le parole del linguaggio usate per esprimere suddetta UW, le loro proprietà sintattiche, ecc...

EnCo, inoltre, riesce a produrre documenti in UNL senza che l’utente abbia la minima conoscenza della sua sintassi e delle sue regole.

 

Deconvertitore

 

È  un software che riesce a ricondurre espressioni UNL in frasi espresse con un linguaggio naturale, e costituisce la parte più consolidata del processo di traduzione automatica.

Piu’ delicata è la fase di Enconversione, data l’ambiguità’ insita nel linguaggio naturale:  l’espressione UNL non deve essere ambigua, perché questo determinerebbe la generazione di piu’ soluzioni in Deconversione, fatto tecnicamente di difficile gestione e che potrebbe portare a errori.. L’espressione in UNL deve essere, perciò, unica, non ambigua.

Per questo, spesso, la fase automatica di Enconversione viene sia preceduta da una fase di pre-processing, sia seguita da un post-processing manuale per disambiguare laddove si ottengono da una frase in LN piu’ soluzioni in UNL.

Un’altra strategia adottabile potrebbe consistere nel  precedere la fase automatica da un pre-processing che disambiguasse le parti della frase, come nell’esempio precedente “man in the park with the telescope”: in UNL la frase darebbe 2 soluzioni rispettivamente con relazioni diverse; una di esse deve essere eliminata.

Il software sviluppato dall’istituto UNU/IAS è detto DeCo, anch’esso come EnCo equipaggiato con dizionari di lingua , di occorrenze e delle regole di deconversione per il linguaggio rispettivo, ed è anch’esso caratterizzato dall’applicabilità a tutti i linguaggi naturali.

 

Editor e Viewer

 

Per creare dei documenti in UNL è necessario un editor che sia collegato ad un Language Server, munito di EnCo e DeCo per determinati linguaggi naturali: l’editor invierà al server i documenti scritti nel linguaggio naturale, il server rielaborerà il testo in LN in un documento UNL che tramite il Viewer sarà mandato ad un altro Language Server per essere deconvertito…. ed invierà al viewer  il documento decodificato nei diversi linguaggi.

Durante questo processo le espressioni in UNL possono essere prodotte automaticamente oppure l’autore potrà interagire: difatti vi sono 4 tipi di editor UNL che, a seconda del metodo di enconversione, sono completamente automatizzati ( full automatic enconversion for natural language texts) o ad un livello di interattività sempre maggiore ( full automatic enconversion for controlled or tagged language texts,  interactive enconversion for natural language texts, word by word input method ).

L’interfaccia utente-server nella fase ultimata delle decodifica è il viewer ed esso riceve il documento ormai decodificato dal Language Server:  il documento è quindi tradotto nel linguaggio finale.


Il funzionamento del sistema UNL si basa dunque su una rete di Language Server interconnessi fra loro ed ai quali possono accedere gli editor – viewer di documenti UNL.

L’editor UNL riconosce la lingua, ad esempio l’Arabo, in cui è redatto il documento, e dunque invia la richiesta al Language Server che supporta il determinato linguaggio.

L’editor/viewer è connesso al Language Server:  all’editor viene proposto un documento da tradurre

Il language Server esegue dunque la encodifica del documento in UNL.

L’editor riconosce la lingua del testo ed invia  la richiesta al Language Server perché esegua l’encodifica

Una volta che il documento è stato elaborato dal software di EnCo, esso può essere visualizzato come serie di espressioni UNL, magari per una redazione del documento in modo interattivo oppure, l’applicazione finale, tramite il software di DeCo, presente sui

Il Language Server esegue la decodifica del  documento UNL e lo invia ai Viewer

 

 

 

 

 

 

 

 

 

 

 

 

 

Language Server, riconvertito in lingue, come ad esempio lo Spagnolo, ed inviato ai viewer che visualizzeranno nel browser degli utenti connessi il documento redatto nella lingua finale.