2.9       I modelli dei  sistemi di M.T.

 

Attualmente i modelli di tutti i sistemi di M.T. possono essere grosso modo raggruppate in tre classi:

 

1.      Modello  diretto

 

2.      Modello  a Transfer

 

3.      Modello  ad Interlingua

 

 

Questi tre livelli di modelli posso essere relazionati fra loro e rappresentati in un diagramma “a piramide” alla base della quale compare l’approccio diretto, che consiste nel metodo più primitivo di traduzione ed analisi, come ad esempio la sostituzione parola per parola.

Schema piramidale delle architetture di M.T.

 

Al vertice della piramide, invece, domina il sistema tramite Interlingua, che coincide con il metodo di traduzione più elaborato.

 

2.9.1    modello diretto

 

Il risultato di una traduzione tramite M.T. ad modello diretto si esplicita in una stringa dove ogni parola del linguaggio sorgente è sostituita dalla sua traduzione nel linguaggio target.

Riprendendo tutta la serie di problematiche linguistiche precedentemente incontrate, appare immediatamente un problema linguistico di tipo strutturale: generalmente l’ordine delle parole del linguaggio target differiscono da quello del linguaggio sorgente, fino a giungere al caso estremo dove il linguaggio target non permette la stessa costruzione del periodo.

Alcuni sistemi ad modello diretto, dunque, sono stati forniti di un’applicazione capace di riconoscere le forme sintattiche peculiari del linguaggio sorgente, e di riordinarle secondo forme accettabili nel linguaggio target.

Un esempio riproponibile è costituito dalla relazione tra verbo inglese to like e spagnolo gustar, rappresentabile nel seguente schema astratto: X LIKE Y à Y GUSTAR X.

L’esempio citato riguarda comunque un caso molto semplice ed intuitivo, una di quelle forme semplici che possono essere riconosciute agilmente, ma senza un analizzatore sintattico adeguato le forme dalle strutture più complesse, consequenziali, e tutte le regole ed i casi di separazione dei verbi (dove eccelle il Tedesco), non potrebbero essere riconosciute adeguatamente: in questi casi non sarebbe possibile la costruzione di schemi di relazioni dirette fra coppie di lingue.

Altro serio problema dei sistemi di M.T. ad modello diretto consiste nel processo di disambiguazione dei termini per la scelta delle parole attinenti durante la generazione della stringa nel linguaggio target.

L’unica soluzione da adottare per far fronte alle difficoltà incontrate  è la maggior restrizione possibile del dominio dei testi analizzati, così come la compilazione di un dizionario che contenga solo la traduzione più frequente per il dominio scelto, ma in ogni caso i sistemi di M.T. ad modello diretto applicati a testi comuni, producono, nel migliore dei casi, traduzioni povere.

Essi sono invece attendibili per corpora di testi molto specifici, dove  il dominio dei corpora di testi è estremamente specifico, e quindi la restrizione del relativo dizionario provocata proprio dalla settorialità del linguaggio usato, sopperisce alle carenze lasciate dall’assenza di un analizzatore sintattico, e quindi produce risultati utili destinati, chiaramente, ad un’utenza esperta di tale dominio.

 

2.9.2          modello a transfer

 

Le architetture a transfer possono essere poste fra le architetture dirette e le architetture ad interlingua, e sono state concepite per fornire una rappresentazione sintatticamente corretta in un linguaggio target dalla sua rappresentazione nel linguaggio sorgente.

Sebbene le regole dell’interfaccia di transfer che permettono la traduzione dipendano da entrambi i linguaggi, a volte le regole sintattiche per l’upgrade del sistema di M.T. ad un nuovo linguaggio devono essere solo leggermente modificate.

Il sistema a transfer necessita di regole e di relazioni tra i due linguaggi, anche per la propria rappresentazione interna: in pratica deve essere costruito un sistema per la rappresentazione interna di ciascun linguaggio, ed una serie di regole di transfer, un’interfaccia, che permetta il link fra queste due rappresentazioni.

Il sistema di rappresentazione interna fra coppie di linguaggio sarà molto simile o identico (SUBJ, OBJ1, ecc…), e tentando di rappresentare l’esempio 9:

 

9.           I like Maria à Maria me gusta, che risulterebbe

 

like(SUBJ(ARG2:NP),OBJ1(ARG1:NP))àgustar(SUBJ(ARG1:NP), OBJ(ARG2:PREP))

 

L’effetto di questa regola di transfer è quello di scambiare il soggetto e l’oggetto del predicato,  ed addirittura la categoria degli oggetti: da una preposizione (Spagnolo) ad un nome (Inglese).

Questo sistema permette inoltre di risolvere ambiguità lessicali sin quando l’analizzatore sintattico possa  determinare la categoria grammaticale  della parola del testo sorgente (part of speech): rimangono da risolvere le ambiguità lessicali e quelle sintattiche più difficili, ed in pratica frasi lunghe e  complesse potrebbero risultare incomprensibili.

Per tentare di risolvere il problema, molti sistemi sono stati dotati di un analizzatore semantico e di regole appropriate, con il risultato di un’analisi combinata sintattico-semantica. Sebbene questa sia la soluzione adottata per tentare di risolvere alcuni problemi specifici tra le coppie di lingue, l’analisi semantica rimane incompleta e, in qualche caso, dipendente dalla coppia di lingue.

Nei migliori casi i sistemi di M.T. con modello a transfer producono traduzioni eccellenti, perché prodotte tramite analisi sintattica e da una profonda analisi semantica, risultato sicuramente di livello superiore rispetto a quello raggiungibile tramite sistemi ad modello diretto, ma con il peso di dover implementare tecniche di analisi estensive del linguaggio sorgente e serie di regole di transfer per ciascuna lingua.

Un esempio di tale sistema è il SYSTRAN [1] usato dalla Comunità Europea.

 

2.9.3          modello ad interlingua

 

L’idea basilare di un sistema con modello ad interlingua per applicazioni di M.T. consiste nel fatto che l’analisi del testo nel linguaggio sorgente deve risultare in una rappresentazione del testo indipendente dal linguaggio sorgente stesso: il testo target sarebbe dunque poi generato da questo testo in “linguaggio neutro”.

Attualmente vi sono già dei sistemi commerciali che hanno adottato questo approccio, e questa è una delle più attive aree di ricerca: gli sforzi sono orientati sulla possibilità di generare un’interlingua adeguata per tutti i linguaggi, che sulla base di analisi semantiche, riesca a fornire delle traduzioni accettabili.

Applicando dunque questo principio teorico sempre all’esempio 9, il sistema interlingua dovrebbe assumere l’esistenza di un concetto  per il significato dei verbi delle due frasi, e la rappresentazione dell’esempio like à gustar potrebbe  essere la seguente:[2]

 

like/gustar: [CAUSE(X,[BE(Y, [PLEASED])])]

 

Questa rappresentazione  comunica l’idea che qualcuno o qualcosa (X) causi (Y) ad essere felice.

La situazione attuale sembra indicare che sia possibile produrre delle interlingue adeguate fra gruppi di linguaggi (ad esempio Europeo e Giapponese) il cui uso sia ristretto a particolari domini.

 

 



[1] Systran sarà approfondito successivamente.

[2] Ci sono tantissimi altri modi di rappresentare concetti in un’interlingua, per esempio ontologie, strutture tassonomiche, ecc. L’interlingua fa di solito uso di un dizionario concettuale, da cui poi creare i dizionari specifici per ogni lingua. La differenza è che, invece di passare da PAROLA in linguaX  à PAROLA in lingua Y si passa  da

CONCETTO in interlingua  à PAROLA in lingua X, PAROLA in lingua Y, ecc…