2.7       sistemi di M.T.: i fattori  linguistici

 

Le problematiche linguistiche di un sistema di M.T. possono essere raggruppate in 3 categorie:

 

1.      comprensione del linguaggio,

 

2.      generazione del linguaggio,

 

3.      Relazioni fra coppie di lingue  (linguaggio sorgente e linguaggio target).

 

Per quanto riguarda sia la comprensione del linguaggio sia la sua generazione, sono state proposte molte soluzioni ed i due problemi hanno avuto sviluppi ed approcci differenti: l'idea, ormai accantonata, era che per una corretta M.T. fosse necessaria una completa comprensione del testo sorgente.

Sia per ovviare alle difficoltà enormi della comprensione del testo sorgente, sia perché è stato dimostrato che il processo in realtà non è poi così strettamente indispensabile, in tempi più recenti la ricerca si è invece concentrata nel raggiungimento di una M.T. soddisfacente nella quale però l’analisi del linguaggio sorgente avesse un apporto minimo nella produzione del testo in linguaggio/i target, e quindi gli sforzi maggiori sono stati incentrati nel tentativo di risolvere problemi quali le ambiguità sintattiche e lessicali, semantiche e contestuali.

 

2.7.1    comprensione del linguaggio

 

Le ambiguità sintattiche e lessicali:

 

1.      I saw the man on the hill with the telescope.

Ho visto l’uomo sulla collina con il telescopio

 

In questo esempio non c’è alcun contesto linguistico che ci permetta di comprendere se il telescopio appartenga alla persona che parla o all’uomo a cui si riferisce (c’è anche una terza interpretazione: il colle sul quale si trova il telescopio)   in questo caso, dato che l’ambiguità è al livello pragmatico, non c’è necessità di disambiguare  e, trasferendo l’ambiguità al linguaggio target (laddove la sintassi della rispettiva lingua lo consente), essa sarà interpretata dal lettore.

 

           

2.      Inglese: book à Spagnolo: libro, reservar.

 

Il sostantivo Inglese book, al momento della sua traduzione in Spagnolo, può essere tradotto come sostantivo  se nella lingua sorgente  compare dopo l’articolo, oppure col verbo reservar.

In questo caso abbiamo quindi un contesto grammaticale che può fornire le informazioni adeguate alla disambiguazione.

 

Le ambiguità semantiche:

 

Fra le ambiguità semantiche possono essere considerate quelle  costituite  dalla Omografia (alla stesa forma grafica  corrispondono significati diversi), ad esempio:

 

3.      Inglese: ball à Spagnolo: pelota, baile

 

dove il primo sostantivo indica un oggetto sferico, mentre il secondo si riferisce ad una danza, e la Polisemia, come il verbo inglese to kill, che contiene sottili differenze di significato in diversi contesti, ad esempio:

 

4.      Inglese: kill a man à Spagnolo: matar, e

 

5.      Inglese: kill a process à Spagnolo: acabar.

 

per la scelta della parola giusta nella lingua target si rende necessario allargare il contesto in cui essa compare, nel caso specifico, saranno gli argomenti del verbo a fornire le indicazioni.

Molto spesso le ambiguità semantiche sono così complesse che è impossibile, senza una profonda comprensione del testo (cioè senza ricorrere ad un  contesto ampio che può corrispondere al limite ad un intero documento), riuscire a risolverle, come nell’esempio:

 

6.   Inglese: The computer outputs the result; it is fast à Spagnolo: La computadora imprime el resultado; es ràpida.

 

Il contesto peculiare (manuale informatico), riduce alquanto il dominio del lessico utilizzato e quindi di eventuali equivocità, e potrebbe darci l’opportunità di risolvere l’ambiguità ‘it’ distinguendo e connotando quali siano gli oggetti storable e quali non, oppure quali possano essere gli oggetti connotabili con l’attributo veloci/lenti e quali non.

Tuttavia se la premessa, ossia l’appartenenza del testo ad un dominio di corpora abbastanza specifici, venisse a mancare, la connotazione delle parole non sarebbe più sufficiente a risolvere l’ambiguità dato che anche il computer è un oggetto storable.

La semplice disambiguazione semantica necessaria per la scelta della parola giusta nella lingua target consiste nel caso specifico nella ricerca e scelta di “un candidato” fra i possibili per risolvere la referenza di it, e fra le due possibilità (it = computer/computadora oppure it = the result/el resultado ?), per poter scegliere è necessario avere conoscenze sufficientemente ampie sul dominio; ad esempio:

 

7.   John hit the dog with a stick (John hit the dog by a stick) à John golpeò el perro con el palo, ma anche

 

8.   John hit the dog with a stick (that had a stick) à John golpeò el perro con el palo (que tenìa el palo)

 

Questa ambiguità è risolvibile solo da contesto, e cioè se esso fornisce l’informazione che è John ad avere il bastone con il quale colpisce il cane, e non il cane ad avere, ad esempio, un bastone in bocca.

 

2.7.2    generazione del linguaggio: la scelta del tempo verbale

 

Un sistema di M.T., fornendo una traduzione accettabile da un linguaggio sorgente ad uno target, deve essere in grado di selezionare ed usare le parole adeguate per la resa della traduzione.

Spesso sono gli stessi termini che contengono una connotazione sufficiente alla scelta della parola appropriata per il contesto da tradurre, ma altrettanto spesso, se le informazioni linguistiche non sono presenti o sufficienti nel linguaggio sorgente, come ad esempio nel caso in cui  generare (e quindi decidere) il tempo verbale nel linguaggio finale, ad esempio:

 

9.      Cinese: bèi Hàngzhōu de fēnjĭng xīyīnzhù le à Inglese: I was captivated by the scenery of Hangchow, oppure I am

captivated by the scenery of Hangchow.

 

In questo caso l’informazione necessaria alla selezione del tempo verbale adeguato dipende del tutto dal contesto del proferire: infatti la seconda traduzione sarebbe adeguata solo se chi parla sta osservando il paesaggio  in quel momento.


 

2.7.3    relazioni fra coppie di lingue ( linguaggio sorgente e linguaggio target)

 

Un problema linguistico ulteriore riguarda l’identificazione e la rappresentazione delle relazioni fra coppie di linguaggi, ma le divergenze che occorrono tra un linguaggio e l’altro rendono semplicemente impossibile eseguire una mappatura del tutto corretta tra coppie di lingue.

Analizzando la frase:

 

10. Inglese: I like Mary à Spagnolo: Mary me gusta

 

si evince che durante la traduzione è avvenuto uno scambio di posizione fra soggetto ed oggetto dall’Inglese allo Spagnolo (Ingl. Soggetto Predicato Oggetto à Sp. Oggetto Predicato Soggetto che, con questa costruzione tematica, avrebbe come risultato la frase: Mary (to) me pleases): questo fenomeno è provocato dalle divergenze tematiche fra le due lingue.

Un caso ancora più interessante e sottile è rappresentato da questo esempio:

 

11. Inglese: I like to eat à Tedesco: Ich esse gern,

 

dove il verbo to like, in Inglese il predicato principale della frase, in Tedesco viene trasformato ad un avverbio gern, e quindi il passaggio della frase fra le due lingue evince una divergenza strutturale: l’argomento del verbo del linguaggio sorgente ha una realizzazione sintattica differente nel linguaggio target.

Anche dalla frase:

 

 12. Inglese: John entered the house à Spagnolo: John entrò en la casa

 

si evince una divergenza strutturale, poiché nella lingua inglese l’oggetto del predicato è reso da un sostantivo, the house, mentre in Spagnolo esso è introdotto da una preposizione, en la casa.

Altre divergenze riguardano la trasformazione da predicato aggettivale a predicato nominale, come in questo esempio:

 

13. Inglese: I am hungry à Tedesco: Ich habe hunger

 

in questo caso, addirittura, volendo tradurre inversamente, e cioè da Tedesco ad Inglese, il sistema di M.T. dovrebbe scegliere una voce verbale diversa, e la frase sarebbe resa con I have hunger, grammaticalmente scorretta.

Quest’ultimo esempio entra nella sfera del problema della traduzione di espressioni idiomatiche o muliword expressions che hanno (ma non sempre) corrispondenze al livello concettuale ma spesso  hanno forme linguistiche molto diverse.

Un sistema di M.T. deve quindi avere una base di criteri con il quale costruire le corrette espressioni idiomatiche, e per evitare una costruzione grammaticale errata si compilano di solito dizionari specifici ai quali i M.T.S. si appoggiano per la generazione degli idiomi corretti nel linguaggio target.

Un ulteriore problemaconsiste anche nella traduzione del linguaggio “tecnico” relativo a determinati campi semantici, e per questo sono stati compilati dizionari terminologici specializzati e multilingue.

Differenze ancora più profonde generate durante la traduzione sono provocate dalle divergenze conflazionali fra coppie di lingue, dove cioè una proposizione espressa nella lingua sorgente ha bisogno di essere espansa per una resa grammaticalmente corretta nel linguaggio target: ad esempio:

 

14.    Inglese: I stabbed John à Spagnolo: Yo le di puñaladas a John,

 

dove l’effetto dell’azione, in Inglese contenuto nel predicato, in Spagnolo deve essere specificato tramite il sostantivo puñaladas.

            Riferendo l’esempio n alla traduzione dall’Inglese all’Italiano osserviamo un caso ancora più articolato:

 

15.    Inglese: Stabbed à Italiano:  pugnalare o

dare una pugnalata o

prendere una pugnalata o

prendere a pugnalate.

 

si tratta dell’uso dei così detti verbi di supporto, verbi con significato molto generico di azione seguiti da un sostantivo.

Alcune lingue, che non hanno il corrispettivo verbo possono ricorrere al posto di un verbo alla combinazione verbo di supporto + sostantivo (anche investire = fare un investimento).

La soluzione dei problemi dovuti alle divergenze fra coppie di lingue dipende molto anche dal modello e dalle risorse linguistiche utilizzati nei sistemi di traduzione automatica, dove, per fare solo un esempio, la costruzione di adeguate relazioni fra predicati ed argomenti da un linguaggio ad un altro risolvono alcune delle divergenze qui esposte.

Questo è il caso modello basato su una  Interlingua (analizzeremo i modelli dei sistemi di M.T. successivamente), uno degli approcci più recenti, che sfrutta una rappresentazione dei significati indipendente dai linguaggi sorgente e target.