5.1       Systran e BabelFish

 

L'idea di decodifica dei linguaggi naturali con tecniche automatiche si è trasformata in realtà ed obbiettivi di ricerca specializzata dopo la II Guerra Mondiale:  durante gli anni 50, la  ricerca sulla M.T., sviluppò la maggior parte dei progetti e dei tentativi utilizzando calcolatori per le traduzioni word-by-word, senza usufruire di regole linguistiche.

Lo sviluppo non di tecniche adeguate di M.T. dunque non risultò ne rapido, ne facile ne poco dispendiose, e malgrado le difficoltà incontrate e le pause nella ricerca specifica la ricerca ha persistito soprattutto tramite enti economicamente finanziati dai governi, e quindi suscettibili alla mancanza di fondi non più ivi destinati per diversi motivi,[1] mentre  Systran ha invece costituito uno del primi e pochi sviluppatori indipendenti restanti in ambito di M.T..

 

5.1.1    Systran

 

La tecnologia di Systran è stata sviluppata sotto il sistema operativo Linux ed è compatibile con tutte le diverse piattaforme: Microsoft Windows, MACOS ed Unix.

Tutti i diversi applicativi Systran utilizzano tecnologie di Natural Language Processing, N.L.P., ed il sistema costituisce una risorsa di conoscenza  multilingue  utilizzabile tramite i calcolatori comuni.

I progressi raggiunti con Systran traggono il loro sviluppo proprio dagli applicativi di linguistica computazionale e di NLP incentrati a realizzare sistemi di M.T. compatibili alle applicazioni presenti sul web, per rendere disponibile un servizio di traduzione multilingue a strumenti quali la posta elettronica, Intranet, ecc…, e quindi mantenendo Systran attinente agli standard Unicode ed HTTP.

È necessario però affrontare nuovamente il problema della qualità della traduzione automatica anche per cercare di identificare la qualità del risultato ottenuto da Systran.

Prima di tutto è fondamentale distinguere fra sistemi capaci di una M.T. accurata e precisa, detta  M.T. personalizzata, ed una traduzione meno puntuale, sintatticamente e semanticamente precisa se analizzata dettagliatamente, ma generalmente corretta, detta, appunto, M.T. generica.

È evidente che qualsiasi tentativo di M.T. dovrebbe tendere ad ottenere la migliore delle qualità possibili nella traduzione, ma questo obbiettivo, anche utilizzando i migliori dizionari e sistemi specializzati, non può sempre essere completamente soddisfatto ed è necessario ammettere che, almeno per adesso, non esistano ancora M.T.S. capaci di una traduzione impeccabile da un testo sorgente ad uno o più  testi target.

Tuttavia è altrettanto necessario interrogarsi su quale delle seguenti due opzioni sia quella più adatta alle esigenze reali intrinseche ad un M.T.S fruibile sul web, e dunque scegliere tra l’effettiva necessità di una traduzione perfetta per adesso non raggiungibile, o adeguarsi ad un livello di traduzione meno esigente, ma generalmente corretta e comprensibile oggi raggiungibile con una certa gamma di applicativi tra cui anche Systran.

La tecnologia di Systran, oggi disponibile come risorsa dei maggiori motori di ricerca sul web, è una M.T. multilingue generica ed ha lo scopo di fornire una traduzione per la comprensione sommaria di un testo sorgente, avvalendosi comunque di una corretta analisi sintattica ed una accettabile elaborazione semantica.

Systran consente allora la produzione delle versioni nelle maggiori lingue presenti sul pianeta di un testo sorgente sintatticamente e semanticamente accettabili (nel dettaglio, in realtà non lo sarebbero…), e la sua azione corrisponde alla concreta facoltà dell’utente di poter osservare una pagina straniera comprendendone ugualmente  le righe ed i contenuti principali trattati.

 

5.1.2    BabelFish

 

Come descritto precedentemente, Babelfish è uno tra i migliori traduttori online oggigiorno a disposizione degli utenti web.

Integrato da Altavista nel proprio portale, il servizio offerto da Babelfish, sviluppato con tecnologia  Systran, comprende diversi tipi di  traduzione: dal gergo più colloquiale alla traduzione tecnica e nelle più importanti lingue del mondo.

Dall'Inglese è possibile tradurre direttamente in Cinese, Giapponese, Coreano, Italiano, Francese, Spagnolo, Tedesco e Portoghese, e viceversa, e quindi, ad esempio, anche se non direttamente traducibili testi dal Cinese all’Italiano, questi sono riconducibili all’Inglese per poi ottenere la versione italiana.

Altro servizio presente in BabelFish consiste nel fatto che Altavista offre la possibilità di inserire all’interno delle proprie pagine web uno script[2] che permette la visualizzazione di un form di traduzione, senza dover cioè rimandare l’utente alla pagina principale di Altavista/BabelFish,[3] e quindi senza il passaggio di testo (all’interno del form della pagina principale di Altavista/BabelFish[4] deve essere inserito il testo sorgente) e senza la necessità di selezionare il linguaggio sorgente (questo perché al momento della richiesta per poter usufruire dello script BabelFish, viene richiesto quale sia il linguaggio  sorgente  della pagina   web   nella   quale  comparirà lo   script), ma semplicemente ciccando su

Form di BabelFish da inserire tramite script  nella nelle proprie webpages

una delle bandierine, una per ciascuna lingua supportata, per ottenere in tempo reale la traduzione della pagina stessa.

Il primo servizio europeo di traduzione automatica per web Content è stato lanciato nel 1997 dalla Digital Equipment Corporation e dalla Systran S.A. applicato e fisicamente ospitato dalla Digital Altavista Search Site.[5]

Per la prima volta, gli utenti avrebbero potuto tradurre le informazioni dallo standard linguistico inglese ad altre lingue in tempo reale e gratuitamente: il nuovo servizio ospitato sul web Engine Altavista avrebbe permesso la traduzione delle pagine web in 5 lingue europee: Francese, Tedesco, Italiano, Portoghese e Spagnolo da testi sorgenti in Inglese e viceversa; lo strumento di traduzione automatica venne chiamato BabelFish.[6]

Tramite BabelFish è possibile ottenere:

 

·        Translating Raw Text (traduzione diretta dei testi): collegandosi al sito di traduzione di Altavista,[7] l’utente ha la possibilità di inserire il testo sorgente  nell’apposito spazio del form; l’utente poi deve selezionare sia la lingua sorgente, sia la lingua target della traduzione del testo inserito.

 

·        Translating webpages: il form per gestire le opzioni di traduzione offerte da BabelFish permette di inserire l’URL della pagina web che ospita il testo da tradurre. Anche in questo caso è necessario selezionare linguaggio sorgente e linguaggio target, e d anche in questo caso si ottiene sia la visualizzazione del testo tradotto sia quella del testo sorgente.

 

·        Translating Search  Result: il web Engine Altavista offre, dopo aver effettuato un’interrogazione di ricerca ed aver ottenuto di risultati, di tradurne la sommarizzazione per poterla rende comprensibile fuori dallo standard della sua redazione.

 

Il livello di traduzione ottenibile con BabelFish è accettabile se considerate le caratteristiche e le aspettative di comprensione e di M.T. generale illustrate per Systran, e malgrado i difetti evidenti nella produzione di testi in linguaggi target semanticamente sintatticamente corretti, questa risorsa è indubbiamente interessante e coinvolgente particolarmente per quanti siano direttamente implicati ed addetti alla comunicazione tecnica internazionale.[8]

 

5.2       sperimentazioni con Babelfish

 

Il livello di traduzione, così come esaminato precedentemente, è certamente di bassa qualità, soprattutto per determinate lingue, dove spiccano evidenti errori sintattici e semantici che si concretizzano in periodi improbabili e grandi difficoltà di disambiguazione dei termini.

Tuttavia questa non è una valutazione del sistema inaspettata, infatti era chiaro ed evidente che il sistema di M.T. BabelFish, avrebbe prodotto una traduzione generale,[9] ma che con i suoi difetti, sarebbe stata sufficientemente chiara da permettere all’utente una comprensione accettabile dei contenuti espressi.

Il link al sistema di traduzione di Babelfish avrebbe dovuto avvenire in modo trasparente, e produrre a seconda della versione del portale scelta, la traduzione dei contenuti delle tre pagine precedentemente elencate, corrispondente alla lingua scelta inizialmente dall’utente.

Sarebbe stato dunque necessario inviare a BabelFish, come URL relativo al testo da tradurre, l’URL corrispondente di ciascuna voce di un indice puntato, dalla quale poter accedere alla visualizzazione della scheda relativa o ad un documento della bibliografia.

Nel momento in cui l’utente avesse selezionato una delle voci dell’elenco puntato, il link non sarebbe dunque più stato diretto con la pagina doc.php, ma avrebbe inviato a BabelFish l’URL corrispondente con i giusti parametri di traduzione, ed avrebbe visualizzato la pagina tradotta nella lingua target prescelta in modo invisibile all’utente.

Il funzionamento stesso di Systran e BabelFish avrebbe imposto che il documento sorgente, per ottenere una traduzione diretta nelle altre lingue, così come descritto precedentemente a proposito dell’architettura e del sistema Systran, fosse stato in Inglese, l’unica lingua dalla quale sarebbe stato possibile risalire a Spagnolo, Portoghese, Francese, ecc…

Momentaneamente applicato solo ai documenti archiviati all’interno della bibliografia, il sistema di M.T. tramite Systran e BabelFish avrebbe reso necessario creare una seconda tabella, chiamata Book, identica alla tabella libri, e contenente una versione inglese delle schede archivianti tutti i documenti della bibliografia.[10]

Ogni indice puntato ad essa riferito, avrebbe dovuto essere modificato nel codice generante il link[11] precedentemente diretto a doc.php, adesso riferito a BabelFish per la traduzione di doc.php nella lingua prescelta.[12]

Il sistema così creato, non dipendendo per quanto concerne il panorama delle lingue supportate da risorse implementate o meno all’interno del portale, sarebbe stato automaticamente aggiornabile a nuovi linguaggi nel momento in cui il servizio stesso di traduzione fosse stato implementato all’interno di BabelFish.

È quindi stato così possibile dotare il portale di un’ulteriore risorsa per una consultazione approfondita delle risorse bibliografiche.

 



[1] Vedi ALPAC, ecc… nell’introduzione storica alla M.T..

[2] Lo script, in Java, è reperibile compilando l’apposito form disponibile all’URL: http://www.altavista.com/sites/search/free_searchbox_transl

[6] Il nome è stato ispirato al best seller The Hitch Hiker's Guide to the Galaxy, scritto da Steve Meretzky e Douglas Adams, nel quale gli autori ipotizzano un dispositivo di traduzione automatica denominato, appunto BabelFish, Pesce di Babele, dispositivo che avrebbe dovuto essere direttamente inserito nell’orecchio ed avrebbe interfacciato direttamente la traduzione automatica.

[8] Babelfish comprende diversi tipi di traduzione: dal gergo alla traduzione tecnica, il tutto nelle più importanti lingue del mondo. Come descritto precedentemente dall'inglese è possibile tradurre in Italiano, Francese, Spagnolo, Tedesco e Portoghese, ma è altresì possibile tradurre termini e testi scritti in Russo, Giapponese e Cinese direttamente in Inglese, per poi avviarne la traduzione nelle altre lingue.

[9] Vedi 3.5.1. a proposito dei livelli di traduzione e delle caratteristiche di Systran

[10] Una descrizione molto più approfondita circa l’architettura della tabella Book sarà fornita durante la descrizione della sperimentazione di UNL applicato al portale.

La tabella Book, infatti, era stata inizialmente progettata solo per la sua applicazione ad UNL, ma poi presentandosi la possibilità di fornire un servizio multilingua accettabile tramite il sistema di M.T. offerto da BabelFish e Systran, la tabella Book è stata utilizzata proprio come archivio dei testi sorgente per le varie versioni multilinguistiche dei documenti della bibliografia.

[11] Mentre prima ad ogni indice puntato corrispondeva un link dal seguente codice:

<a href = doc.php?id=$id> dove la dinamicità del link (l’URL a cui si riferisce cambia per ogni elemento della tabella) è data dalla variabile $id, e generante un link diretto alla pagina doc.php relativa all’elemento con campo id del valore di $id (parte del codice finale: doc.php?id=$id), in questo caso era necessario creare un nuovo tipo di link dinamico, che mantenesse la sua relazione col campo id ed il valore della variabile $id per riferirsi al record selezionato dall’indice, ma che nella parte precedente del codice avesse le giuste coordinate per linkarsi a BabelFish ed inviare l’URL della pagina desiderata più i parametri della traduzione (in quale lingua BabelFish avrebbe dovuto tradurre il documento sorgente in Inglese contenuto dall’URL), il codice sarebbe stato:

<ahref=\http://babelfish.altavista.com/tr?doit=done&urltext=http://membres.lycos.fr/bibliografiapiste/biblioengl/doc.php?id=$id&lp=en_es\>

Malgrado il codice sia estremamente prolisso, è abbastanza ben leggibile, e ci permette di identificare una prima parte, in azzurro, contenente le coordinate del server di M.T. di BabelFish, e nella seconda, in rosso, l’URL relativo al documento con campo id = $id e le impostazioni di traduzione, da Inglese a Spagnolo (lp=en_es).

[12] La lingua è prescelta perché l’utente al momento del collegamento con la prima pagina del portale deve scegliere la lingua con cui entrare, interfaccia che poi sarà presente per tutto il sito, e che sarà impostata come linguaggio target delle traduzioni automatiche incontrate durante la consultazione delle risorse.