2.8 sistemi
di M.T.: fattori operativi:
Oltre alle problematiche linguistiche precedentemente introdotte, un sistema di M.T. deve essere dotato di caratteristiche operative, quali:
· l’estendibilità del sistema di M.T. alla manipolazione di altri linguaggi;
· la capacità di trattare diversi i stili testuali;
· la capacità di mantenimento una volta che esso sia stato sviluppato;
· l’integrazione con altre applicazioni;
· un metodo di valutazione per testare l’effettivo funzionamento del sistema.
2.8.1 Estendibilità del sistema di M.T. alla manipolazione di altri linguaggi
Di solito un sistema di M.T. viene sviluppato su un dominio di testi ristretto, così la fase di comprensione da testi sorgenti e la fase di generazione dei testi target potrà avvalersi dell’uso di grammatiche e dizionari ad hoc (di dimensioni piu’ ridotte) : attraverso questo sistema si restringono enormemente i casi linguistici a cui sopra abbiamo accennato.
Per poi estendere[1] il sistema ad un dominio più ampio, sarebbe necessaria l’acquisizione di nuovi termini da dizionari specializzati, ma sebbene siano stati sviluppati diversi approcci per l’acquisizione automatizzata di dati da lexicons, questi strumenti in realtà forniscono solo un supporto perché si limitano a ridurre il lavoro manuale che deve essere eseguito da personale estremamente specializzato sia in linguistica sia nel dominio al quale il dizionario ed il sistema di M.T. in upgrade appartengono
Le nuove parole che devono essere incluse nel sistema potrebbero essere estratte da un corpus annotato, ma comunque ognuna di queste nuove entrate dovrebbe essere riesaminata per controllarne l’accuratezza.
L’estensione del sistema di M.T. ad altri linguaggi deve inoltre prevedere la costruzione di un nuovo dizionario bilingue, un analizzatore grammaticale per ciascun nuovo linguaggio sorgente, ed una grammatica di generazione per il linguaggio target, e la creazione di queste nuove risorse richiede senza alcun dubbio l’intervento di personale linguisticamente specializzato, è un processo lungo, laborioso e dunque costoso in termini di tempi e di risorse umane (manpower).
L’upgrade non dovrebbe essere limitato alla sola acquisizione di nuovi termini, ma dovrebbe riguardare anche l’analisi di strutture nuove: immaginando di possedere un sistema ben funzionale per la gestione della posta elettronica nel campo commerciale (lettere commerciali) ed ipotizzando di voler estendere lo stesso sitmea alla gestione delle notizie di Agenzia, in cui sono molto frequenti le espressioni ellittiche, oppure alla traduzione di manuali d’uso di apparecchiature varie, è evidente che, contemporaneamente all’estensione del dominio d’azione, il sistema dovrebbe essere aggiornato nelle proprie strutture per poter risultare efficiente.
2.8.2 la
capacità di trattare diversi i stili testuali
un’altra importantissima caratteristica che il sistema deve possedere è la capacità di discernimento di quale sia lo stile del testo che sta esaminando, ad esempio: i testi letterari, così come quelli poetici e le novelle, usano frequentemente le metafore, la costruzione delle frasi è spesso complessa ed inusuale, e problemi simili si incontrano per trattando articoli di giornale, che oltre ai problemi precedentemente citati, spesso usano o creano parole il più “accattivanti” possibili e magari inusuali nel contesto di cui trattano: questi aspetti sono fuori della competenza dei sistemi di M.T. attuali. Essi sono invece applicabili a corpora di testi con sintassi semplice, che accingono ad un vocabolario stabile ( e non in continua evoluzione come quello letterario o giornalistico), che fanno poco uso di metafore e che quelle usate siano facilmente comprensibili e dal dominio (di allusioni, sensi, ecc…) ristretto: questa categoria include testi tecnici e scientifici, ben trattati dalle attuali applicazioni di M.T..
2.8.3
Capacità
di mantenimento
Un’altra caratteristica propria dei sistemi di M.T. è quanto effettivamente possa costare mantenere un dizionario una volta che esso sia stato acquisito.
Le interfacce ideate per utenti, riguardanti però la categoria di traduzione assistita, dunque semi-automatica, senza requisiti linguistici sono invece principalmente organizzate con la presentazione di diversi tipi di frasi dove compare la parola da assumere, ed il sistema chiede all’utente di specificare quali siano corrette e quali non lo siano, ed ogni test rappresenta una discriminante per una particolare applicazione linguistica, tuttavia anche questo metodo, basato sulla costruzione di frasi, non da i risultati desiderati in tutti i casi: sarà quindi necessaria anche con questo tipo di software una revisione da parte di un traduttore.
2.8.4 Integrazione con altre applicazioni
Una caratteristica ulteriore che un sistema di M.T. dovrebbe avere è la possibilità di integrare il proprio operato ad altri software ed applicazioni, come il riconoscimento ottico dei caratteri ( O.C.R., Optical Character Recognition ), e strumenti di editor e pubblicazione dei testi, e sempre di piu’ con il riconoscimento e la generazione di parlato (Speech).
2.8.5 Metodo di valutazione per testare
l’effettivo funzionamento del sistema
Una volta che le due applicazioni grammaticali, analizzatore sorgente e generazione target, sono state scritte, esse debbono essere seriamente testate fino a quando il loro risultato non sia accettabile su qualsiasi tipo di input venga inserito.
Sebbene questo aspetto faccia parte del processo di sviluppo di un sistema di M.T., e questo sia uno delle fasi che richiedano molto tempo per un adeguato pestaggio del sistema, non sono ancora stati creati strumenti per automatizzare il procedimento.