2.1
Natural Language Processing
L'elaborazione automatica del linguaggio naturale, Natural Language Processing o N.L.P., consiste nello sviluppo di modelli ed algoritmi per la simulazione del processo linguistico umano.
Tale definizione lascia intravedere un campo sconfinato di applicazioni possibili e di multidisciplinarietà degli approcci e delle tecnologie implementabili.
Tuttavia, le principali applicazioni sviluppate per la realizzazione di alcuni dei processi classificabili come appartenenti alla linguistica umana, e quindi raggruppabili sotto tale area, potrebbero essere ridotte a due principali tipologie atte a:
· permettere la comunicazione uomo-macchina e migliorarne l'interazione: settore nel quale possono essere raggruppate tutti i sistemi di speech recognition-understanding ed interfacce per il linguaggio naturale.
· migliorare la comunicazione uomo-uomo: come la costruzione di strutture e sistemi per la classificazione automatica di corpora testuali, sistemi di rappresentazione e di sommarizzazione delle informazioni, sistemi di traduzione automatica, sistemi di Multilanguage Information Access, sistemi di Information e Cross Language Information Retrival.
Principale interesse della ricerca e` l'individuazione e l’implementazione di tecniche per lo sviluppo automatico di sistemi per il N.L.P. che abbiano un grado di accuratezza paragonabile a quella di sistemi prodotti manualmente, e tali tecniche sono usualmente basate sull'analisi automatica di corpora di testi di grandi dimensioni.
Tra gli argomenti a cui la ricerca ha dedicato maggior interesse possono essere annoverati i seguenti:
· Parsing: analisi sintattica automatica della frase; tale fase risulta preliminare per qualsiasi applicazione basata sulla comprensione automatica,
· Part of Speech Tagging: tale applicazione consiste nell'assegnare a ciascuna parola di un testo la corretta categoria sintattica, risolvendo le possibili ambiguità sulla base dell’analisi sintattica e contestuale,
· Information Extraction: assegnato un testo su un dominio specifico, si vuole sintetizzare l'informazione secondo uno schema preassegnato, ricavandone una sommarizzazione dei contenuti,
· Machine Translation: traduzione automatica di testi, per adesso implementata con discreti risultati su particolari tipi di testi, quali istruzioni tecniche, annunci, pagine web, ecc…, tutti elementi di corpora appartenenti a domini specifici o comunque dal vocabolario molto settoriale, caratteristica fondamentale per limitare le scelte del processo di disambiguazione dei termini e del loro contenuto semantico.