5.4       componenti e specifiche del sistema UNL

 

Il sistema UNL consiste in un linguaggio destinato al computer, e costruito per rappresentare ed esprimere qualsiasi  tipo di contenuto .

Esso è stato concepito per rappresentare un testo   frase per frase come un grafo  i cui nodi sono i concetti, mentre gli archi rappresentano le relazioni tra gli stessi concetti: ognuno dei concetti viene espresso tramite una parola universale (da qui UWs, Universal Words).

Il contenuto di una frase è dato da Uws con le relazioni binarie che si stabiliscono tra di loro: la radice del grafo è rappresentata dalla UW con attributo @entry.

 

15. John loves Mary                                                                 

 

agt(love.@entry.@present, John)

obj(love.@entry.@present, Mary)

 

 

 

 

 

 

 

 


Quindi ogni frase è costituita da un grafo , ed essa consiste nell’insieme delle  relazioni binarie e dirette fra due concetti (nodi del grafo ): la relazione binaria è visibile come l’unità base, il mattone della struttura UNL.

 (non ho capito cosa volevi dire con la frase di prima) Un documento UNL può essere definito una serie di relazioni fra concetti in formato HTML.

Per descrivere  la relazione logica espressa da ciascun arco fra due UWs sono state specificate diversi tipi di relazioni che possono verificarsi tra tipi di concetti della Base di Conoscenza (e.g. la relazione instrument si stabilisce tra un verbo di azione ed un oggetto concreto ins(do, concrete thing) mentre final state si può stabilire tra un verbo nella tassonomia di processo ed un concetto nella tassonomia di oggetto) gol(occur(gol>thing), thing) oppure gol(do(gol>thing), thing).

La stabilità e la coerenza del linguaggio UNL viene assicurata proprio dalla Base di Conoscenza rispetto alla quale si specificano le relazioni tra concetti espressi dalle Parole Universali contenute nel Dizionario di Parole Universali indicate all’interno del sistema da diverse etichette: ad esempio la relazione che specificherà il rapporto fra l’agente e l’azione compiuta sarà diversa dalla relazione che descrive il rapporto fra un evento ed il luogo, oppure il tempo in cui l’azione si svolge:

La struttura interna di ciascuna relazione è invece costruita secondo questo criterio: [1]

 

13.      <Relazione> ::= <Sigla relazione>

[ ":" <Composta da UW-ID> ] "(" { <UW1> ":" <UW-ID1> } |

":" < Composta da UW-ID1> } ","  {<UW2> ":" <UW-ID2> } |

":" < Composta da UW-ID2> } ")"

 

Questo insieme di relazioni, tuttavia, descrive solamente degli eventi, i processi e gli stati obbiettivi,  e non riescono ad esprimere tutta quella sorta di informazioni aggiuntive come gli atti linguistici (chi parla sta informando, comandando, richiedendo qualcosa, invitando qualcuno, ecc…), le attitudini (avere intenzione di…, augurarsi che…, aspettarsi che…, …essere costretti a…, ecc…), e tutte quelle connotazioni che riusciamo a individuare in una frase, come se essa, attraverso i significanti (in una lingua comune serie di parole scritte o pronunciate rispondenti ed organizzate secondo determinate leggi grammaticali, convenzioni, ecc…, mentre in UNL rappresentate da relazioni fra UWs) recasse con se tutta una serie di qualità e di sfumature contemporaneamente necessarie alla comprensione ed ulteriori al concetto della frase stessa.

Ogni lingua adotta  dei codici propri, delle soluzioni diverse per esprimere tutta questa gamma di informazioni aggiuntive appena citate, che invece UNL deve riuscire ad esprimerle in modo univoco, data la sua premessa di universalità.

Proprio perché la sua caratteristica di Universalità non è un risultato a posteriori, ma una premessa del sistema, dunque il fatto che diverse lingue adottino diversi codici per le particolari espressioni che un parlante può aggiungere alla sua comunicazione orale o scritta è del tutto indifferente, e queste informazioni saranno rappresentate tramite degli attributi, che nella sintassi del sistema saranno marcati dal carattere @ (at), accompagnando i concetti in relazione fra loro.

Per esempio il concetto di tempo rispetto ad un soggetto agente potrebbe essere anteriore, contemporaneo e posteriore, e questa informazione sarà indicata nella relazione <act> fra soggetto agente ed azione compita dall’attributo @past se ormai è un’azione compiuta, avvenuta nel passato, @present se l’azione è contemporanea al tempo del soggetto parlante,  @future se l’azione sarà successiva. La serie di attributi nel sistema possono essere suddivisi in 7 gruppi principali:

 

1.                  attributi generali,

 

2.                  attributi che esprimono l’attitudine ed emozioni del narratore,

 

3.                  Attributi che indicano i punti di vista del parlante,

 

4.                  attributi che enfatizzano una o più parti del discorso,

 

5.                  attributi che descrivono il tempo verbale,

 

6.                  attributi che indicano l'aspetto,

 

7.                  attributi che precisano l’oggetto a cui si riferisce l’evento

 

Mentre la lista delle relazioni è una lista chiusa, quella degli attributi è aperta e può incrementare man mano che altre lingue con altre caratteristiche linguistiche particolari si aggiungono alla comunità UNL.

 



[1] Legenda:

·   i simboli < (apertura di un Tag) e > (chiusura di un Tag) indicano una parola non tecnica, variabile,

·   le coppie di parentesi quadre, [ ] includono al loro interno elementi opzionali,

·   le coppie di parentesi graffe, { }  includono elementi alternativi,

·   gli apici, “” , includono al loro interno una stringa,

·   così come in quasi tutte le sintassi di programmazione, il simbolo | rappresenta l’operatore logico “or”, e cioè una disgiunzione,

·   il simbolo iniziale ::= indica che l’elemento alla sua sinistra è definito come l’espressione alla sua destra (così come in C++, Php, Pascal, ecc… la successione dei caratteri :=, o := = indica un assegnamento di valore, che può essere interpretato, data l’espressione a := f(b) come a assume il valore di,  e cioè è definito come f(b))