5.4 componenti
e specifiche del sistema UNL
Il sistema UNL
consiste in un linguaggio destinato al computer, e costruito per rappresentare
ed esprimere qualsiasi tipo di contenuto
.
Esso
è stato concepito per rappresentare un testo
frase per frase come un grafo i
cui nodi sono i concetti, mentre gli archi rappresentano le relazioni tra gli stessi concetti: ognuno dei concetti viene espresso
tramite una parola universale (da qui UWs, Universal
Words).
Il
contenuto di una frase è dato da Uws con le relazioni binarie che si
stabiliscono tra di loro: la radice del grafo è rappresentata dalla UW con attributo
@entry.
15. John loves Mary
agt(love.@entry.@present, John)
obj(love.@entry.@present, Mary)

Quindi
ogni frase è costituita da un grafo , ed essa consiste nell’insieme delle relazioni
binarie e dirette fra due concetti (nodi del grafo ): la relazione binaria è
visibile come l’unità base, il mattone della struttura UNL.
(non ho capito cosa volevi dire con la frase
di prima) Un documento UNL può essere definito una serie di relazioni fra concetti in
formato HTML.
Per descrivere la relazione logica espressa da ciascun arco fra due UWs sono state specificate diversi tipi di relazioni che possono verificarsi tra tipi di concetti della Base di Conoscenza (e.g. la relazione instrument si stabilisce tra un verbo di azione ed un oggetto concreto ins(do, concrete thing) mentre final state si può stabilire tra un verbo nella tassonomia di processo ed un concetto nella tassonomia di oggetto) gol(occur(gol>thing), thing) oppure gol(do(gol>thing), thing).
La stabilità e la coerenza del linguaggio UNL viene assicurata proprio dalla Base di Conoscenza rispetto alla quale si specificano le relazioni tra concetti espressi dalle Parole Universali contenute nel Dizionario di Parole Universali indicate all’interno del sistema da diverse etichette: ad esempio la relazione che specificherà il rapporto fra l’agente e l’azione compiuta sarà diversa dalla relazione che descrive il rapporto fra un evento ed il luogo, oppure il tempo in cui l’azione si svolge:
La
struttura interna di ciascuna relazione è invece costruita secondo questo
criterio: [1]
13. <Relazione> ::= <Sigla relazione>
[ ":" <Composta
da UW-ID> ] "("
{ <UW1> ":" <UW-ID1> } |
":" < Composta
da UW-ID1> } "," {<UW2> ":" <UW-ID2> } |
":" < Composta
da UW-ID2> } ")"
Questo
insieme di relazioni, tuttavia, descrive solamente degli eventi, i processi e
gli stati obbiettivi, e non riescono ad
esprimere tutta quella sorta di informazioni aggiuntive come gli atti
linguistici (chi parla sta informando, comandando, richiedendo qualcosa,
invitando qualcuno, ecc…), le attitudini (avere intenzione di…, augurarsi che…,
aspettarsi che…, …essere costretti a…, ecc…), e tutte quelle connotazioni che
riusciamo a individuare in una frase, come se essa, attraverso i significanti
(in una lingua comune serie di parole scritte o pronunciate rispondenti ed
organizzate secondo determinate leggi grammaticali, convenzioni, ecc…, mentre
in UNL rappresentate da relazioni fra UWs) recasse con se tutta una
serie di qualità e di sfumature contemporaneamente necessarie alla comprensione
ed ulteriori al concetto della frase stessa.
Ogni
lingua adotta dei codici propri, delle
soluzioni diverse per esprimere tutta questa gamma di informazioni aggiuntive
appena citate, che invece UNL deve riuscire ad esprimerle in modo
univoco, data la sua premessa di universalità.
Proprio
perché la sua caratteristica di Universalità non è un risultato a posteriori,
ma una premessa del sistema, dunque il fatto che diverse lingue adottino
diversi codici per le particolari espressioni che un parlante può aggiungere alla sua comunicazione orale o scritta è del
tutto indifferente, e queste informazioni saranno rappresentate tramite degli
attributi, che nella sintassi del sistema saranno marcati dal carattere @ (at),
accompagnando i concetti in relazione fra loro.
Per esempio il concetto di tempo rispetto ad un soggetto agente potrebbe essere anteriore, contemporaneo e posteriore, e questa informazione sarà indicata nella relazione <act> fra soggetto agente ed azione compita dall’attributo @past se ormai è un’azione compiuta, avvenuta nel passato, @present se l’azione è contemporanea al tempo del soggetto parlante, @future se l’azione sarà successiva. La serie di attributi nel sistema possono essere suddivisi in 7 gruppi principali:
1.
attributi
generali,
2.
attributi che
esprimono l’attitudine ed emozioni del narratore,
3.
Attributi che
indicano i punti di vista del parlante,
4.
attributi che
enfatizzano una o più parti del discorso,
5.
attributi che
descrivono il tempo verbale,
6.
attributi che
indicano l'aspetto,
7.
attributi che
precisano l’oggetto a cui si riferisce l’evento
Mentre
la lista delle relazioni è una lista chiusa, quella degli attributi è aperta e può
incrementare man mano che altre lingue con altre caratteristiche linguistiche
particolari si aggiungono alla comunità UNL.
[1] Legenda:
· i simboli < (apertura di un Tag) e > (chiusura
di un Tag) indicano una parola non tecnica, variabile,
· le coppie di parentesi quadre, [ ] includono al loro
interno elementi opzionali,
· le coppie di parentesi graffe, { } includono elementi alternativi,
· gli apici, “” , includono al loro interno una
stringa,
· così come in quasi tutte le sintassi di programmazione, il
simbolo | rappresenta l’operatore logico “or”, e cioè una
disgiunzione,
· il simbolo iniziale ::= indica che l’elemento alla sua
sinistra è definito come l’espressione alla sua destra (così come in C++, Php,
Pascal, ecc… la successione dei caratteri :=, o := = indica un
assegnamento di valore, che può essere interpretato, data l’espressione a :=
f(b) come a assume il valore di,
e cioè è definito come f(b))