4 II
livello di MLIA:
applicazione
e realizzazione di un CLIRs
4.1 la
costruzione dell’ ontologia infor
La tabella infor avrebbe dovuto raccogliere tutti gli argomenti principali contemplati all’interno della bibliografia digitale.
Essa sarebbe stata costruita in modo da costituire una ontologia.
L’ontologia infor avrebbe costituito lo strumento tramite cui realizzare la ricerca libera, perché questa fosse svincolata dai campi della tabella libri, e perché la ricerca dei documenti avvenisse ad un livello concettuale più elevato, astratto da ogni singolo elemento della bibliografia.
La sua struttura, in un certo senso, avrebbe dovuto ricordare quella di un insieme di campi semantici, dove gli elementi appartenenti ad ognuno di essi sarebbero state tutte quelle parole che lo evocassero, ed ogni campo semantico sarebbe stato identificato dal proprio nome. Implementando questa intuizione per la costruzione di una tabella all’interno del database essa sarebbe stata organizzata in soli 2 campi:[1]
|
idi : |
argomenti
della bibliografia |
|
Chiavi : |
parole
appartenenti al campo semantico della metachiave |
Questa tabella avrebbe costituito l’archivio degli argomenti principali
contenuti all’interno della bibliografia, ad esempio:
|
idi : |
Oasi |
|
Chiavi : |
Bahariya, oasi di Bahariya, oasi
occidentali, oasi del deserto occidentale, L’oasi di Bahariya, nell’Oasi di
Bahariya, Farafra, l’oasi di Farafra, oasi di Farafra, ecc… |
Questa struttura avrebbe rappresentato dunque il concetto generale di oasi, nome registrato nel campo idi, mentre la serie di parole costituenti il campo chiavi avrebbero rappresentato le chiavi, appartenenti al campo semantico oasi.
La tabella infor sarebbe stata affiancata e relazionata alla tabella libri tramite un nuovo campo detto free, e contenente tutti i campi semantici di cui il documento avesse trattato, gli stessi del campo free.
|
free : |
argomento1,
argomento2, … argomentoN |
Tramite queste strutture il processo di interrogazione verso il database sarebbe risultato diverso da quanto precedentemente implementato: la query immessa dall’utente sarebbe stata utilizzata per l’interrogazione verso la tabella infor del database.
La funzione di select avrebbe estratto il valore del campo idi degli elementi della ontologia infor che avessero contenuto la query, o parti di essa, fra i valori del campo chiavi.[2]
Il codice estratto avrebbe costituito l’espressione della successiva funzione di select: essa avrebbe interrogato la tabella libri cercando ed estraendo solo quegli elementi che avessero presentato all’interno del campo free, valori uguali o contenenti le parti della query (corrispondenti ai valori del campo idi estratti precedentemente dall’ontologia infor) realizzando quindi un’interrogazione a livello concettuale e logico superiore perché eseguita tramite la tabella infor, contenente la rappresentazione astratta di un concetto principale tramite il suo nome nel campo idi, [3] e dei propri sinonimi, iponimi, ecc… archiviati nel campo chiavi.
[1] Momentaneamente è bene riferirsi all’ontologia infor nella sua versione monolingue. In realtà essa è una struttura multilingue, il cui numero di campi dipende dalle lingue rappresentate, e segue la regola seguente: numerocampi = numerolingue rappresentate + 1.
[2] La ricerca della query per intero sarebbe dipesa dall’opzione di ricerca della frase esatta selezionabile dall’utente. Altrimenti la query sarebbe stata considerata non più per intero, ma tokenizzata, e la funzione di select avrebbe organizzato i diversi tokens con relazioni di tipo AND o di tipo OR rispettivamente adottate in base all’opzione di ricerca di tutte le parole o di almeno una parola, sempre scelta dall’utente durante la compilazione del form di ricerca. Vedi anche
[3] Contemporaneamente anche codice identificativo, e quindi nominato campo idi.
Il fatto che esso sia rappresentato da un nome è semplicemente per abbreviare i tempi di identificazione del contenuto semantico del campo stesso.
In realtà il campo idi, così come il campo free della tabella libri, avrebbe potuto essere costituito da un indice qualsiasi, anche numerico.
La relazione fondamentale che avrebbe dovuto essere mantenuta, sarebbe stata l’equivalenza dei valori dei campi idi e free per relazionare ad ogni documento della bibliografia digitale gli argomenti contenuti.