OCTOPUS System

 

Questo documento descrive l’architettura del sistema “OCTOPUS”.

 

OCTOPUS Ź un’applicazione progettata come sistema centralizzato per la gestione  e conservazione di collezioni di documenti digitali multiformato prodotti e gestiti autonomamente da piĚ istituzioni.

 

Architettura del sistema.

 

L’architettura del sistema Ź basata su tre componenti:

1.     L’archivio dei dati (di seguito “Repository”)

a.     Provvede allo “storage” dei documenti

                                                        i.     descrizione bibliografica (formato testuale)

                                                      ii.     corpo del documento multiformato (MIME)

2.     L’interfaccia applicativa “amministratore – utente” (applicazione Octopus)

a.     Provvede mediante interfaccia Web-Based a rendere disponibili tutti i servizi previsti dal sistema sia per l’ utente finale che per l’amministratore.

                                                        i.     Inserimento documenti

                                                      ii.     Amministrazione e controllo (a livello di singola istituzione) degli inserimenti

                                                     iii.     Ricerca libera (su scelte dell’utente finale)

                                                     iv.     Ricerca basata su liste prestabilite

                                                       v.     Modifica/correzione di documenti

                                                     vi.     Gestione dei diritti di accesso per ogni singolo documento

                                                    vii.     Libero accesso via Internet a chiunque fino alla “descrizione bibliografica”

                                                  viii.     Controllo dei diritti di accesso (visualizzazione e download)  del “corpo” del documento per ogni singolo documento

3.     Il data base relazionale (MySql)

a.     Provvede all’indicizzazione di vari elementi della “descrizione bibliografica” del documento.  Velocizza la ricerca e l’accesso di un documento o insieme di documenti oltre a semplificare la produzione di liste e raggruppamenti di documenti per:

                                                        i.     Anno di creazione

                                                      ii.     Tipologia

                                                     iii.     Autore

                                                     iv.     Istituzione

b.     Mantiene informazioni sulle collezioni ed altre relative al controllo dell’accesso da parte dell’amministratore designato per ogni singola istituzione:

                                                        i.     Diritti di accesso degli amministratori

                                                      ii.     Informazioni sulle collezioni

                                                     iii.     Informazioni sulle istituzioni

 

Il “Repository”

 

Modello logico del documento.

 

Un elemento essenziale nell’architettura di OCTOPUS Ź la nozione di documento, un astrazione logica che incorpora i seguenti concetti.

 

Organizzazione fisica del repository

 

Fisicamente il “repository” Ź una porzione di disco con diritti di accesso definiti, non direttamente accessibile dal protocollo “http” e strutturata secondo il modello “File System” dove, a partire da una certa “Root”, cartella (mondo Windows) o “directory: (mondo UNIX)  esiste una sotto_cartella/directory per ogni istituzione, collezione e documento ospitato nel sistema.

 

Tipicamente avremo una struttura del tipo:

 

 

 

Per ogni istituzione esiste una sotto_cartella/directory per ogni collezione definita nell’ambito dell’istituzione.

Ogni singola collezione ospita una sotto_cartella/directory per ogni documento che gli appartiene.

La sotto-cartella/directory di ogni documento ospita almeno due elementi (file), il primo definito “descrizione bibliografica”; il secondo definito “corpo” puė a sua volta essere un semplice “file” (MIME) o un insieme di file anche strutturati in ulteriori sotto_cartella/directory.

 

Document naming

Ad ogni documento viene assegnato un codice univoco nel sistema cosď costruito:

Š      Codice istituzione

Š      Codice collezione

Š      Anno di riferimento (creazione intellettuale del documento)

Š      Sigla della tipologia del documento

Š      Numero progressivo

 

Tipico codice (caso PUMA-CNR): cnr.isti/cnr.iei/2003-TR-01

 

 

L’interfaccia applicativa “amministratore – utente”

 

L’interfaccia applicativa Ź data dal sistema OCTOPUS. L’applicazione realizzata in linguaggio PHP consente mediante la costruzione dinamica di pagine WEB di attivare via “menu” i corrispondenti a servizi che permettono sia di interagire con il sistema che di produrre pagine dinamiche di risposta ad interrogazioni o ad azioni richieste dall’utente utilizzatore del sistema.

L’interfaccia Ź rivolta principalmente a tre tipologie di utenti:

Š      L’utente amministratore (il bibliotecario dell’istituzione registrata)

Š      L’utente fornitore/proprietario dei dati (personale di istituzioni registrate)

Š      L’utente comune/finale (o semplice navigatore internet)

 

I servizi

I servizi base del sistema sono organizzati in moduli che intergiscono tra loro per lo svolgimento delle funzionalitą che il sistema offre.

 

  1. Amministrazione.  Servizio riservato agli utenti registrati in qualitą di amministratori che consente di svolgere le funzioni amministrative previste per tutte le istituzioni. Ogni singola istituzione puė registrare un proprio amministratore; l’accesso al servizio Ź consentito mediante autenticazione via UserName & Password. Il Servizio consente di:

o   Amministrare i documenti inseriti dagli utenti autorizzati

§  Validazione del documento bibliografico

§  Assegnazione del codice di identificazione

§  Inserimento del documento nel “Repository”  e nel data_base

o   Editare un documento esistente in caso di errori rilevati dopo il suo inserimento

o   Rimuovere un documento non piĚ pertinente

 

  1. Inserimento: Servizio riservato agli utenti delle istituzioni registrate. Il servizio e’ disponibile dopo autenticazione dell’utente che puė essere effettuato in due diverse modalitą. Il servizio consente:

o   Di assistere l’utente nella compilazione di un’insieme di form finalizzati alla creazione della “descrizione bibliografica” che caratterizza il documento che l’utente ha intenzione di sottomettere al sistema.

o   Al termine della fase di compilazione e verifica dei dati inseriti, il sistema provvede ad inviare una e-mail di conferma dell’avvenuto invio all’indirizzo di e-mail che l’utente ha insertito nel form stesso e all’amministratore della specifica istituzione perché provveda alla fase di amministrazione.

  1. Ricerca libera: Servizio disponibile a qualunque utente internet. Il risulato della ricerca si concretizza con la visualizzazione della “descrizione bibliografica” che consente di visualizzare/scaricare il relativo  corpo” del documento in base ai diritti/modalitą di accesso attribuite al documento stesso.

  2. Ricerca basata su liste pre-definite: Servizio disponibile a qualunque utente internet. Il risulato della ricerca si concretizza con la visualizzazione della “descrizione bibliografica” che consente di visualizzare/scaricare il relativo  corpo” del documento in base ai diritti/modalitą di accesso attribuite al documento stesso.

  3. Autenticazione: Servizio per la gestione dei diritti/modalitą di accesso  ad un servizio (vedi inserimento) o di un singolo documento da parte di un generico utente. L’autenticazione puė essre effettuata in due diverse modalitą:

a.     Autenticazione utente: il sistema interroga un “server LDAP” esterno, dedicato alla specifica istituzione che provvede al relativo riconoscimento dell’utente

b.     Autenticazione indirizzo IP: il sistema rileva l’indirizzo IP della macchina utente che sta interagendo con un determinato servizio e lo verifica con la tabella degli indirizzi IP abilitati all’uso di quel servizio

 

  1. Acceso al “corpo” del documento: Il servizio di accesso, ovvero di visualizzazione/download del “corpo” di un documento verifica che ogni richiesta sia conforme alla politica di accesso stabilita per tutte le istituzioni e al diritto di accesso stabilito per il singolo documento. Allo stato attuale sono previste tre tipologie di diritto di accesso:
    1. Diritto di accesso:

                                               i.     Libero – il “corpo” del documento Ź  reso disponibile a tutti

                                             ii.     Riservato - il “corpo” del documento Ź reso disponibile solo agli utenti autenticati via LDAP o via indirizzo IP

                                            iii.     Protetto - il “corpo” del documento Ź reso disponibile solo a utenti autenticati via LDAP ma che risultano anche essere autore/co-autore del documento.

 

 

Il database MySql

 

Il data base relazionale (MySql) Ź utilizzato per la creazione di indici su diversi campi che compongono la “descrizione bibliografica” del documento che consentano di velocizzare le operazioni di ricerca e di lista. Inoltre mantiene le informazioni relative alle collezioni, alle istituzioni e ai relativi amministratori “username e password”, oltre che a informazioni per l’assegnazione assistita del “codice documento”.

Uno specifico documento descrive lo schema del data base e delle singole tabelle che lo compongono.

 

Futuri sviluppi

 

Il sistema,  attualmente centrlizzato, ha tutte le caratteristiche per poter essere reso operativo in modalitą distribuita e federata, in particolare per quanto riguarda i servizi di “inserimento” e di “amministrazione”, permettendo tuttavia di estendere l’interrogazione e la ricerca sull’intera federazione  mediante il modulo aggiuntivo (in fase di sviluppo)  “OCTOPUS Master Meta Server” che avrą la funzione di rendere trasparente all’utente finale la distribuzione fisica del sitema.