lunedì 9 settembre 2013

LOD ed interoperabilità semantica

Siamo quindi alla seconda parte sugli Open Data che descrive la parte più tecnologica, che ci porta poi alla definizione dei Linked Open Data.
All'interno delle organizzazioni pubbliche e private, i dati già ci sono, tocca aprirli, modificando i processi esistenti, affinché sia previsto questo passo non di poco impatto. Si tratta quindi di una reingegnerizzazione dei processi, e dello sviluppo di applicazioni per l'apertura dei dati che consentano di traguardare l'obiettivo.
Una volta pubblicati, i dati possono essere usati dagli sviluppatori o dagli utenti che navigano i dati, dandone un significato, si parla quindi più propriamente di informazione.
I dati vanno poi manutenuti, così come nelle normali applicazioni già esistenti; certamente il fatto che siano pubblici, obbliga ad avere una manutenzione ancora più adeguata, con dei processi e strumenti tecnologici che mirano ad ottenere una qualità del dato più elevata.
L'ottenimento di una maggiore qualità può essere anche prerequisito per la pubblicazione del dato stesso, molto dipende dal dominio e dallo scopo prefisso.
Si pensi ad esempio ad un dataset contenente degli indirizzi in formato testo libero, prima di pubblicarlo potrebbe essere necessario un trattamento del dato per aggiungere al dataset dati più precisi per la localizzazione, quali coordinate geografiche, comune, provincia, etc.
Il processo tecnologico per la produzione di un dato di maggiore qualità può essere anche incrementale, il culmine di questo è l'ottenimento di un formato Linked Open Data, ove si creano inter-relazioni tra dataset gestiti in modo distribuito sul web. Tali inter-relazioni possono essere anche circoscritte in un contesto più limitato, ad esempio all'interno di una rete intranet di un'organizzazione, in tal caso si parla semplicemente di Linked Data.
Attraverso l'utilizzo di metadati, vocabolari condivisi controllati ed ontologie, si riusano dati presenti altrove al fine di arricchire il dato, abilitando un ulteriore livello di interoperabilità, ovvero l'interoperabilità semantica.
Con essa si indica la capacità dei sistemi di trasmettere dati con un significato condiviso, non ambiguo.
E' quindi un requisito per abilitare la logica computazionale, l'inferenza, la scoperta di nuova conoscenza.
L'interoperabilità semantica è il massimo livello di interoperabilità concernente il dato, che deve necessariamente verificare un altro livello di interoperabilità, ovvero quello sintattico, come ad esempio quello offerto dal formato HTML delle pagine web, o dal formato XML dei dati che si scambiano i servizi web.
L'interoperabilità semantica passa per l'interoperabilità da progettazione, che si raggiunge attraverso una progettazione ad un livello quanto più generico, indipendente dall'applicazione e basata possibilmente sui principi di architetture WOA(Web Oriented Architecture).
L'obiettivo di generalizzare le dipendenze e le relazioni è di fondamentale importanza per la condivisione dell'informazione.
Nell'interoperabilità da progettazione, in linea con l'Enterprise Architecture, viene data notevole importanza all'aspetto middle-out della progettazione, ovvero al fatto di concentrarsi sugli identificatori, i formati ed i protocolli di scambio delle informazioni(IFaPs, Identifiers, Formats and Protocols).
Non si parte quindi da un design top-down in cui si parte dall'esigenza particolare o da un design bottom-up in cui si parte dalla particolare implementazione, ma ci si posiziona in mezzo partendo da un insieme di IFaPs aperte ad una serie di possibili usi ed implementazioni.

giovedì 30 maggio 2013

Open Data: moda o opportunità?

Dopo un bel pò di tempo, mi accingo a riprendere il cappello di blogger, su un argomento che seguo sia per il mio lavoro, sia per l'ampiezza che il fenomeno sta assumendo.
E' l'argomento Open Data, di cui do una breve introduzione. Tutto nasce dal 2009 circa quando governi come quelli degli Stati Uniti d'America, del Canada, del Regno Unito aprono alcuni dei loro dati dando vita al fenomeno Open Government Data, riconosciuto come un atto di trasparenza dei rispettivi governi nei confronti della cittadinanza. Fatto comunque positivo, il concetto è stato esteso ad una serie di possibili migliorie che potrebbero derivare dall'apertura delle informazioni.
Ad esempio, Open Data riferito alla politica è sinonimo di trasparenza, e può riavvicinare la cittadinanza scettica, Open Data nei vari studi di ricerca può favorire la disseminazione dei risultati e conseguentemente migliorare la stessa ricerca; in generale, i dati aperti possono essere riutilizzati ed arricchiti, fornendo quindi una migliore informazione, attraverso lo sviluppo di nuovi servizi.
Open Data non è solo moda quindi, anche per alcuni decreti legge che hanno obbligato alcune amministrazioni ad aprire i loro dati, ma è un veicolo informativo di non poco impatto.
Molti hanno pensato di sviluppare app che sfruttano direttamente o indirettamente i dati, alcune amministrazioni hanno lanciato concorsi di App. Per il comune di Roma, con i colleghi di Eustema, abbiamo partecipato e vinto ad un concorso sulle idee progettuali a partire dagli Open Data: qui maggiori informazioni.
A livello internazionale cito solo alcune app, come quella relativa alla mappa dei crimini di San Francisco, qui, oppure quella che trova le toilets pubbliche in Danimarca, qui.
Open Data diventa Linked quando si vengono a creare inter-relazioni tra dataset gestiti in modo distribuito sul web. Questo può avvenire attraverso l'utilizzo di tecnologie semantiche.
Qui e in prossimi post maggiori approfondimenti.