Linking Open Data e DBpedia

gennaio 25, 2009

W3C SWEO

Il Linking Open Data è un progetto del W3C SWEO che ha lo scopo di estendere il Web creando una rete di dati aperti e disponibili a tutti – offerti dall’ Open Data Movement – pubblicando in formato RDF insiemi di dati provenienti da diverse sorgenti e connettendone gli elementi definendo le relazioni che esistono tra questi, in modo da poter passare da un informazione ad un’altra a questa legata anche se appartengono a due sorgenti diverse; questa possibilità vale anche per i crawler dei motori di ricerca, facilitando il recupero delle informazioni. Questo progetto copre diversi dominii di riferimento delle risorse ed è un esempio di evoluzione verso il data-web globale, che può essere sfruttato dalle applicazioni semantiche.

Insiemi di dati del LOD

Insiemi di dati del LOD

Come possiamo vedere dal grafico sono diversi i progetti che supportano il LOD. Tra questi uno dei più rilevanti è DBpedia.

DBpedia è un progetto che recupera i dati presenti negli articoli di Wikipedia e li raccoglie strutturandoli e rendendoli disponibili sul web in formato RDF. La knowledge base di DBpedia attualmente comprende circa 274 milioni di triple RDF (fonte DBpedia.org, Novembre 2008) riferite ad elementi appartenenti a diversi dominii – persone, film, musica, luoghi, organizzazioni – e raccolte da 14 versioni localizzate di Wikipedia, che lo rendendono uno dei mattoni principali del “Web of Data”.
Gli elementi in DBpedia vengono definiti tramite gli URI nella forma

http://dbpedia.org/resource/Elemento_esempio

dove Elemento_esempio è il nome della risorsa recuperata dall’URL relativo a questa su en.wikipedia.org:

http://en.wikipedia.org/wiki/Elemento_esempio

In questo modo DBpedia può essere anche vista come un’ontologia multi-dominio (caratteristica che la differenzia notevolmente dalla maggior parte delle ontologie che trattano un dominio singolo) che definisce univocamente – tramite gli URI, appunto – diverse entità che possono essere riusate, ad esempio, in un profilo FOAF personale per descrivere un certo interesse che altrimenti non sarebbe identificabile, oppure per definire tag in maniera strutturata con Faviki.
Le risorse catalogate in DBpedia possiedono inoltre delle proprietà che le definiscono, come un abstract (nelle lingue per cui è disponibile) che le descrive, la categoria di appartenenza, le informazioni della relativa Infobox, collegamenti a pagine HTML con dbpedia:resource o foaf:homepage o a documenti RDF con owl:sameAs, coordinate geografiche.
Al di là dell’enorme quantità di dati che rende disponibile sul web, il progetto DBpedia è di grande importanza poichè permette il collegamento di queste risorse con altre provenienti da sorgenti diverse, come ad esempio gli 85000 link con il database geografico Geonames , e la pubblicazione dei dati in formato RDF ne rende possibile il riuso e fa sì che possano essere effettuate delle query SPARQL complesse sugli articoli di Wikipedia, che invece supporta solo la ricerca basata sulle keyword, utilizzando tools come SNORQL Query Explorer.

Reblog this post [with Zemanta]
Annunci

OWL – Web Ontology Language

novembre 16, 2008
Layer-Cake Diagram

Layer-Cake Diagram

Il livello che si trova sopra a RDF nel Layer-Cake Diagram (rappresentazione dell’architettura del Semantic Web) è OWL: Web Ontology Language.
Prima di tutto: cos’è un’ontologia? Con questo termine si intende la descrizione delle entità presenti in un sistema e delle loro relazioni. Un’ontologia quindi non è un semplice vocabolario di termini, ma una rete di relazioni tra entità definite.
OWL è un linguaggio per definire Ontologie Web e lo scopo di queste ultime è quello di descrivere formalmente il significato dei termini utilizzati nei documenti Web.
Questo livello dell’architettura del Semantic Web è molto importante per il fatto che dà la possibilità di realizzare quel passo verso la “machine-readabilty” delle informazioni, che, come abbiamo già detto, è l’elemento chiave del Semantic Web. OWL è infatti progettato per essere usato dalle applicazioni che devono elaborare le informazioni web, piuttosto che per quelle che devono solo presentarle all’utente.
Da un punto di vista di sintassi OWL è un’estensione di RDF, ma si differenzia da quest’ultimo per il fatto che RDF è un modello per rappresentare le risorse Web e le loro relazioni tramite una sintassi definita, OWL invece fornisce un vocabolario per le classi e le proprietà delle risorse RDF e per le relazioni tra queste.
Altra caratteristica fondamentale del Semantic Web che è applicata in OWL, è il concetto di riusabilità e “open world“, nel senso che le ontologie devono poter essere riutilizzabili e combinabili, in modo da poter estendere, definendo nuove ontologie, le classi che sono già descritte in una certa ontologia preesistente.

Leggi il seguito di questo post »