Linking Open Data e DBpedia

gennaio 25, 2009

W3C SWEO

Il Linking Open Data è un progetto del W3C SWEO che ha lo scopo di estendere il Web creando una rete di dati aperti e disponibili a tutti – offerti dall’ Open Data Movement – pubblicando in formato RDF insiemi di dati provenienti da diverse sorgenti e connettendone gli elementi definendo le relazioni che esistono tra questi, in modo da poter passare da un informazione ad un’altra a questa legata anche se appartengono a due sorgenti diverse; questa possibilità vale anche per i crawler dei motori di ricerca, facilitando il recupero delle informazioni. Questo progetto copre diversi dominii di riferimento delle risorse ed è un esempio di evoluzione verso il data-web globale, che può essere sfruttato dalle applicazioni semantiche.

Insiemi di dati del LOD

Insiemi di dati del LOD

Come possiamo vedere dal grafico sono diversi i progetti che supportano il LOD. Tra questi uno dei più rilevanti è DBpedia.

DBpedia è un progetto che recupera i dati presenti negli articoli di Wikipedia e li raccoglie strutturandoli e rendendoli disponibili sul web in formato RDF. La knowledge base di DBpedia attualmente comprende circa 274 milioni di triple RDF (fonte DBpedia.org, Novembre 2008) riferite ad elementi appartenenti a diversi dominii – persone, film, musica, luoghi, organizzazioni – e raccolte da 14 versioni localizzate di Wikipedia, che lo rendendono uno dei mattoni principali del “Web of Data”.
Gli elementi in DBpedia vengono definiti tramite gli URI nella forma

http://dbpedia.org/resource/Elemento_esempio

dove Elemento_esempio è il nome della risorsa recuperata dall’URL relativo a questa su en.wikipedia.org:

http://en.wikipedia.org/wiki/Elemento_esempio

In questo modo DBpedia può essere anche vista come un’ontologia multi-dominio (caratteristica che la differenzia notevolmente dalla maggior parte delle ontologie che trattano un dominio singolo) che definisce univocamente – tramite gli URI, appunto – diverse entità che possono essere riusate, ad esempio, in un profilo FOAF personale per descrivere un certo interesse che altrimenti non sarebbe identificabile, oppure per definire tag in maniera strutturata con Faviki.
Le risorse catalogate in DBpedia possiedono inoltre delle proprietà che le definiscono, come un abstract (nelle lingue per cui è disponibile) che le descrive, la categoria di appartenenza, le informazioni della relativa Infobox, collegamenti a pagine HTML con dbpedia:resource o foaf:homepage o a documenti RDF con owl:sameAs, coordinate geografiche.
Al di là dell’enorme quantità di dati che rende disponibile sul web, il progetto DBpedia è di grande importanza poichè permette il collegamento di queste risorse con altre provenienti da sorgenti diverse, come ad esempio gli 85000 link con il database geografico Geonames , e la pubblicazione dei dati in formato RDF ne rende possibile il riuso e fa sì che possano essere effettuate delle query SPARQL complesse sugli articoli di Wikipedia, che invece supporta solo la ricerca basata sulle keyword, utilizzando tools come SNORQL Query Explorer.

Reblog this post [with Zemanta]