Seminario – Il Web e la Semantica: scenari passati, presenti e futuri. Aldo Gangemi

aprile 13, 2009

Mercoledì 15 aprile h. 14:30
Aula Seminario 2,
Dipartimento di Scienze dell’Informazione, Università di Bologna

Aldo Gangemi (CNR)

Il Web e la Semantica: scenari passati, presenti e futuri

All’interno del ciclo di seminari del corso di Laboratorio Interdisciplinare, laurea specialistica di Scienze di Internet.

Abstract
La visione di Tim Berners-Lee sullo sviluppo del Web è stata abbastanza coerente dal 1992 a oggi e si è adattata facilmente all’evoluzione delle condizioni sociali e tecnologiche di contorno.
L’aspetto centrale della sua visione, fin dagli inizi, è stato quello di introdurre strutture più ricche di significato in Internet. Una delle chiavi di interpretazione dell’evoluzione del Web è quindi la nozione di Semantica: di quali significati ci dobbiamo occupare? Cosa dobbiamo intendere per “significato” quando creiamo o usiamo tecnologie Web? Nella lezione si proporrà una prospettiva agnostica rispetto a quale sia la migliore teoria della Semantica da usare sul Web.

Breve Bio
Aldo Gangemi is a Senior Researcher at the Institute for Cognitive Sciences and Technology (http://www.istc.cnr.it) at the Italian National Research Council (http://www.cnr.it). He is co-founder of the Laboratory for Applied Ontology (http://www.loa-cnr.it), a leading research unit in the areas of conceptual modeling, formal ontology, and ontology engineering.
His research topics include knowledge engineering, the semantic web, NLP, and business modeling, with about 100 publications on international refereed journals, books and conferences.
He has been working in many national and EU projects, spanning from the pioneering biomedical ontology project GALEN (1992) to the current largest ontology engineering project NeOn (http://www.neon-project.com).
He is currently coordinating the workpackage on collaborative aspects of ontology design in NeOn, and an Italian project on the use of semantic technologies in organizational intranets.
He is reviewer for the EU and Italian governmental agencies, and consultant for Italian and international organizations.

Enhanced by Zemanta
Annunci

Web 3.0 Conference – May 19-20, NYC

marzo 24, 2009

Web 3.0 Conference: Profit and gain insight by organizing information with semantic web and linked data technologies, May 19-20, 2009 New York City, The New Yorker Hotel.

Conference about Web 3.0 for Marketers, Information Technologists and Builders.

Informations here http://www.web3event.com/.

Enhanced by Zemanta

Yahoo! SearchMonkey and the Semantic Web – March 9-12, 2009, San Jose CA

marzo 13, 2009

Conferenza su SearchMonkey ed il Semantic Web.

“In this BoF session, we will discuss SearchMonkey, the adoption of structured data on the Web, and some of Yahoo!’s future plans in the area of semantic search.”

http://en.oreilly.com/et2009/public/schedule/detail/8889


Il semantic web e l’evoluzione dell’indicizzazione

gennaio 27, 2009

I motori di ricerca possono essere considerati come la base fondamentale del web che conosciamo e utilizziamo oggi. Nonostante la loro utilità, sono però afflitti da alcuni problemi, in gran parte sono causati dal sovraccarico informazionale degli ultimi anni, che ne limitano le potenzilità:

  • Bassa precisione e grande numero di risultati proposti. Le pagine rilevanti vengono recuperate e mostrate ma sono accompagnate da molti altri risultati inutili, questo fatto può portare anche alla “perdita” dei risultati validi nell’insieme.
  • Mancanza di risultati. Può capitare – ormai raramente – che alcune pagine non vengano recuperate e mostrate tra i risultati anche se rilevanti.
  • Dipendenza dei risultati dalla terminologia usata nei documenti. Una query effettuata con certi termini può non dare risultati i che si otterrebbero invece usando dei sinonimi.
  • Risultati limitati ad una serie di documenti non interconnessi tra loro. Una visione d’insieme è ottenibile solo recuperando i vari documenti e raccogliendo le informazioni ma questa operazione è a carico dell’utente.

L’ostacolo principale verso un miglioramento di questa situazione è sicuramente l’incapacità delle macchine di interpretare e comprendere i contenuti – come abbiamo già detto in precedenza – ed il modo in cui si sta cercando di risolvere il problema è la creazione di contenuto in formato machine-understandable tramite la creazione del Semantic Web.

Quello dei motori di ricerca diventa quindi – data la sua rilevanza per il web – uno dei canali più importanti per la diffusione del Semantic Web ma anche per il suo sviluppo nel marketing; nuovi motori che riconoscono ed interpretano i dati semantici presenti nelle pagine che scansionano presentandoli nei risultati della ricerca come informazioni aggiuntive degli elementi cui si riferiscono rappresentano un grande passo avanti in questo senso.
Leggi il seguito di questo post »


AdaptiveBlue BlueOrganizer e SmartLinks

gennaio 22, 2009
Image representing AdaptiveBlue as depicted in...
Image via CrunchBase

BlueOrganizer è un add-on per Firefox che introduce un nuovo sistema di navigazione e consultazione delle pagine web e che sebbene non sia un motore di ricerca, influenza in un certo senso anche un ambito come questo poichè molte delle ricerche che oggi sono necessarie per recuperare le informazioni che ci interessano, potranno essere by-passate.
La toolbar che viene aggiunta con l’installazione dell’add-on,oltre che ad un sistema di bookmarking/pubblicazione di contenuti sulle rispettive piattaforme di bookmarking come delicious o social networks come Facebook, è che uno strumento di browsing facilitato che presenta all’utente delle “scorciatoie” ad altri siti in base al contesto della pagina che stiamo visitando. Le funzionalità più interessanti di questa applicazione sono infatti riferite alla navigazione: se ad esempio siamo su un sito che ospita recensioni di libri e ne stiamo consultando una, BlueOrganizer ci fornirà, tramite la toolbar, un collegamento diretto a quel libro su amazon.com ed un link per trovare quell’autore su Barnes & Noble. Allo stesso modo per prodotti come album musicali, ristoranti, ricette o elementi come persone, per le quali vengono resi disponibili link ai relativi profili di Facebook, Flickr, Twitter.

La toolbar di BlueOrganizer

La toolbar di BlueOrganizer


Il metodo con cui BlueOrganizer propone i siti riferiti alla pagina corrente non è standard, ma si basa sulle attività online dell’utente; al momento della configurazione del servizio, un wizard creerà una lista di servizi che potrebbero interessare in base alla storia di navigazione dell’utente.
Per riconoscere le informazioni contenute nelle pagine web, l’applicazione di AdaptiveBlue – fondata da Alex Iskold – si basa sull’utilizzo di microformats nelle pagine web, su algoritmi di riconoscimento e metodi di catalogazione delle risorse, come libri, film o ristoranti, in formati XML. Per quanto riguarda il supporto dei microformats, è una scelta ragionevole quanto lungimirante e realmente orientata al Semantic Web. I microformats supportati sono hCard, hCalendar ed addr. Anche in caso di mancanza di dati semantici incorporati nelle pagine XHTML tramite i microformats, il riconoscimento del contesto ed il recupero delle risorse sono comunque possibili. Le risorse vengono rappresentate in file XML definendo gli attributi e le keyword più usate per riferirvici e tramite queste BlueOrganizer riconosce il contenuto delle pagine visualizzate.
La catalogazione delle risorse in un formato XML interno, sembra però una scelta che rema contro all’orientamento “Semantic Web”, quello scritto con le lettere maiuscole e proposto da Tim Berners-Lee. Creando un sistema personale di catalogazione invece che sfruttare le ontologie già disponibili o crearne di nuove seguendo i linguaggi standard disponibili come OWL, AdaptiveBlue non segue l’idea di riusabilità ed estendibilità che sono alla base del Semantic Web, trascinando con sè la chiusura ed i costi che ne derivano. L’approccio di BlueOrganizer verso il semantic web è di tipo top-down e si basa sulla capacità delle macchine di riconoscere gli elementi come libri, film e musica all’interno delle pagine web, senza che debba essere presente quella fase di incorporazione di metadati propria dell’approccio bottom-up.
Lo scopo di AdaptiveBlue è fornire all’utente un nuovo metodo di browsing intelligente ed un nuovo tipo di esperienza online. Per completare questa idea, AdaptiveBlue ha sviluppato anche SmartLinks, ovvero uno strumento per la pubblicazione – ad esempio tramite il proprio blog – di link “evoluti”, nel senso che a fianco del link sarà presente un’icona blu che una volta aperta mostrerà una serie di altri collegamenti relativi all’elemento di partenza. Con BlueOrganizer, gli SmartLinks appariranno direttamente per link riferiti agli elementi di alcuni siti, come ad esempio per libri o film su amazon.com, album e canzoni su last.fm, dati finanzari su Yahoo! Finance, persone su LinkedIn.

Esempio di SmartLinks - 1

Esempio di SmartLinks - 1

Esempio di SmartLinks - 2

Esempio di SmartLinks - 2

Il metodo con cui BlueOrganizer presenta le “scorciatoie”, come abbiamo detto, si basa sulla storia di navigazione dell’utente ed è quindi personalizzata. Il grado di personalizzazione possibile sembra però limitato dall’elenco di siti che, per ogni categoria, possono essere mostrati tra le “scorciatoie” e che sono definiti come quelli “raccomandati da AdaptiveBlue” che vengono scelti in base ai livelli di traffico da Alexa. Presentare il proprio sito web tra le scorciatoie di BlueOrganizer porta sicuramente un certo vantaggio all’azienda che tratta i prodotti relativi al contesto della pagina visitata, grazie al fatto che con BlueOrganizer l’utente viene indirizzato verso una serie di alternative limitate e viene eliminato il problema della dispersione dell’utenza che è alla base di molte scelte di marketing. Inserire il proprio sito in BlueOrganizer o tra i suggerimenti di SmartLinks ipotrebbe diventare – ipotizzando un’apertura dell’applicazione in questi termini – una nuova strategia di marketing, poichè aggirando i motori di ricerca si perde una grande, potenziale sorgente di traffico rendendo quasi vane le campagne di advertising e le strategie di SEO.
Poter inserire il proprio sito nelle liste di BlueOrganizer è solo un’ipotesi, è invece certo che applicazioni come quelle di AdaptiveBlue non possono far altro che spingere verso l’inserimento di informazioni semantiche nelle pagine web, in modo da facilitare il riconoscimento delle risorse che se effettuato basandosi solo su algoritmi e confronti statistici, non darà risultati validi come quelli ottenuti da un recupero delle informazioni realizzato partendo da dati strutturati in maniera formale e precisa come con RDFa o Microformats.

Reblog this post [with Zemanta]

Juice – Intelligent discovery engine – Plugin per Firefox

novembre 8, 2008

Juice è un’interessante applicazione che si integra nel browser e fornisce delle informazioni rilevanti in base al contenuto che stiamo visualizzando durante la navigazione.

Facciamo un esempio per chiarire cosa si intende per “informazioni rilevanti in base al contenuto”: se stiamo navigando su un sito di news e vogliamo avere qualche informazione aggiuntiva ad esempio sulla località relativa alla notizia, sarà semplicemente necessario selezionare il nome della località dal testo della notizia con il cursore del mouse, fare un drag&drop et-voilà, Juice automaticamente inizia la ricerca delle informazioni riguardanti questa località. I risultati della ricerca vengono mostrati nella sidebar di Juice (che apparirà come se fosse la sidebar dell’elenco dei segnalibri).
Che risultati vengono mostrati? Sintesi dell‘articolo su Wikipedia relativo al termine da noi evidenziato, elenco di video relativi (visualizzabili anche direttamente dalla sidebar stessa), mappa della località.
Juice, inoltre, effettua automaticamente una ricerca su Google, Google Images, News, Videos e Blogs riguardo quella parola e mostra i risultati nella seconda sezione della sidebar.

Juice funge anche da pratico “raccoglitore” in cui possiamo registare, come se fossero nei segnalibri, video, o immagini, permettendone anche la visualizzazione diretta all’interno della sidebar stessa.

Per una dimostrazione del funzionamento di Juice, rimando al video di juiceapp.com:

Vodpod videos no longer available.

more about ““, posted with vodpod

Per utilizzare Juice, è semplicemente necessario scaricare e installare il plugin per firefox disponibile su http://www.juiceapp.com/. Una volta installato, Juice sarà disponibile sul nostro browser come se fosse una barra dei segnalibri, e possiamo aprirlo/chiuderlo tramite l’icona a forma di spremiagrumi in alto a destra nel browser.

juiceoff

juiceon


Che cos’è il semantic web?

settembre 29, 2008

Possiamo definire il semantic web come l’evoluzione del web che conosciamo oggi; è un’evoluzione, e non una rivoluzione, nel senso che si appoggia al World Wide Web per fornire una nuova concezione del web stesso.
L’elemento chiave di questa nuova concezione è quello di voler dare ai dati presenti sul web (e a quelli che verranno) un “significato” (da qui semantic web) che li identifichi e li metta in relazione.
Possiamo chiarire e rendere forse più concreto il concetto di semantic web immaginando di trovarci in una situazione in cui tutti i dati, tutte le informazioni che sono presenti sul web sono legate insieme, sono in relazione, formando di conseguenza un “data web” dall’enorme potenziale. Volendo dare un esempio ancora più concreto, sarebbe come se tutti i dati si trovassero in un unico enorme database.

Il semantic web va quindi ad ampliare le potenzialità del www, affiancando al “web di documenti”, il “web di dati”. La differenza tra questi è che i primi sono principalmente destinati ad essere analizzati dalle persone, mentre i secondi dalle macchine;  possiamo quindi immaginarci come rendendo i dati sul web “machine-readable“, l’interazione tra uomo e macchina possa diventare molto più efficace fornendo all’utente una nuova serie di possibilità riguardo l’analisi e la navigazione dei dati.
Facciamo un esempio: se oggi facciamo una ricerca su Google, quello che ci si presenta come risultato sono un numero (elevato) di documenti che sono inerenti con le parole su cui abbiamo basato la ricerca. Ottenuti questi risultati, sta all’utente selezionare e cercare i veri contenuti che lo interessano dalla lista di risultati.
Dati “semantici” e “machine-readable” potrebbero permettere che all’utente vengano visualizzate delle “catalogazioni” dei risultati piuttosto che la lista dei semplici documenti inerenti, se cerchiamo la parola “ippocampo” potremmo trovare risultati già suddivisi tra argomenti inerenti l’anatomia e quelli inerenti al regno animale.
Un esempio delle nuove possibilità introdotte da una concezione “semantica” dei motori di ricerca è Powerset, motore di ricerca che collega gli articoli di Wikipedia e ne aggiunge valore in termini di navigazione, estrazione e analisi dei dati. Il motore permette la ricerca di singole parole ma anche di frasi o semplici domande, le cui risposte vengono cercate tra gli articoli di Wikipedia. I risultati della ricerca comprendono l’articolo più pertinente alla ricerca effettuata, ed una serie di articoli alternativi. E’ possibile quindi visualizzare direttamente l’articolo di Wikipedia, Powerset inoltre fornisce utili funzioni di navigazione, sia tramite una suddivisione per paragrafi, sia tramite i Factz, un sommario dei concetti più importanti di ogni frase (nella forma soggetto-predicato-oggetto).

Il semantic web va anche oltre alle nuove possibilità nel mondo dei motori di ricerca, il fatto di poter connettere tra loro enormi quantità di dati da sorgenti (e formati) diverse è un grande vantaggio che viene sfruttato anche in altri campi, dalla ricerca di nuovi farmaci al social-networking (FOAF).