FoaF Explorer

marzo 15, 2009

human-readable

–>

machine-readable

–>

human-readable.


FoaF Explorer è un tool che permette di visualizzare in forma human-readable la struttura di una rete FOAF.


Enhanced by Zemanta

Yahoo! SearchMonkey and the Semantic Web – March 9-12, 2009, San Jose CA

marzo 13, 2009

Conferenza su SearchMonkey ed il Semantic Web.

“In this BoF session, we will discuss SearchMonkey, the adoption of structured data on the Web, and some of Yahoo!’s future plans in the area of semantic search.”

http://en.oreilly.com/et2009/public/schedule/detail/8889


WebMynd – plugin per Firefox

marzo 8, 2009

WebMynd è un’estensione per Firefox che permette di:

  • “evolvere” e personalizzare i risultati di Google Search fornendo informazioni aggiuntive da sorgenti come Wikipedia, Twitter, Flickr ecc… visualizzati in una barra laterale.
  • registrare i percorsi di navigazione
  • facilitare lo scorrimento tra le tab e condividere con facilità le pagine visualizzate tramite la WebMynd Dock

Tra le sorgenti per l’evoluzione dei risultati di Google vi è anche un box chiamato “Ask Twitter for help with this search” che genera automaticamente una richiesta di informazioni, riguardo la ricerca effettuata, da pubblicare su Twitter, ad esempio per la ricerca iphone gps: “I’m looking for information about iphone gps, but Google’s not working for me. Can anyone help?”.

Enhanced by Zemanta

BooRah – Restaurant reputation report

febbraio 9, 2009
Image representing BooRah as depicted in Crunc...
Image via CrunchBase

BooRah è un aggregatore di recensioni per ristoranti, per i quali recupera “review” da diverse sorgenti (più di 100 000 tra blog e siti di recensioni) e ne fornisce un resoconto all’utente. Tramite algoritmi proprietari di NLP, vengono ricercate le opinioni scritte dagli utenti riguardo un ristorante, ne viene compreso il significato ed il tono, ricavandone la valutazione: Rah (positiva) oppure Boo (negativa). L’aggregazione di queste valutazioni va a definire dei punteggi suddivisi per ambiti: servizio, cibi e locale. Nella pagina riferita al ristorante selezionato vengono mostrate le recensioni, per le quali viene indicata la fonte (ad es. Citysearch, tripadvisor, YahooTravel, ecc…), la valutazione (Boo o Rah) e una sintesi del testo originale, che è comunque visibile per intero presso il sito da cui è stato recuperato.

La monetizzazione di queste tecnologie semantiche è iniziata recentemente, da quando BooRah ha avviato un nuovo servizio chiamato “Restaurant Reputation Report“, tramite il quale fornisce, ai ristoranti che si iscrivono pagando la quota di 25$ al mese, un report mensile ottenuto dai dati ricavati dalle analisi delle recensioni aggregate da BooRah. In questo modo vengono monetizzate le opinioni generate dagli utenti che sono recuperate da fonti sparse sul web ed aggregate su BooRah. Questo è un caso in cui le potenzialità dei contenuti user-generated, inespresse a causa della quantità delle informazioni spesso ingestibili e incronfrontabili poichè sparse sul web, vengono sfruttate in termini sia di analisi che commerciali.

Per i ristoratori, questo tipo di report può essere molto utile poichè rappresenta un resoconto della loro “reputazione online”, che sta diventando sempre più influente sulle decisioni di scelta dei consumatori che fanno sempre più uso delle recensioni generate da altri utenti.

Così come la tecnologia e l’idea che sta alla base di BooRah possono essere applicate in altri contesti, allo stesso modo può esserlo anche la possibilità di generare “analisi di mercato” basate sull’user-generated content, il cui peso è rilevante anche per quanto riguarda ad esempio alberghi e viaggi, per i quali ad esempio UpTake recupera informazioni, tramite tecnologie semantiche, da oltre 1000 siti di viaggi (Expedia, Fodor’s, etc…) e 20 milioni di opinioni di viaggiatori, per permettere all’utente di creare il proprio viaggio ideale. Un Report come quello di BooRah sarebbe utile anche per gli albergatori.

Enhanced by Zemanta

Semantic Microblogging

febbraio 5, 2009

Interessanti slide di Benjamin Nowack sulle nuove possibilità che possono nascere dal’interazione del microblogging con il semantic web.


Calais Marmoset

febbraio 3, 2009

Calais è un progetto promosso da Thomson Reuters e basato sulla tecnologia ClearForest per la creazione automatizzata di contenuto semantico. L’iniziativa è composta da un web service che permette di generare dati in formato RDF da blocchi di testo – per il momento solo in Inglese – utilizzando algoritmi di Natural Language Processing che evidenziano entità, risorse e fatti come persone, luoghi, associazioni, etc… Questo servizio è libero e accessibile a tutti – da qui OpenCalais – sia per sviluppi commerciali che non.

calais1

Rappresentazione del funzionamento del Web Service Calais – http://www.opencalais.com

Tra gli strumenti che accompagnano Calais e le applicazioni sviluppate su di esso, è presente il tool Calais Marmoset, che in sintesi può essere definito come un “microformats injector” che una volta installato inserisce nel sito web dati strutturati con i microformats, con lo scopo di rendere la pagina indicizzabile dai crawler di Yahoo! Search e raggiungibile dalle applicazioni sviluppate tramite SearchMonkey [vedi review]. Marmoset si basa sul Calais Web Service per ricavare dai contenuti delle pagine dati semantici senza che sia necessario una strutturazione delle informazioni da parte del proprietario del sito web. Per fare ciò, Marmoset individua le richieste effettuate dai search robot alle pagine web del sito su cui è installato, a quel punto richiama il web service Calais che ricava le informazioni e le struttura e le inserisce all’interno del codice della pagina formattate con il microformat adeguato. Se ad esempio nel contenuto della pagina analizzata Calais individua una persona, Marmoset inserisce i dati relativi codificati con hCard nella pagina, automaticamente. Questo strumento rappresenta una visione del Semantic Web come futuro standard dei motori di ricerca per il recupero delle informazioni ed è un valido aiuto nell’implementazione delle tecnologie semantiche nelle pagine web, bisognerà però verificare a che livelli il codice generato potrà contribuire in una buona strategia di SEO orientato al semantic web, poichè la creazione di dati strutturati “al volo” potrebbe non essere così valida come l’integrazione “statica” di questi all’interno delle pagine. Inoltre, la scelta dei microformats piuttosto che teniche più formali come RDFa – che è utilizzata da Dapper Semantify [del quale ho già parlato qui] – potrebbe essere discutibile a causa delle limitazioni che presentano e che si ripercuotono anche sulle loro possibilità di essere adeguatamente supportati dai motori di ricerca: se un nuovo microformat viene sviluppato per risolvere un determinato problema, il motore di ricerca deve essere aggiornato in maniera da poterlo indicizzare ma evidentemente anche Marmoset dovrà supportarlo per poterlo generare ed inserire nelle pagine; diventa così necessario un doppio livello di aggiornamento.

Queste conferme potranno essere date solo quando la “Semantic Web Optimization” diventerà un vero punto di riferimento per migliorare il posizionamento di un sito web tra le SERPs.

Enhanced by Zemanta

Powerset

gennaio 28, 2009
Image representing Powerset as depicted in Cru...
Image via CrunchBase

Powerset – acquistato da Microsoft nel Luglio del 2008 per una cifra dell’ordine di 100 milioni di dollari – è un esempio di motore di ricerca basato sul natural language processing che permette la ricerca di singole parole ma anche di frasi o semplici domande, le cui risposte vengono cercate – per il momento – solo tra gli articoli di Wikipedia e le risorse di Freebase.

Per l’analisi e l’elaborazione delle informazioni Powerset si basa su 30 anni di sviluppo della tecnologia Xerox PARC tramite la quale costruisce un “indice semantico” su cui basare le ricerche. I risultati comprendono l’articolo di Wikipedia più pertinente alla ricerca effettuata ed una serie di articoli alternativi; è presente anche un box che mostra, se disponibili, i risultati recuperati da Freebase; dall’elenco dei risultati è inoltre possibile visualizzare direttamente gli articoli di Wikipedia.

Leggi il seguito di questo post »