BooRah – Restaurant reputation report

febbraio 9, 2009
Image representing BooRah as depicted in Crunc...
Image via CrunchBase

BooRah è un aggregatore di recensioni per ristoranti, per i quali recupera “review” da diverse sorgenti (più di 100 000 tra blog e siti di recensioni) e ne fornisce un resoconto all’utente. Tramite algoritmi proprietari di NLP, vengono ricercate le opinioni scritte dagli utenti riguardo un ristorante, ne viene compreso il significato ed il tono, ricavandone la valutazione: Rah (positiva) oppure Boo (negativa). L’aggregazione di queste valutazioni va a definire dei punteggi suddivisi per ambiti: servizio, cibi e locale. Nella pagina riferita al ristorante selezionato vengono mostrate le recensioni, per le quali viene indicata la fonte (ad es. Citysearch, tripadvisor, YahooTravel, ecc…), la valutazione (Boo o Rah) e una sintesi del testo originale, che è comunque visibile per intero presso il sito da cui è stato recuperato.

La monetizzazione di queste tecnologie semantiche è iniziata recentemente, da quando BooRah ha avviato un nuovo servizio chiamato “Restaurant Reputation Report“, tramite il quale fornisce, ai ristoranti che si iscrivono pagando la quota di 25$ al mese, un report mensile ottenuto dai dati ricavati dalle analisi delle recensioni aggregate da BooRah. In questo modo vengono monetizzate le opinioni generate dagli utenti che sono recuperate da fonti sparse sul web ed aggregate su BooRah. Questo è un caso in cui le potenzialità dei contenuti user-generated, inespresse a causa della quantità delle informazioni spesso ingestibili e incronfrontabili poichè sparse sul web, vengono sfruttate in termini sia di analisi che commerciali.

Per i ristoratori, questo tipo di report può essere molto utile poichè rappresenta un resoconto della loro “reputazione online”, che sta diventando sempre più influente sulle decisioni di scelta dei consumatori che fanno sempre più uso delle recensioni generate da altri utenti.

Così come la tecnologia e l’idea che sta alla base di BooRah possono essere applicate in altri contesti, allo stesso modo può esserlo anche la possibilità di generare “analisi di mercato” basate sull’user-generated content, il cui peso è rilevante anche per quanto riguarda ad esempio alberghi e viaggi, per i quali ad esempio UpTake recupera informazioni, tramite tecnologie semantiche, da oltre 1000 siti di viaggi (Expedia, Fodor’s, etc…) e 20 milioni di opinioni di viaggiatori, per permettere all’utente di creare il proprio viaggio ideale. Un Report come quello di BooRah sarebbe utile anche per gli albergatori.

Enhanced by Zemanta
Annunci

Semantic Microblogging

febbraio 5, 2009

Interessanti slide di Benjamin Nowack sulle nuove possibilità che possono nascere dal’interazione del microblogging con il semantic web.


Calais Marmoset

febbraio 3, 2009

Calais è un progetto promosso da Thomson Reuters e basato sulla tecnologia ClearForest per la creazione automatizzata di contenuto semantico. L’iniziativa è composta da un web service che permette di generare dati in formato RDF da blocchi di testo – per il momento solo in Inglese – utilizzando algoritmi di Natural Language Processing che evidenziano entità, risorse e fatti come persone, luoghi, associazioni, etc… Questo servizio è libero e accessibile a tutti – da qui OpenCalais – sia per sviluppi commerciali che non.

calais1

Rappresentazione del funzionamento del Web Service Calais – http://www.opencalais.com

Tra gli strumenti che accompagnano Calais e le applicazioni sviluppate su di esso, è presente il tool Calais Marmoset, che in sintesi può essere definito come un “microformats injector” che una volta installato inserisce nel sito web dati strutturati con i microformats, con lo scopo di rendere la pagina indicizzabile dai crawler di Yahoo! Search e raggiungibile dalle applicazioni sviluppate tramite SearchMonkey [vedi review]. Marmoset si basa sul Calais Web Service per ricavare dai contenuti delle pagine dati semantici senza che sia necessario una strutturazione delle informazioni da parte del proprietario del sito web. Per fare ciò, Marmoset individua le richieste effettuate dai search robot alle pagine web del sito su cui è installato, a quel punto richiama il web service Calais che ricava le informazioni e le struttura e le inserisce all’interno del codice della pagina formattate con il microformat adeguato. Se ad esempio nel contenuto della pagina analizzata Calais individua una persona, Marmoset inserisce i dati relativi codificati con hCard nella pagina, automaticamente. Questo strumento rappresenta una visione del Semantic Web come futuro standard dei motori di ricerca per il recupero delle informazioni ed è un valido aiuto nell’implementazione delle tecnologie semantiche nelle pagine web, bisognerà però verificare a che livelli il codice generato potrà contribuire in una buona strategia di SEO orientato al semantic web, poichè la creazione di dati strutturati “al volo” potrebbe non essere così valida come l’integrazione “statica” di questi all’interno delle pagine. Inoltre, la scelta dei microformats piuttosto che teniche più formali come RDFa – che è utilizzata da Dapper Semantify [del quale ho già parlato qui] – potrebbe essere discutibile a causa delle limitazioni che presentano e che si ripercuotono anche sulle loro possibilità di essere adeguatamente supportati dai motori di ricerca: se un nuovo microformat viene sviluppato per risolvere un determinato problema, il motore di ricerca deve essere aggiornato in maniera da poterlo indicizzare ma evidentemente anche Marmoset dovrà supportarlo per poterlo generare ed inserire nelle pagine; diventa così necessario un doppio livello di aggiornamento.

Queste conferme potranno essere date solo quando la “Semantic Web Optimization” diventerà un vero punto di riferimento per migliorare il posizionamento di un sito web tra le SERPs.

Enhanced by Zemanta