Google acquisice Metaweb [Freebase]

luglio 19, 2010
Image representing Metaweb Technologies as dep...
Image via CrunchBase

Dal blog ufficiale, la notizia dell’acquisizione di Metaweb da parte di Google:

http://googleblog.blogspot.com/2010/07/deeper-understanding-with-metaweb.html

The web isn’t merely words—it’s information about things in the real world, and understanding the relationships between real-world entities can help us deliver relevant information more quickly.


Enhanced by Zemanta
Annunci

Powerset

gennaio 28, 2009
Image representing Powerset as depicted in Cru...
Image via CrunchBase

Powerset – acquistato da Microsoft nel Luglio del 2008 per una cifra dell’ordine di 100 milioni di dollari – è un esempio di motore di ricerca basato sul natural language processing che permette la ricerca di singole parole ma anche di frasi o semplici domande, le cui risposte vengono cercate – per il momento – solo tra gli articoli di Wikipedia e le risorse di Freebase.

Per l’analisi e l’elaborazione delle informazioni Powerset si basa su 30 anni di sviluppo della tecnologia Xerox PARC tramite la quale costruisce un “indice semantico” su cui basare le ricerche. I risultati comprendono l’articolo di Wikipedia più pertinente alla ricerca effettuata ed una serie di articoli alternativi; è presente anche un box che mostra, se disponibili, i risultati recuperati da Freebase; dall’elenco dei risultati è inoltre possibile visualizzare direttamente gli articoli di Wikipedia.

Leggi il seguito di questo post »


Il semantic web e l’evoluzione dell’indicizzazione

gennaio 27, 2009

I motori di ricerca possono essere considerati come la base fondamentale del web che conosciamo e utilizziamo oggi. Nonostante la loro utilità, sono però afflitti da alcuni problemi, in gran parte sono causati dal sovraccarico informazionale degli ultimi anni, che ne limitano le potenzilità:

  • Bassa precisione e grande numero di risultati proposti. Le pagine rilevanti vengono recuperate e mostrate ma sono accompagnate da molti altri risultati inutili, questo fatto può portare anche alla “perdita” dei risultati validi nell’insieme.
  • Mancanza di risultati. Può capitare – ormai raramente – che alcune pagine non vengano recuperate e mostrate tra i risultati anche se rilevanti.
  • Dipendenza dei risultati dalla terminologia usata nei documenti. Una query effettuata con certi termini può non dare risultati i che si otterrebbero invece usando dei sinonimi.
  • Risultati limitati ad una serie di documenti non interconnessi tra loro. Una visione d’insieme è ottenibile solo recuperando i vari documenti e raccogliendo le informazioni ma questa operazione è a carico dell’utente.

L’ostacolo principale verso un miglioramento di questa situazione è sicuramente l’incapacità delle macchine di interpretare e comprendere i contenuti – come abbiamo già detto in precedenza – ed il modo in cui si sta cercando di risolvere il problema è la creazione di contenuto in formato machine-understandable tramite la creazione del Semantic Web.

Quello dei motori di ricerca diventa quindi – data la sua rilevanza per il web – uno dei canali più importanti per la diffusione del Semantic Web ma anche per il suo sviluppo nel marketing; nuovi motori che riconoscono ed interpretano i dati semantici presenti nelle pagine che scansionano presentandoli nei risultati della ricerca come informazioni aggiuntive degli elementi cui si riferiscono rappresentano un grande passo avanti in questo senso.
Leggi il seguito di questo post »


Yahoo! SearchMonkey

gennaio 27, 2009

SearchMonkey è una piattaforma di sviluppo per permettere a sviluppatori e proprietari dei siti web di migliorare i risultati di Yahoo! Search utilizzando le nuove tecnologie semantiche. I risultati delle ricerche che rappresentano pagine con contenuti semantici verranno mostrati in modo differente dal classico blocco titolo-descrizione-URL, saranno infatti messi in evidenza immagini, un’elenco di link principali della pagina ed un insieme di informazioni rilevanti, tutto questo all’interno dello stesso elenco dei risultati organici della ricerca, generando un sicuro guadagno in termini di visualizzazione, qualità e numero dei click.
Il proprietario del sito dovrà inserire del contenuto semantico al’interno delle pagine web sfruttando i microformats, RDFa o le altre tecnologie semantiche, oppure utilizzando gli sterumenti di sviluppo forniti da Yahoo! per costruire data services che estraggono i dati d’interesse dal sito; una volta rese recuperabili le informazioni è possibile definire l’aspetto del blocco che apparirà nell’elenco dei risultati specificando quali informazioni dovranno essere visualizzate. Leggi il seguito di questo post »


Dapper Semantify

gennaio 26, 2009
Image representing Dapper as depicted in Crunc...
Image via CrunchBase

Questo servizio offerto da Dapper permette di creare versioni RDF delle pagine web, rendendone possibile l’indicizzazione da parte dei crawler che supportano questo formato, come ad esempio quello di Yahoo! Search. In questo modo si allegerisce il lavoro di ricostruzione delle pagine web per inserire i dati semantici facilitando quello spostamento verso il semantic web di cui si è parlato precedentemente e che deve avvenire in maniera decentralizzata, quasi user-driven; l’idea di SEO++[Scott Brinker] ha proprio alla base questo concetto e Semantify– ancora in beta e valido solo per siti in PHP – è quindi uno strumento che agevola l’entrata dei singoli publishers nell’era del semantic web ed al tempo stesso l’evoluzione di quest’ultimo, automatizzando lo operazioni di SEO.
Quando un crawler di un motore di ricerca raggiunge la pagina web, il sito richiama Dapper che genera la versione semantica della pagina stessa incorporando metadati con RDFa. Per utilizzare questo servizio, il proprietario del sito web deve per prima cosa generare un feed Dapper tramite la Feed Factor[Vedi post su Dapper MashupAds] selezionando campi rilevanti il cui contenuto si vuole rendere semantico ed annotandoli con gli opportuni nomi dai vocabolari supportati (FOAF, DC, CC, GeoRSS, MediaRSS); il risultato sarà un blocco di codice PHP, con il riferimento al namespace utilizzato, da inserire sul proprio sito e che verrà richiamato automaticamente trasformando i dati annotati. Al momento la scelta dei namespaces è un processo effettuato dall’utente ma Dapper prevede di automatizzarlo con algoritmi che propongono i namespaces più adatti al contenuo evidenziato.
Potremmo definire Semantify un sistema con un approccio misto tra bottom-up e top-down [concetti proposti da Alex Iskold, fondatore e CEO di AdaptiveBlue – vedi post su RWW]in quanto, almeno per il momento, i contenuti rilevanti della pagina devono essere selezionati e catalogati con gli opportuni vocabolari dall’utente ma è l’applicazione in sè che di fatto genera ed inserisce il codice RDFa nella pagina web.

Enhanced by Zemanta