Il Web dei Dati
Vito, 8/10/10
Cosa ci aspetta
Introduzione
Il problema
Le potenziali soluzioni
pratica
introduzione

Ogni linguaggio ha la sua
Sintassi e la sua Semantica
la Sintassi è lo studio della
Grammatica
(come dire qualcosa)
la Semantica rappresenta il
significato
(cosa vogliamo dire)
Sintassi e Semantica
Formano

UNA COMUNICAZIONE
...per esempio

Internet è formata da Computer

connessi via TCP/IP
Il Web da Contenuti Collegati fra
loro e Accessibili via Internet
Le persone
possono, così, facilmente

accedere a questi Contenuti.
Questo è

WEB 1.0
...poi...

gli Sviluppatori hanno iniziato
ad usare Ajax
Le persone hanno iniziato a
pubblicare Foto e Video.
Ad usare RSS ed a «Taggare»
contenuti
A pubblicare pensieri, opinioni e
idee sui Blog
A contribuire sui Wiki
A interagire sui Social Network
E’ nato il Web in
Lettura e Scrittura
Questo è

WEB 2.0
Il Problema
Le pagine sono scritte in HTML
HTML descrive la sintassi ma
non la Semantica
Il software non comprende il
significato dell’informazione.
Quando si riuscirà a far
comprendere il significato ai

Computer
Sarà

WEB 3.0
• Il web è fatto di documenti
• Il web dei dati è fatto di oggetti
E’ possibile riconoscere
ruoli, persone, date, prodotti.
Comprendendone le relazioni (?)
Le Soluzioni
(al momento)
Soluzione TOP DOWN:
Analisi dell’informazione, web
scraping, riconoscimento del
linguaggio naturale
E’ Costosa perchè
Richiede Intervento Umano
Difficile da manutenere
Potenziali problemi legali
Soluzione BOTTOM UP:
Aggiungere metadati, ai dati
Il Web dei dati descrive relazioni
Fra cose
Ma come?
Al momento con i formati
RDF, RDFa e Microformats
RDF
Resource Description Format
(specifica W3C per descrivere risorse sul Web)
Lo fra tramite URI
le famose Triple
Oggetto - Valore – Proprietà

Soggetto – Predicato - Oggetto
• Rappresentazione Triple e Grafica di un RDF
• Rappresentazione XML e Grafica di un RDF
RDFa

Resource Description Format
a = attributes
(aggiunge gli attributi RDF nell’ XHTML)
Esempio:
Alice pubblica articoli sul suo

blog http://example.com/alice
Dichiara la licenza dei suoi
contenuti
Vuole specificare il titolo e
l’autore di un post
Ma in XHTML non ci sono
attributi simili
Usa il Vocabolario / Dublin Core
Credits di una Foto/ Dublin Core
Vuole mostrare Nome, email e
numero di telefono

E usa FOAF (Friend of a Friend)
Vuole mostrare chi sono i suoi
Amici

...e usa FOAF (Friend of a Friend)
Come estraggo Informazioni ?
Con SPARQL posso interrogare
un «sito» per otterere questi

elementi
Un esempio di Microformat
…alla fine…

Il Web Dei Dati è estensione di
ciò che vediamo oggi
…alla fine…
…risorse…
• W3c
• Rdfa.info
• Microformats.org
• http://www.google.com/webmasters/to

ols/richsnippets
...sparql alla prova
Dataset: http://www.w3.org/People/Berners-Lee/card
http://demo.openlinksw.com/sparql

Query:
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name

WHERE {
?person foaf:name ?name .
}
...ontologia

Il web dei dati