SlideShare a Scribd company logo
OntoPiA e il knowledge Graph della
Pubblica Amministrazione Italiana
Giorgia Lodi
Meetup #AperiTech di GraphRM
Data is a network
“A single road only takes us to places between two locations; roads real value
comes from being part of a network. Data works in the same way: it is not just
having more data that unlocks its value, but linking it together. Data is not
individual datasets, it is a network”
2
Standard del Web Semantico
3	
Href link non tipato)
Risorse: Documenti Web
HTML con link non tipati (href)
Standard del Web Semantico
4	
E se facessimo la stessa cosa con i dati?
Href link non tipato)
Risorse: Documenti Web
HTML con link non tipati (href)
5	
2007
Linked Open Data Cloud
Linked Open Data Cloud
6	
28 giugno
2018
Standard Web Semantico: RDF
7	
•  Un modello per I dati nel web dove I dati sono espressi sottoforma di Triple
•  Soggetto Predicato Oggetto
•  Ogni entità è identificata univocamente da un URI (Uniform Resource Identifier)
•  Il Soggetto e il Predicato hanno sempre un URI
•  L’Oggetto può anche essere un valore predefinito (Literale)
•  Le triple sono interconnesse quando condividono la stessa entità
•  Il risultato è un grafo interconnesso di triple (Linked Data)
dpedia:Rome
dbpedia:Italy
dbpedia:country foaf:homepage
“Roma”
http://www.italia.it/en/home.html
Potete provare a navigare
http://dbpedia.org/page/Rome
Vantaggi dell’RDF
•  E’ un modello di rappresentazione dei dati pensato per il Web
•  E’ basato su standard del Web
•  Consente nativamente di abilitare l’integrazione tra I dati
•  Fornisce un meccanismo per risolvere l’identitià delle cose
•  Nativamente fornisce meccanismi per garantire
interoperabilità semantica
•  E’ usato insieme al linguaggio per interrogare I dati (i.e.,
SPARQL)
•  I dati sono così associati a delle API che facilitano
l’interrogazione da parte delle macchine
Ma non li usa nessuno!!
9
Ma non li usa nessuno!!
10
Ma non li usa nessuno!!
11
Ma non li usa nessuno!!
12	
Google
knowledge
graph
Ma non li usa nessuno!!
13
Da dove iniziare?
Nel 2012 AgID
pubblicava le linee
guida per
“Interoperabilità
semantica
attraverso I Linked
Open Data”
OntoPiA – la rete di ontologie e
vocabolari controllati della Pubblica
Amministrazione
Meetup #AperiTech di GraphRM
16	
Cos’è OntoPiA e a cosa serve
•  Definisce un linguaggio comune per l’interscambio di dati
(interoperabilità semantica)
•  Definisce un modello formale, elaborabile da dispositivi digitali e
leggibile da umani (i.e., superamento della logica delle specifiche
scritte in soli file PDF!)
•  Apre la strada alla creazione di dati nativamente collegati, i.e.,
fornisce gli schemi dati per creare, interrogare il “grafo della
conoscenza” (knowledge graph) della PA italiana
•  ONTOLOGIA: una specifica formale ed
esplicita di rappresentazione
(concettualizzazione) condivisa di un
dominio di conoscenza, definita sulla
base di requisiti specifici
•  VOCABOLARIO CONTROLLATO: una serie
di termini e codici standard predefiniti e
autorizzati, preselezionati al fine di
indicizzare e recuperare informazioni
.
17
17	
OntoPiA- rete di ontologie e vocabolari controllati
18	
FACILITARE LO SVILUPPO
DI NUOVI SISTEMI
INFORMATIVI
	
AGEVOLARE LO SCAMBIO DI
DATI
ABILITARE L’INTEGRAZIONE
TRA DATI PROVENIENTI DA
SORGENTI DIVERSE
STANDARDIZZAZIONE DEI
DATI (APERTI)
OntoPiA – perché?
19	
OntoPiA e i principi del modello FAIR
•  Findable: si usano URI permanenti per identificare concetti e relazioni
nella rete di ontologie e termini nei vocabolari controllati
•  Accessible: si utilizzano protocolli standard aperti per l’accesso sul
Web (i.e. HTTP(S)) and per l’interrogazione dei dati (i.e. SPARQL)
•  Interoperable: si utilizzano protocolli standard aperti per modellare i
dati i.e. RDF e OWL
•  Reusable: tutte le ontologie e i vocabolari controllati sono pubblici,
rilasciati secondo una licenza aperta (CC-BY 4.0) e sono collegati ad
altre ontologie standard (de facto) disponibili nel Web dei Dati
Più serializzazioni disponibili
RDF/XML, RDF/turtle, JSON-LD
URI in inglese e persistenti – uso di w3id.org
https://w3id.org/italia/onto/… , https://w3id.org/italia/controlled-vocabulary/…
https://w3id.org/italia/data/….
Riuso indiretto di ontologie esistenti
Multilinguismo (etichette e descrizioni in ITA e ENG)
Navigazione html delle ontologie e dei vocabolari e interrogazione via
SPARQL
http://ontopia.daf.teamdigitale.it/sparql
o 
Agile eXtreme Design, Ontology Design Pattern
F
A
I
R
OntoPiA - Principi
.
21
21	
OntoPiA – Approccio tecnico in a nutshell
Vocabolari
controllati
Ontologie Profilo
Applicativo
Italiano
(AP_IT)
Classe Proprietà
Restrizione
Concetto
Ontologie e vocabolari controllati esterni del Web Semantico
Allineamenti esterni (aligns)
Componente
Ontologia
coinvoltaIn
associataA
importa
closeMatch, exactMatch,
relatedMatch, sameAs
importa
subClassOf, subPropertyOf, equivalent*
Versioning
23
23	
OntoPiA – Stack ontologico
24	
OntoPiA vista come rete
.
25
25	
L’attuale OntoPiA in numeri
25 ONTOLOGIE PUBBLICATE 1 IN FASE DI SVILUPPO
2 IN FASE DI REVISIONE 2 ONTOLOGIE PER METADATI
264 CLASSES
22 VOCABOLARI CONTROLLATI
1 MAPPING TRA DUE VOCABOLARI CONTROLLATI
~10800 AXIOMS
26	
OntoPiA-UI
Navigazione
HTML via LODE
(open source)
Navigazione HTML
via LodView
(open source) Interrogazione
machine-to-machine
via SPARQL endpoint
Visualizzazione
grafica (WebOWL)
https://github.com/italia/OntoPiA-UI
Esempio di interrogazioni sui dati
•  COLLABORAZIONE CON CENTRI DI RICERCA
STLab – Semantic Technologies Laboratory del CNR, Sapienza
Università di Roma
•  COLLABORAZIONE CON PUBBLICHE AMMINISTRAZIONI
e.g.,ISTAT, MIBAC, Regione Piemonte, ANAC, Comuni di
Palermo e Udine, Provincia Autonoma di Trento
•  COINVOLGIMENTO DEGLI UTENTI FINALI
Disponibile su Github: chiunque può SEMPRE commentare e/o
proporre cambiamenti e correzioni
https://github.com/italia/daf-ontologie-vocabolari-controllati
.
28
28	
OntoPiA- coinvolgimento PA e utenti
OntoNetHub
•  Un’applicazione web implementata per la gestione della rete di
ontologie
•  Consente operazione di caricamento, cancellazione e
indicizzazione degli elementi delle ontologie della rete
•  Progettata come estensione di Apache Stanbol e rilasciata come
container Docker
https://github.com/teamdigitale/ontonethub
OntoPiA – chi la usa
•  DAF - Catalogo ontologie e vocabolari
controllati
•  DAF semantic tagging
•  Harvesting di metadati
•  Alcuni interessanti riusi da PA e Aziende
30
DAF – Data & Analytics Framework
Meetup #AperiTech di GraphRM
DAF – Data & Analytics Framework
•  Sistema legale
•  presupposti normativi alle attività di valorizzazione del patrimonio informativo
pubblico, preservando la privacy
•  Gruppo di specialisti (data scientist + data engineer)
•  disegna la strategia, usa ed evolve la piattaforma
•  analizza i dati, creando storie e data application
•  supporta le PA
•  Piattaforma Nazionale Digitale dei Dati
•  conserva, integra e standardizza i dati delle PA
•  Implementa meccanismi di apprendimento automatico
•  Redistribuisce dati (API) e li visualizza (portale dei dati)
Data & Analytics Framework
https://dataportal.daf.teamdigitale.it/
34
34	
OntoPiA – Catalogo versione Alpha
35
35	
Federazione di cataloghi usando OntoPiA
35
Ministero Beni e Attività culturali
http://dati.beniculturali.it/
Regione Toscana – piattaforma CKAN
http://dati.toscana.it/catalog.rdf Comune di Palermo – piattaforma
proprietaria
https://opendata.comune.palermo.it/
dcat/dcat.php
DCAT-AP_IT – estensione
per CKAN implementata
sull’ontologia di
metadatazione di OntoPiA
Uso del vocabolario
controllato delle licenze
DAF
Creare il knowledge graph dal DAF –
Data & Analytics Framework
Meetup #AperiTech di GraphRM
Gestione flusso per triplificazione
37
Script R2RML
E’ nostra intenzione
pubblicare i
mapping
presumibilmente
nel repo delle
ontologie
Gestione Flusso per triplificazione
39
Gestione Flusso per triplificazione
40
Gestione Flusso per triplificazione
41
Primi risultati preliminari
•  Linked Open Data dell’archivio storico dei comuni utilizzando 3 dataset
•  Tabella dei Comuni ANPR (storico) – file principale
•  Dataset degli ultimi Comuni d’Italia di ISTAT
•  Dataset dell’archivio storico dei Comuni
Il dataset finale è modellato secondo l’ontologia CLV-AP_IT (Core Location
Vocabulary – Italian Application Profile)
•  Linked Open Data preliminari dell’Indice della Pubblica Amministrazione
•  Il Dataset è collegato al precedente
Il dataset è modellato secondo l’ontologia COV-AP_IT (Core Organization
Vocabulary – Italian Application Profile)
Non ancora pubblicati nello SPARQL endpoint - nelle prossime settimane
43
43	
Attuali e futuri lavori
SVILUPPO ONTOLOGIE
Stabilizzazione di alcune ontologie
Definizione di nuove sulla base degli ecosistemi del piano triennale
Definizione della documentazione online
PRODUZIONE E PUBBLICAZIONE DEI LINKED (OPEN) DATA
Produzione di altri Linked Open Data per estendere l’attuale knowledge
graph
SVILUPPO CATALOGO ONTOLOGIE
Abilitare la ricerca generale e per singoli elementi delle ontologie, in
quest’ultimo caso via indicizzatore già disponibile OntonetHub
Grazie per l’attenzione!
Meetup #AperiTech di GraphRM

More Related Content

PDF
BigID, OneTrust, IAPP Webinar: Bridging the Privacy Office with IT
BigID Inc
 
PDF
Data Quality
jerdeb
 
PDF
DDD and Microservices: Like Peanut Butter and Jelly - Matt Stine
VMware Tanzu
 
PDF
Enterprise Data Governance Framework With Change Management
SlideTeam
 
PDF
Data Architecture Strategies
DATAVERSITY
 
PDF
FIDO & PSD2: Solving the Strong Customer Authentication Challenge in Europe
FIDO Alliance
 
PPTX
CKAN as an open-source data management solution for open data
AIMS (Agricultural Information Management Standards)
 
PDF
Time to Talk about Data Mesh
LibbySchulze
 
BigID, OneTrust, IAPP Webinar: Bridging the Privacy Office with IT
BigID Inc
 
Data Quality
jerdeb
 
DDD and Microservices: Like Peanut Butter and Jelly - Matt Stine
VMware Tanzu
 
Enterprise Data Governance Framework With Change Management
SlideTeam
 
Data Architecture Strategies
DATAVERSITY
 
FIDO & PSD2: Solving the Strong Customer Authentication Challenge in Europe
FIDO Alliance
 
CKAN as an open-source data management solution for open data
AIMS (Agricultural Information Management Standards)
 
Time to Talk about Data Mesh
LibbySchulze
 

What's hot (20)

PDF
Apache Kafka in the Transportation and Logistics
Kai Wähner
 
PPTX
Strategic Business Requirements for Master Data Management Systems
Boris Otto
 
PDF
Data Governance Roles as the Backbone of Your Program
DATAVERSITY
 
PPT
MDM and Reference Data
Database Answers Ltd.
 
PDF
Architect’s Open-Source Guide for a Data Mesh Architecture
Databricks
 
PPT
Notes On Single View Of The Customer
Alan McSweeney
 
PPT
Data Governance in a big data era
Pieter De Leenheer
 
PDF
DAS Slides: Self-Service Reporting and Data Prep – Benefits & Risks
DATAVERSITY
 
PDF
Data Architecture Strategies: The Rise of the Graph Database
DATAVERSITY
 
PPTX
NiFi Best Practices for the Enterprise
Gregory Keys
 
PPTX
Capability Model_Data Governance
Steve Novak
 
PDF
Delta from a Data Engineer's Perspective
Databricks
 
PDF
Data Architecture Strategies: Building an Enterprise Data Strategy – Where to...
DATAVERSITY
 
PDF
Lessons learned when integrating with Dynamics 365
Codit
 
PDF
The Case for Graphs in Supply Chains
Neo4j
 
PPTX
Data science presentation - Management career institute
PoojaPatidar11
 
PDF
3D Data Strategy Framework
Daniel Ren
 
PDF
Cisco hyperflex software defined storage and ucs unite
Cisco Canada
 
PDF
CKAN: open source data catalog
Maurizio Napolitano
 
PDF
ADV Slides: Strategies for Fitting a Data Lake into a Modern Data Architecture
DATAVERSITY
 
Apache Kafka in the Transportation and Logistics
Kai Wähner
 
Strategic Business Requirements for Master Data Management Systems
Boris Otto
 
Data Governance Roles as the Backbone of Your Program
DATAVERSITY
 
MDM and Reference Data
Database Answers Ltd.
 
Architect’s Open-Source Guide for a Data Mesh Architecture
Databricks
 
Notes On Single View Of The Customer
Alan McSweeney
 
Data Governance in a big data era
Pieter De Leenheer
 
DAS Slides: Self-Service Reporting and Data Prep – Benefits & Risks
DATAVERSITY
 
Data Architecture Strategies: The Rise of the Graph Database
DATAVERSITY
 
NiFi Best Practices for the Enterprise
Gregory Keys
 
Capability Model_Data Governance
Steve Novak
 
Delta from a Data Engineer's Perspective
Databricks
 
Data Architecture Strategies: Building an Enterprise Data Strategy – Where to...
DATAVERSITY
 
Lessons learned when integrating with Dynamics 365
Codit
 
The Case for Graphs in Supply Chains
Neo4j
 
Data science presentation - Management career institute
PoojaPatidar11
 
3D Data Strategy Framework
Daniel Ren
 
Cisco hyperflex software defined storage and ucs unite
Cisco Canada
 
CKAN: open source data catalog
Maurizio Napolitano
 
ADV Slides: Strategies for Fitting a Data Lake into a Modern Data Architecture
DATAVERSITY
 
Ad

Similar to Il "Knowledge Graph" della Pubblica Amministrazione Italiana (20)

PDF
OntoPiA la rete di ontologie e vocabolari controllati per la pubblica amminis...
Giorgia Lodi
 
PDF
OntoPiA e il knowledge graph della pubblica amministrazione italiana
Giorgia Lodi
 
PDF
Sviluppo di ontologie per gli Open Data
Giorgia Lodi
 
PDF
L'ontologia dei contratti pubblici nella rete di ontologie OntoPiA
Giorgia Lodi
 
PDF
OntoPiA e il ruolo delle ontologie negli ecosistemi
Giorgia Lodi
 
PDF
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...
libriedocumenti
 
PDF
G.Lodi, OntoPiA La rete di ontologie e vocabolari controllati per la Pubblica...
Istituto nazionale di statistica
 
PDF
Interoperabilità semantica: metadatazione e ontologie per la PA
Giorgia Lodi
 
PDF
Linked Open Data di Vittorio Di Tomaso
CELI
 
PDF
SCE2014 - Linked Open Data: come fare, cosa serve
Diego Valerio Camarda
 
PPTX
5a. Linked Data
Mau-Messenger
 
PDF
Brochure: Linked Open Data PILLS
@CULT Srl
 
PDF
Open Content - Turn your content into value
Speck&Tech
 
PPT
9a. Il web semantico
Maurizio Caminito
 
PDF
Introduzione a Linked Open data e Web semantico / Antonella Iacono
libriedocumenti
 
PPT
3c WEB SEMANTICO. Ontologie e RDF
Mau-Messenger
 
PPTX
Stato dell'arte delle tecnologie per il riuso degli Open Data
Massimiliano Margarone
 
PDF
Introduzione ai Linked Open Data e al Web Semantico
Cristiano Longo
 
PDF
Knowledge graphs ovunque: un quadro di insieme, e le implicazioni per uno svi...
Matteo Brunati
 
PDF
Il web intelligente
Davide Cerbo
 
OntoPiA la rete di ontologie e vocabolari controllati per la pubblica amminis...
Giorgia Lodi
 
OntoPiA e il knowledge graph della pubblica amministrazione italiana
Giorgia Lodi
 
Sviluppo di ontologie per gli Open Data
Giorgia Lodi
 
L'ontologia dei contratti pubblici nella rete di ontologie OntoPiA
Giorgia Lodi
 
OntoPiA e il ruolo delle ontologie negli ecosistemi
Giorgia Lodi
 
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...
libriedocumenti
 
G.Lodi, OntoPiA La rete di ontologie e vocabolari controllati per la Pubblica...
Istituto nazionale di statistica
 
Interoperabilità semantica: metadatazione e ontologie per la PA
Giorgia Lodi
 
Linked Open Data di Vittorio Di Tomaso
CELI
 
SCE2014 - Linked Open Data: come fare, cosa serve
Diego Valerio Camarda
 
5a. Linked Data
Mau-Messenger
 
Brochure: Linked Open Data PILLS
@CULT Srl
 
Open Content - Turn your content into value
Speck&Tech
 
9a. Il web semantico
Maurizio Caminito
 
Introduzione a Linked Open data e Web semantico / Antonella Iacono
libriedocumenti
 
3c WEB SEMANTICO. Ontologie e RDF
Mau-Messenger
 
Stato dell'arte delle tecnologie per il riuso degli Open Data
Massimiliano Margarone
 
Introduzione ai Linked Open Data e al Web Semantico
Cristiano Longo
 
Knowledge graphs ovunque: un quadro di insieme, e le implicazioni per uno svi...
Matteo Brunati
 
Il web intelligente
Davide Cerbo
 
Ad

More from GraphRM (14)

PDF
A gentle introduction to random and strategic networks
GraphRM
 
PDF
How to leverage Kafka data streams with Neo4j
GraphRM
 
PDF
From zero to gremlin hero - Part I
GraphRM
 
PDF
Topology Visualization at Sysdig
GraphRM
 
PPTX
Tecniche per la Visualizzazione di Grafi di Grandi Dimensioni Basate sulla Co...
GraphRM
 
PDF
aRangodb, un package per l'utilizzo di ArangoDB con R
GraphRM
 
PDF
The power of the cosmos in a DB .... CosmosDB
GraphRM
 
PDF
OrientDB graph e l'importanza di una relazione mancante
GraphRM
 
PDF
Elastic loves Graphs
GraphRM
 
PDF
From text to entities: Information Extraction in the Era of Knowledge Graphs
GraphRM
 
PPTX
Graph analysis over relational database
GraphRM
 
PDF
GraphRM - Introduzione al Graph modelling
GraphRM
 
PDF
GraphQL ♥︎ GraphDB
GraphRM
 
PDF
Costruiamo un motore di raccomandazione con Neo4J - Workshop 25/1/2018
GraphRM
 
A gentle introduction to random and strategic networks
GraphRM
 
How to leverage Kafka data streams with Neo4j
GraphRM
 
From zero to gremlin hero - Part I
GraphRM
 
Topology Visualization at Sysdig
GraphRM
 
Tecniche per la Visualizzazione di Grafi di Grandi Dimensioni Basate sulla Co...
GraphRM
 
aRangodb, un package per l'utilizzo di ArangoDB con R
GraphRM
 
The power of the cosmos in a DB .... CosmosDB
GraphRM
 
OrientDB graph e l'importanza di una relazione mancante
GraphRM
 
Elastic loves Graphs
GraphRM
 
From text to entities: Information Extraction in the Era of Knowledge Graphs
GraphRM
 
Graph analysis over relational database
GraphRM
 
GraphRM - Introduzione al Graph modelling
GraphRM
 
GraphQL ♥︎ GraphDB
GraphRM
 
Costruiamo un motore di raccomandazione con Neo4J - Workshop 25/1/2018
GraphRM
 

Il "Knowledge Graph" della Pubblica Amministrazione Italiana

  • 1. OntoPiA e il knowledge Graph della Pubblica Amministrazione Italiana Giorgia Lodi Meetup #AperiTech di GraphRM
  • 2. Data is a network “A single road only takes us to places between two locations; roads real value comes from being part of a network. Data works in the same way: it is not just having more data that unlocks its value, but linking it together. Data is not individual datasets, it is a network” 2
  • 3. Standard del Web Semantico 3 Href link non tipato) Risorse: Documenti Web HTML con link non tipati (href)
  • 4. Standard del Web Semantico 4 E se facessimo la stessa cosa con i dati? Href link non tipato) Risorse: Documenti Web HTML con link non tipati (href)
  • 6. Linked Open Data Cloud 6 28 giugno 2018
  • 7. Standard Web Semantico: RDF 7 •  Un modello per I dati nel web dove I dati sono espressi sottoforma di Triple •  Soggetto Predicato Oggetto •  Ogni entità è identificata univocamente da un URI (Uniform Resource Identifier) •  Il Soggetto e il Predicato hanno sempre un URI •  L’Oggetto può anche essere un valore predefinito (Literale) •  Le triple sono interconnesse quando condividono la stessa entità •  Il risultato è un grafo interconnesso di triple (Linked Data) dpedia:Rome dbpedia:Italy dbpedia:country foaf:homepage “Roma” http://www.italia.it/en/home.html Potete provare a navigare http://dbpedia.org/page/Rome
  • 8. Vantaggi dell’RDF •  E’ un modello di rappresentazione dei dati pensato per il Web •  E’ basato su standard del Web •  Consente nativamente di abilitare l’integrazione tra I dati •  Fornisce un meccanismo per risolvere l’identitià delle cose •  Nativamente fornisce meccanismi per garantire interoperabilità semantica •  E’ usato insieme al linguaggio per interrogare I dati (i.e., SPARQL) •  I dati sono così associati a delle API che facilitano l’interrogazione da parte delle macchine
  • 9. Ma non li usa nessuno!! 9
  • 10. Ma non li usa nessuno!! 10
  • 11. Ma non li usa nessuno!! 11
  • 12. Ma non li usa nessuno!! 12 Google knowledge graph
  • 13. Ma non li usa nessuno!! 13
  • 14. Da dove iniziare? Nel 2012 AgID pubblicava le linee guida per “Interoperabilità semantica attraverso I Linked Open Data”
  • 15. OntoPiA – la rete di ontologie e vocabolari controllati della Pubblica Amministrazione Meetup #AperiTech di GraphRM
  • 16. 16 Cos’è OntoPiA e a cosa serve •  Definisce un linguaggio comune per l’interscambio di dati (interoperabilità semantica) •  Definisce un modello formale, elaborabile da dispositivi digitali e leggibile da umani (i.e., superamento della logica delle specifiche scritte in soli file PDF!) •  Apre la strada alla creazione di dati nativamente collegati, i.e., fornisce gli schemi dati per creare, interrogare il “grafo della conoscenza” (knowledge graph) della PA italiana
  • 17. •  ONTOLOGIA: una specifica formale ed esplicita di rappresentazione (concettualizzazione) condivisa di un dominio di conoscenza, definita sulla base di requisiti specifici •  VOCABOLARIO CONTROLLATO: una serie di termini e codici standard predefiniti e autorizzati, preselezionati al fine di indicizzare e recuperare informazioni . 17 17 OntoPiA- rete di ontologie e vocabolari controllati
  • 18. 18 FACILITARE LO SVILUPPO DI NUOVI SISTEMI INFORMATIVI AGEVOLARE LO SCAMBIO DI DATI ABILITARE L’INTEGRAZIONE TRA DATI PROVENIENTI DA SORGENTI DIVERSE STANDARDIZZAZIONE DEI DATI (APERTI) OntoPiA – perché?
  • 19. 19 OntoPiA e i principi del modello FAIR •  Findable: si usano URI permanenti per identificare concetti e relazioni nella rete di ontologie e termini nei vocabolari controllati •  Accessible: si utilizzano protocolli standard aperti per l’accesso sul Web (i.e. HTTP(S)) and per l’interrogazione dei dati (i.e. SPARQL) •  Interoperable: si utilizzano protocolli standard aperti per modellare i dati i.e. RDF e OWL •  Reusable: tutte le ontologie e i vocabolari controllati sono pubblici, rilasciati secondo una licenza aperta (CC-BY 4.0) e sono collegati ad altre ontologie standard (de facto) disponibili nel Web dei Dati
  • 20. Più serializzazioni disponibili RDF/XML, RDF/turtle, JSON-LD URI in inglese e persistenti – uso di w3id.org https://w3id.org/italia/onto/… , https://w3id.org/italia/controlled-vocabulary/… https://w3id.org/italia/data/…. Riuso indiretto di ontologie esistenti Multilinguismo (etichette e descrizioni in ITA e ENG) Navigazione html delle ontologie e dei vocabolari e interrogazione via SPARQL http://ontopia.daf.teamdigitale.it/sparql o  Agile eXtreme Design, Ontology Design Pattern F A I R OntoPiA - Principi
  • 21. . 21 21 OntoPiA – Approccio tecnico in a nutshell Vocabolari controllati Ontologie Profilo Applicativo Italiano (AP_IT) Classe Proprietà Restrizione Concetto Ontologie e vocabolari controllati esterni del Web Semantico Allineamenti esterni (aligns) Componente Ontologia coinvoltaIn associataA importa closeMatch, exactMatch, relatedMatch, sameAs importa subClassOf, subPropertyOf, equivalent*
  • 25. . 25 25 L’attuale OntoPiA in numeri 25 ONTOLOGIE PUBBLICATE 1 IN FASE DI SVILUPPO 2 IN FASE DI REVISIONE 2 ONTOLOGIE PER METADATI 264 CLASSES 22 VOCABOLARI CONTROLLATI 1 MAPPING TRA DUE VOCABOLARI CONTROLLATI ~10800 AXIOMS
  • 26. 26 OntoPiA-UI Navigazione HTML via LODE (open source) Navigazione HTML via LodView (open source) Interrogazione machine-to-machine via SPARQL endpoint Visualizzazione grafica (WebOWL) https://github.com/italia/OntoPiA-UI
  • 28. •  COLLABORAZIONE CON CENTRI DI RICERCA STLab – Semantic Technologies Laboratory del CNR, Sapienza Università di Roma •  COLLABORAZIONE CON PUBBLICHE AMMINISTRAZIONI e.g.,ISTAT, MIBAC, Regione Piemonte, ANAC, Comuni di Palermo e Udine, Provincia Autonoma di Trento •  COINVOLGIMENTO DEGLI UTENTI FINALI Disponibile su Github: chiunque può SEMPRE commentare e/o proporre cambiamenti e correzioni https://github.com/italia/daf-ontologie-vocabolari-controllati . 28 28 OntoPiA- coinvolgimento PA e utenti
  • 29. OntoNetHub •  Un’applicazione web implementata per la gestione della rete di ontologie •  Consente operazione di caricamento, cancellazione e indicizzazione degli elementi delle ontologie della rete •  Progettata come estensione di Apache Stanbol e rilasciata come container Docker https://github.com/teamdigitale/ontonethub
  • 30. OntoPiA – chi la usa •  DAF - Catalogo ontologie e vocabolari controllati •  DAF semantic tagging •  Harvesting di metadati •  Alcuni interessanti riusi da PA e Aziende 30
  • 31. DAF – Data & Analytics Framework Meetup #AperiTech di GraphRM
  • 32. DAF – Data & Analytics Framework •  Sistema legale •  presupposti normativi alle attività di valorizzazione del patrimonio informativo pubblico, preservando la privacy •  Gruppo di specialisti (data scientist + data engineer) •  disegna la strategia, usa ed evolve la piattaforma •  analizza i dati, creando storie e data application •  supporta le PA •  Piattaforma Nazionale Digitale dei Dati •  conserva, integra e standardizza i dati delle PA •  Implementa meccanismi di apprendimento automatico •  Redistribuisce dati (API) e li visualizza (portale dei dati)
  • 33. Data & Analytics Framework https://dataportal.daf.teamdigitale.it/
  • 34. 34 34 OntoPiA – Catalogo versione Alpha
  • 35. 35 35 Federazione di cataloghi usando OntoPiA 35 Ministero Beni e Attività culturali http://dati.beniculturali.it/ Regione Toscana – piattaforma CKAN http://dati.toscana.it/catalog.rdf Comune di Palermo – piattaforma proprietaria https://opendata.comune.palermo.it/ dcat/dcat.php DCAT-AP_IT – estensione per CKAN implementata sull’ontologia di metadatazione di OntoPiA Uso del vocabolario controllato delle licenze DAF
  • 36. Creare il knowledge graph dal DAF – Data & Analytics Framework Meetup #AperiTech di GraphRM
  • 37. Gestione flusso per triplificazione 37
  • 38. Script R2RML E’ nostra intenzione pubblicare i mapping presumibilmente nel repo delle ontologie
  • 39. Gestione Flusso per triplificazione 39
  • 40. Gestione Flusso per triplificazione 40
  • 41. Gestione Flusso per triplificazione 41
  • 42. Primi risultati preliminari •  Linked Open Data dell’archivio storico dei comuni utilizzando 3 dataset •  Tabella dei Comuni ANPR (storico) – file principale •  Dataset degli ultimi Comuni d’Italia di ISTAT •  Dataset dell’archivio storico dei Comuni Il dataset finale è modellato secondo l’ontologia CLV-AP_IT (Core Location Vocabulary – Italian Application Profile) •  Linked Open Data preliminari dell’Indice della Pubblica Amministrazione •  Il Dataset è collegato al precedente Il dataset è modellato secondo l’ontologia COV-AP_IT (Core Organization Vocabulary – Italian Application Profile) Non ancora pubblicati nello SPARQL endpoint - nelle prossime settimane
  • 43. 43 43 Attuali e futuri lavori SVILUPPO ONTOLOGIE Stabilizzazione di alcune ontologie Definizione di nuove sulla base degli ecosistemi del piano triennale Definizione della documentazione online PRODUZIONE E PUBBLICAZIONE DEI LINKED (OPEN) DATA Produzione di altri Linked Open Data per estendere l’attuale knowledge graph SVILUPPO CATALOGO ONTOLOGIE Abilitare la ricerca generale e per singoli elementi delle ontologie, in quest’ultimo caso via indicizzatore già disponibile OntonetHub
  • 44. Grazie per l’attenzione! Meetup #AperiTech di GraphRM