Web sémantiqueetmoteurs de recherchehttp://www.antidot.netJérôme MainkaSemWeb.pro17 janvier 2011
AntidotCœur de métier Solution de recherche et d’accès à l’informationCompétencesEditeur, hébergeur, conseil et intégrateurFiche d’identité  Création en 1999
 Implantation : Paris, Lyon, Aix en Provence
 Forte croissance 13eme croissance française  au classementSolutionsAFS : moteur de recherche
CKS : services collaboratifsQuelques référencesMédiaEntrepriseseCommerceInstitutionsSanté
Moteur de rechercheRecherche plein-texte vs recherche structurée
Recherche plein textePlus que faire correspondre des octets
Synonymiecar@enVoitureBagnolechar@fr_CA
Moteurs de recherche et web sémantique
Hyponymie / Méronymie
Moteurs de recherche et web sémantique
Méronymie/Holonymie
Moteurs de recherche et web sémantique
Vocabulaire SKOSDes concepts : classe skos:ConceptDes relations sémantiques :skos:broader, narrowerskos:exactMatch, closeMatchDes libellésskos:prefLabel, altLabel, hiddenLabel
SémantiqueLorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. skos:broaderTransitiveskos:narrowerskos:narrowerskos:broaderskos:broaderskos:prefLabelskos:altLabelskos:prefLabelskos:altLabelskos:prefLabelskos:altLabelLorem ipsum
InférenceIl ne s’agit évidemment pas d’apprendre par cœur les propriétés sémantiques du vocabulaire : rdfs, owl est suffisant pour l’essentiel.Exemple :skos:broader rdfs:subPropertyOf skos:broaderTransitive .skos:broaderTransitive a owl:TransitiveProperty .skos:narrower owl:inverseOf skos:broader .
Clés du succèsLes libellés peuvent être soumis à des normalisations :"voyages" = "voyage""Mainka" = "MNK""Mainka" = "aiinkamank »Indexation / Requête = offline / onlineStructure de stockagem taille du référentieln taille du texte à indexer :Indexation en O(n log m)
Recherche structurée
Description des facettes<PériodeHistorique> a skos:OrderedCollection ;   skos:memberList ( <ÉpoqueContemporaine>                     <ÉpoqueModerne>                     <MoyenÂge> ) .<Discipline> a skos:Collection ;   skos:member <AnthropologieBiologique> ,               <Démographie> ,               <Droit> .<Facets> a skos:OrderedCollection ;    skos:memberList ( <PériodeHistorique>                      <Discipline> ) .
Ontologies du domaineOntologies de navigationOntologies du domaine pas forcément adaptées à une interface de navigationNécessité de transformer les ontologies du domaine pour les faire correspondre aux besoins de la navigation.Prise en compte de besoins utilisateurs / besoins métiers.2 approches :Formules N3 : { ?doc <published> 2001 . } => { ?doc afs:subject <p2001> . } .SPARQL :CONSTRUCT { ?doc afs:subject <p2001> . } WHERE { ?doc <published> 2001 . }
AnnotationsÀ partir de règlesÀ partir du contenu plein texte (extraction d’entités, classification automatique)Inférence { ?doc afs:subject [    skos:broaderTransitive ?c2 .   ] . }=> { ?doc afs:subject ?c2 . } . Une facette est une annotation particulière
AffichageTriOrderedCollectionTri alphabétiqueTri par comptageGestion des données de grandes taillesPaging des valeurs de facettesSupport des opérateurs AND, OR, NOT.
Un modèle de document unifié ?Pour mettre en place un service de recherche :Structures mollesConcepts simples: Annotations, Facettes, Titre, URL, Plein texte, etc.Format pivot RDFMapping des documents via une chaîne de traitements élémentaires : AFS-PaF (Pipes & Filters)
  Créer des chaînes de traitement par   assemblage de modulesSources de donnéesModule connecteurModules de transformation et enrichissement
Les données et enrichissements sont exportés en RDF en bout de chaine
Les triplets générés sont exploitéspour retour vers les sources sous forme normaliséepour traiter des requêtes complexespour une exposition dans le Web de donnéesGénérationChargement de l’entrepôtEntrepôt RDFFichiers de tripletsCorpus
AFS et SPARQL sont des Web Service techniques

Contenu connexe

PPT
Isidore à l'interface de la rencontre des SHS et du Web de données
PPTX
Améliorez le taux de transformation de votre site marchand avec AFS@Store !
PPTX
Web sémantique
PDF
L’apport du Web sémantique à la recherche d’informations
ODP
Introduction au Web sémantique
PDF
Introduction au web sémantique
PPT
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
PPT
RDF en quelques slides
Isidore à l'interface de la rencontre des SHS et du Web de données
Améliorez le taux de transformation de votre site marchand avec AFS@Store !
Web sémantique
L’apport du Web sémantique à la recherche d’informations
Introduction au Web sémantique
Introduction au web sémantique
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
RDF en quelques slides

Tendances (20)

PDF
Découvrir le web sémantique en 15 minutes (Decideo 2014)
PPT
A la découverte du Web sémantique
PDF
Web sémantique
PPT
Le Web de données et les bibliothèques
PPTX
Web Sémantique — Linked Data
PPT
Échange et interopérabilité des données structurées sur le Web
PDF
Introduction au web sémantique : quand le lient fait sens
PPTX
Les ontologies et les graphes RDF
PDF
Présentation du navigateur datao
PDF
Introduction au web des données (Linked Data)
PPT
Metadonnees -- une typologie
PPT
Découverte du SPARQL endpoint de HAL
PDF
Données liées et Web sémantique : quand le lien fait sens.
PDF
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
PDF
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
PPTX
Documation 2011 : de la recherche fédérée à l'accès unifié
PPTX
Open data & linked data
PPT
Applications du Web Sémantique
PPTX
Le Web sémantique ? Kézako ?!!
Découvrir le web sémantique en 15 minutes (Decideo 2014)
A la découverte du Web sémantique
Web sémantique
Le Web de données et les bibliothèques
Web Sémantique — Linked Data
Échange et interopérabilité des données structurées sur le Web
Introduction au web sémantique : quand le lient fait sens
Les ontologies et les graphes RDF
Présentation du navigateur datao
Introduction au web des données (Linked Data)
Metadonnees -- une typologie
Découverte du SPARQL endpoint de HAL
Données liées et Web sémantique : quand le lien fait sens.
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Documation 2011 : de la recherche fédérée à l'accès unifié
Open data & linked data
Applications du Web Sémantique
Le Web sémantique ? Kézako ?!!
Publicité

En vedette (20)

PDF
Les moteurs de recherche sémantique
PDF
HCFDC Noam Chomsky is wrong. At last. Thanks to the internets.
PPTX
High Tech Farming
PDF
HCFDC Internet, la petite fabrique du social et du renouveau des confrontations
PDF
Keynote BDX i/o
PPTX
Les moteurs de recherche pour Drupal
PDF
nouvelles formes d'interactions dans les réseaux sociaux v2
PDF
Présentation open graph_chartee_v2_lille_def
PDF
La Librairie royale sous Charles V et Charles VI : reconstitution et survie d...
PDF
L'annotation socio-sémantique pour une analyse de réseaux
PPTX
Web Sémantique et Web Social
PDF
Portabilité des Réseaux Sociaux et des Contenus avec le Web Sémantique
PDF
Le web sémantique par l'exemple
PPT
Histoire d’internet et du web : d’Arpanet au web sémantique
PPT
Facebook Open Graph API
PPTX
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
PDF
Ignite Paris 2 : Le web sémantique en Français
PDF
Ethique et numerique
PDF
LGP oct '14
PPTX
Application Web sémantique sur des manuscrits médiévaux - Retour d'expérience
Les moteurs de recherche sémantique
HCFDC Noam Chomsky is wrong. At last. Thanks to the internets.
High Tech Farming
HCFDC Internet, la petite fabrique du social et du renouveau des confrontations
Keynote BDX i/o
Les moteurs de recherche pour Drupal
nouvelles formes d'interactions dans les réseaux sociaux v2
Présentation open graph_chartee_v2_lille_def
La Librairie royale sous Charles V et Charles VI : reconstitution et survie d...
L'annotation socio-sémantique pour une analyse de réseaux
Web Sémantique et Web Social
Portabilité des Réseaux Sociaux et des Contenus avec le Web Sémantique
Le web sémantique par l'exemple
Histoire d’internet et du web : d’Arpanet au web sémantique
Facebook Open Graph API
Reseaux sociaux professionnels- Curation de contenu - Scoop.it, Storify, Pape...
Ignite Paris 2 : Le web sémantique en Français
Ethique et numerique
LGP oct '14
Application Web sémantique sur des manuscrits médiévaux - Retour d'expérience
Publicité

Similaire à Moteurs de recherche et web sémantique (20)

PPT
03 Web Semantique
PPT
Les professionnels de l'information face aux défis du Web de données
PDF
SPARQL-Generate, présentation SemWeb.Pro 2019
PPT
Metadonnees et SID
PPTX
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
PDF
Modèles de données et langages de description ouverts 5 - 2021-2022
PDF
Introduction à la fouille de textes et positionnement de l'offre logicielle
PPT
7. information modelling
PPTX
Métadonnées de thèse
PPT
Notion opérationnelle de compétence - référencement sémantique et assisance a...
PPTX
Semantic Information Systems
PPTX
Semantic Information Systems
PPTX
Semantic Information Systems
PPT
Le web sémantique n'est pas antisocial (version de 2006)
PPT
Navigation et Recherche pour les sites E-Commerce
PPT
Semantic web introduction
PPTX
Outils Web Sémantique
PPTX
Les technologies TAL et le futur du SEO
PPTX
Sudoc, Calames, theses.fr et le Web de données
PPTX
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
03 Web Semantique
Les professionnels de l'information face aux défis du Web de données
SPARQL-Generate, présentation SemWeb.Pro 2019
Metadonnees et SID
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Modèles de données et langages de description ouverts 5 - 2021-2022
Introduction à la fouille de textes et positionnement de l'offre logicielle
7. information modelling
Métadonnées de thèse
Notion opérationnelle de compétence - référencement sémantique et assisance a...
Semantic Information Systems
Semantic Information Systems
Semantic Information Systems
Le web sémantique n'est pas antisocial (version de 2006)
Navigation et Recherche pour les sites E-Commerce
Semantic web introduction
Outils Web Sémantique
Les technologies TAL et le futur du SEO
Sudoc, Calames, theses.fr et le Web de données
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...

Plus de Antidot (20)

PPTX
Comment l'intelligence artificielle améliore la recherche documentaire
PPTX
Antidot Content Classifier - Valorisez vos contenus
PPTX
Comment l’intelligence artificielle réinvente la fouille de texte
PDF
Antidot Content Classifier
PDF
Cas client CAIJ
PPTX
Du Big Data à la Smart Information : comment valoriser les actifs information...
PDF
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
PPTX
Web sémantique et Web de données, et si on passait à la pratique ?
PPTX
Machine learning, deep learning et search : à quand ces innovations dans nos ...
PDF
Flyer AFS@Store 2015 FR
PDF
WISS 2015 - Machine Learning lecture by Ludovic Samper
PPTX
Do’s and don'ts : la recherche interne aux sites de ecommerce
PPTX
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
PPTX
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
PPTX
En 2015, quelles sont les bonnes pratiques du searchandising ?
PPTX
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
PPT
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
PPTX
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
PPTX
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
PPTX
Comment sélectionner, qualifier puis exploiter les données ouvertes
Comment l'intelligence artificielle améliore la recherche documentaire
Antidot Content Classifier - Valorisez vos contenus
Comment l’intelligence artificielle réinvente la fouille de texte
Antidot Content Classifier
Cas client CAIJ
Du Big Data à la Smart Information : comment valoriser les actifs information...
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Web sémantique et Web de données, et si on passait à la pratique ?
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Flyer AFS@Store 2015 FR
WISS 2015 - Machine Learning lecture by Ludovic Samper
Do’s and don'ts : la recherche interne aux sites de ecommerce
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
En 2015, quelles sont les bonnes pratiques du searchandising ?
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Comment sélectionner, qualifier puis exploiter les données ouvertes

Dernier (9)

PDF
Gestion des stocks et inventaire, SCM510 Col15
PDF
Gestion de la main-d’œuvre dans SAP Extended Warehouse Management, EWM125 Col26
PDF
Cours du langage HTML depuis initiation à la maîtrise
PDF
Personnalisation de rubriques supplémentaires dans SAP Extended Warehouse Man...
PPTX
843555943-Introduction-a-l-Intelligence-Artificielle.pptx
PDF
1.3.4-Handling-and-Safety-Instructions-FR-2024.pdf
PPTX
Pourquoi j'ai arrêté Magento : neuf ans de transitions technologiques
PDF
Utilisation de la gestion des ressources dans SAP Extended Warehouse Manageme...
PDF
SHAKA 2025 - Création d'Images en IA : Mode Expert Activé
Gestion des stocks et inventaire, SCM510 Col15
Gestion de la main-d’œuvre dans SAP Extended Warehouse Management, EWM125 Col26
Cours du langage HTML depuis initiation à la maîtrise
Personnalisation de rubriques supplémentaires dans SAP Extended Warehouse Man...
843555943-Introduction-a-l-Intelligence-Artificielle.pptx
1.3.4-Handling-and-Safety-Instructions-FR-2024.pdf
Pourquoi j'ai arrêté Magento : neuf ans de transitions technologiques
Utilisation de la gestion des ressources dans SAP Extended Warehouse Manageme...
SHAKA 2025 - Création d'Images en IA : Mode Expert Activé

Moteurs de recherche et web sémantique

  • 1. Web sémantiqueetmoteurs de recherchehttp://www.antidot.netJérôme MainkaSemWeb.pro17 janvier 2011
  • 2. AntidotCœur de métier Solution de recherche et d’accès à l’informationCompétencesEditeur, hébergeur, conseil et intégrateurFiche d’identité Création en 1999
  • 3. Implantation : Paris, Lyon, Aix en Provence
  • 4. Forte croissance 13eme croissance française au classementSolutionsAFS : moteur de recherche
  • 5. CKS : services collaboratifsQuelques référencesMédiaEntrepriseseCommerceInstitutionsSanté
  • 6. Moteur de rechercheRecherche plein-texte vs recherche structurée
  • 7. Recherche plein textePlus que faire correspondre des octets
  • 14. Vocabulaire SKOSDes concepts : classe skos:ConceptDes relations sémantiques :skos:broader, narrowerskos:exactMatch, closeMatchDes libellésskos:prefLabel, altLabel, hiddenLabel
  • 15. SémantiqueLorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. skos:broaderTransitiveskos:narrowerskos:narrowerskos:broaderskos:broaderskos:prefLabelskos:altLabelskos:prefLabelskos:altLabelskos:prefLabelskos:altLabelLorem ipsum
  • 16. InférenceIl ne s’agit évidemment pas d’apprendre par cœur les propriétés sémantiques du vocabulaire : rdfs, owl est suffisant pour l’essentiel.Exemple :skos:broader rdfs:subPropertyOf skos:broaderTransitive .skos:broaderTransitive a owl:TransitiveProperty .skos:narrower owl:inverseOf skos:broader .
  • 17. Clés du succèsLes libellés peuvent être soumis à des normalisations :"voyages" = "voyage""Mainka" = "MNK""Mainka" = "aiinkamank »Indexation / Requête = offline / onlineStructure de stockagem taille du référentieln taille du texte à indexer :Indexation en O(n log m)
  • 19. Description des facettes<PériodeHistorique> a skos:OrderedCollection ; skos:memberList ( <ÉpoqueContemporaine> <ÉpoqueModerne> <MoyenÂge> ) .<Discipline> a skos:Collection ; skos:member <AnthropologieBiologique> , <Démographie> , <Droit> .<Facets> a skos:OrderedCollection ; skos:memberList ( <PériodeHistorique> <Discipline> ) .
  • 20. Ontologies du domaineOntologies de navigationOntologies du domaine pas forcément adaptées à une interface de navigationNécessité de transformer les ontologies du domaine pour les faire correspondre aux besoins de la navigation.Prise en compte de besoins utilisateurs / besoins métiers.2 approches :Formules N3 : { ?doc <published> 2001 . } => { ?doc afs:subject <p2001> . } .SPARQL :CONSTRUCT { ?doc afs:subject <p2001> . } WHERE { ?doc <published> 2001 . }
  • 21. AnnotationsÀ partir de règlesÀ partir du contenu plein texte (extraction d’entités, classification automatique)Inférence { ?doc afs:subject [ skos:broaderTransitive ?c2 . ] . }=> { ?doc afs:subject ?c2 . } . Une facette est une annotation particulière
  • 22. AffichageTriOrderedCollectionTri alphabétiqueTri par comptageGestion des données de grandes taillesPaging des valeurs de facettesSupport des opérateurs AND, OR, NOT.
  • 23. Un modèle de document unifié ?Pour mettre en place un service de recherche :Structures mollesConcepts simples: Annotations, Facettes, Titre, URL, Plein texte, etc.Format pivot RDFMapping des documents via une chaîne de traitements élémentaires : AFS-PaF (Pipes & Filters)
  • 24. Créer des chaînes de traitement par assemblage de modulesSources de donnéesModule connecteurModules de transformation et enrichissement
  • 25. Les données et enrichissements sont exportés en RDF en bout de chaine
  • 26. Les triplets générés sont exploitéspour retour vers les sources sous forme normaliséepour traiter des requêtes complexespour une exposition dans le Web de donnéesGénérationChargement de l’entrepôtEntrepôt RDFFichiers de tripletsCorpus
  • 27. AFS et SPARQL sont des Web Service techniques
  • 28. Ils sont enrobés dans une couche métierun Web Service applicatif qui permet la négociation de contenuDescription XMLDescription RDFDocument
  • 29. Le documentest compositeest dynamiqueévolue dans le tempsest un objet à gérerà accéder de façonunifiée
  • 31. ConclusionLe Web sémantique : ça sert (ça marche, c’est « simple »)Rester modeste :ObjectifsStratégieMise en œuvrePlein de sujets d’évolutionExtraction de conceptsAlignement automatique d’ontologies