Téléchargé parCore-Techs

PPTX, PDF2,702 vues

Les moteurs de recherche pour Drupal

Le document présente divers moteurs de recherche compatibles avec Drupal, notamment le moteur de recherche de base, Solr et Elastic, en mettant en avant leurs performances, pertinence et évolutivité. Des optimisations linguistiques et statistiques sont également discutées pour améliorer la recherche, ainsi que des options spécifiques offertes par des moteurs propriétaires pour des besoins particuliers. Enfin, il aborde les capacités de recherche géospatiale et le multilinguisme, soulignant les avantages de chaque solution.

Le meilleur moteur
de recherche pour
Drupal
CORE-TECHSPar

OBESITE DE
L’INFORMATION

Visuel Big Data
BIG DATA

HETEROGENEÏTE
DES SOLUTIONS

UN MOTEUR CA FAIT
QUOI ?

Indexe Restitue
Expose

1. Le moteur basique de Drupal…
8/12CORE-TECHS

PERFORMANCES !

PERTINENCE !

EVOLUTIVITE !

2. SolR : le moteur historique
14/12
CORE-TECHS

16/12
CORE-TECHS
Vidéo Témoignage pourquoi SolR

Optimisations de pertinence avec SOLR
17/12
CORE-TECHS
Optimisations
linguistiques
• Racinisation
• Synonymie
• Stop words
• Orthographe
Optimisations
statistiques
• Scoring et
pondération
• Text mining
• Proximité

Suggestions d’après le corpus
18/12
CORE-TECHS

Highlight des résultats
19/12
CORE-TECHS

Moteur de recommandation
20/12
CORE-TECHS

Recherche géospatiale
21/12
CORE-TECHS

Multisite
22/12
CORE-TECHS

Variabilité des facettes
23/12
CORE-TECHS
• Facettes de valeurs
• Facettes de date
• Facette par arbre / pivot
• Facette par intervalle
• Facette par catégorie / type

Multilinguisme
24/12
CORE-TECHS

3. Elastic : la solution qui monte !
25/12
CORE-TECHS

Video témoignage pourquoi Elastic
26/12
CORE-TECHS

Drupal avec Elastic
27/12
CORE-TECHS

Schéma évolutif et scalable
28/12
CORE-TECHS

Clustering natif et simplement paramétrable
29/12
CORE-TECHS

Implémentation simplifiée
30/12
CORE-TECHS

Paramétrage du scoring
31/12
CORE-TECHS

Gestion plus efficace des aggregations
32/12
CORE-TECHS
• Facettes par distance géographique
• Facettes métriques multiples : moyennes, maximum, sommes, …
• Agrégation de filtres
• Facettes de données manquantes
• Facettes imbriquées
• Facettes par agrégation de termes signifiants
• …

Des performances assez comparables
33/12
CORE-TECHS

Des performances assez comparables
34/12
CORE-TECHS
Temps de recherche http://www.flax.co.uk/

Des performances assez comparables
35/12
CORE-TECHS
Requêtes par seconde http://www.flax.co.uk/

Battle result
36/12
CORE-TECHS
SolR
• Esprit OS ++
• Orienté vers
la recherche
texte
Elastic
• Simplicité,
efficacité
• Efficacité
dans
l’analyse
quantitative

4. Et les moteurs propriétaires ?
37/12
CORE-TECHS

Vidéo témoignage – Pourquoi un moteur propriétaire
38/12
CORE-TECHS

Des réponses fonctionnelles à des besoins particuliers
43/12
CORE-TECHS
• Mises en avant,
• Cross-content,
• Combinaison d’expressions,
• Gestion de campagnes promotionnelles,
• Alertes et agents de veille
• Réponses spécifiques pour des besoins d’ecommerce, (ou autre)
• Outils de sauvegarde & restauration,

Des réponses au Web sémantique
44/12
CORE-TECHS
• Outils de travail pour aligner les données
• Structuration RDF & URI
• Sparql End Point
• Intégration de thésaurus et d’ontologies
• …

MERCI
45
tw itt er : @ drupagora

Recommandé

PPTX

[ Pycon Korea 2017 ] Infrastructure as Code를위한 Ansible 활용

parJihyung Song

PDF

Docker Basics

parEueung Mulyana

PDF

Introduction à docker.io

parNicolas Hennion

PDF

Banco de Dados I Aula 02 - Introdução aos Bancos de Dados

parLeinylson Fontinele

PDF

Alphorm.com Formation Kubernetes : Installation et Configuration

PPTX

Programacion en N-capas

parVicente Alberca

PDF

Banco de Dados II Aula 01 - Apresentação

parLeinylson Fontinele

PDF

ApacheSolr presentation from "Do it With Drupal"

parRobert Douglass

PPT

Moteurs de recherche : sortir de Google

PPTX

Moteurs de recherche et web sémantique

PDF

L’apport du Web sémantique à la recherche d’informations

PPTX

Cours4.5 opérateurs recherche

parEvelyne Brémond

PDF

Alphorm.com support de la formation Drupal 8 webmaster configurateur

PPSX

Initiation la rechercher sur le web

parMEMOIRE PATRIMOINE CLOHARS CARNOET

PPTX

Cours4.4 google

parEvelyne Brémond

PPTX

Cours4.1 recherche documentaire-outils

parEvelyne Brémond

PPTX

Cours4.2 recherche documentaire-mots-cles

parEvelyne Brémond

PDF

Guide Yahoo! du bon usage du Mail

parChristophe Pelletier

PPT

The Interpretation Of Quartiles And Percentiles July 2009

parMaggie Verster

PDF

Trucs & astuces drupal

PDF

Solution de recherche Drupal

PDF

Content marketing : l'importance du contenu 2

PPTX

Le clés d'une stratégie éditoriale réussie

PDF

Les moteurs de recherche sémantique

parSylvain Gateau

PDF

Vendretips - Optimisez son utilisation des moteurs de recherche

parClémence Bertrand-Jaume

PDF

Create - Decoupled CMS interface

parHenri Bergius

PDF

Navigation à facettes et SEO

PDF

SEO Trends 2017 - Web Marketing

parAmine Benbya

PDF

Quelle solution technique pour un projet web ?

PPTX

Drupal Ecommerce - fonctionnalités et atouts

Contenu connexe

PPTX

[ Pycon Korea 2017 ] Infrastructure as Code를위한 Ansible 활용

parJihyung Song

PDF

Docker Basics

parEueung Mulyana

PDF

Introduction à docker.io

parNicolas Hennion

PDF

Banco de Dados I Aula 02 - Introdução aos Bancos de Dados

parLeinylson Fontinele

PDF

Alphorm.com Formation Kubernetes : Installation et Configuration

PPTX

Programacion en N-capas

parVicente Alberca

PDF

Banco de Dados II Aula 01 - Apresentação

parLeinylson Fontinele

PDF

ApacheSolr presentation from "Do it With Drupal"

parRobert Douglass

[ Pycon Korea 2017 ] Infrastructure as Code를위한 Ansible 활용

parJihyung Song

Docker Basics

parEueung Mulyana

Introduction à docker.io

parNicolas Hennion

Banco de Dados I Aula 02 - Introdução aos Bancos de Dados

parLeinylson Fontinele

Alphorm.com Formation Kubernetes : Installation et Configuration

Programacion en N-capas

parVicente Alberca

Banco de Dados II Aula 01 - Apresentação

parLeinylson Fontinele

ApacheSolr presentation from "Do it With Drupal"

parRobert Douglass

En vedette

PPT

Moteurs de recherche : sortir de Google

PPTX

Moteurs de recherche et web sémantique

PDF

L’apport du Web sémantique à la recherche d’informations

PPTX

Cours4.5 opérateurs recherche

parEvelyne Brémond

PDF

Alphorm.com support de la formation Drupal 8 webmaster configurateur

PPSX

Initiation la rechercher sur le web

parMEMOIRE PATRIMOINE CLOHARS CARNOET

PPTX

Cours4.4 google

parEvelyne Brémond

PPTX

Cours4.1 recherche documentaire-outils

parEvelyne Brémond

PPTX

Cours4.2 recherche documentaire-mots-cles

parEvelyne Brémond

PDF

Guide Yahoo! du bon usage du Mail

parChristophe Pelletier

PPT

The Interpretation Of Quartiles And Percentiles July 2009

parMaggie Verster

PDF

Trucs & astuces drupal

PDF

Solution de recherche Drupal

PDF

Content marketing : l'importance du contenu 2

PPTX

Le clés d'une stratégie éditoriale réussie

PDF

Les moteurs de recherche sémantique

parSylvain Gateau

PDF

Vendretips - Optimisez son utilisation des moteurs de recherche

parClémence Bertrand-Jaume

PDF

Create - Decoupled CMS interface

parHenri Bergius

PDF

Navigation à facettes et SEO

PDF

SEO Trends 2017 - Web Marketing

parAmine Benbya

Moteurs de recherche : sortir de Google

Moteurs de recherche et web sémantique

L’apport du Web sémantique à la recherche d’informations

Cours4.5 opérateurs recherche

parEvelyne Brémond

Alphorm.com support de la formation Drupal 8 webmaster configurateur

Initiation la rechercher sur le web

parMEMOIRE PATRIMOINE CLOHARS CARNOET

Cours4.4 google

parEvelyne Brémond

Cours4.1 recherche documentaire-outils

parEvelyne Brémond

Cours4.2 recherche documentaire-mots-cles

parEvelyne Brémond

Guide Yahoo! du bon usage du Mail

parChristophe Pelletier

The Interpretation Of Quartiles And Percentiles July 2009

parMaggie Verster

Trucs & astuces drupal

Solution de recherche Drupal

Content marketing : l'importance du contenu 2

Le clés d'une stratégie éditoriale réussie

Les moteurs de recherche sémantique

parSylvain Gateau

Vendretips - Optimisez son utilisation des moteurs de recherche

parClémence Bertrand-Jaume

Create - Decoupled CMS interface

parHenri Bergius

Navigation à facettes et SEO

SEO Trends 2017 - Web Marketing

parAmine Benbya

Plus de Core-Techs

PDF

Quelle solution technique pour un projet web ?

PPTX

Drupal Ecommerce - fonctionnalités et atouts

PPTX

Webinar : Les enjeux du moteur de recherche

PDF

Drupagora 2012 - Votre application cartographique avec Drupal

PPTX

Drupagora - Les clés de la réussite d'un projet Drupal

PPTX

Drupagora 2014 : Reprendre un projet avec Drupal quand on a des centaines de...

PDF

Retour d'experience sur drupal 8

PPTX

10 méthodes UX appliquées à votre projet Web

PPTX

Introduction à Drupal 8

PPTX

Démonstration Drupal Commons !

PDF

Keynote drupagora 2015 7

PPTX

Cahier des charges avril 2015

PPTX

Les 10 erreurs d'un projet web déc 2014

PPT

Cms ecosystème etat des lieux et tendances

PPTX

Usine à site

PDF

Drupal Commerce / Wordpress Commerce - Les nouvelles alternatives...

PDF

Reprise projet Drupal Drupagora2013

PPTX

Conférence Gestion de projet digital

PDF

Wordpress Ecommerce - Core-Techs

PDF

3 Outils et Méthodes pour faire le bon choix de votre solution Ecommerce

Quelle solution technique pour un projet web ?

Drupal Ecommerce - fonctionnalités et atouts

Webinar : Les enjeux du moteur de recherche

Drupagora 2012 - Votre application cartographique avec Drupal

Drupagora - Les clés de la réussite d'un projet Drupal

Drupagora 2014 : Reprendre un projet avec Drupal quand on a des centaines de...

Retour d'experience sur drupal 8

10 méthodes UX appliquées à votre projet Web

Introduction à Drupal 8

Démonstration Drupal Commons !

Keynote drupagora 2015 7

Cahier des charges avril 2015

Les 10 erreurs d'un projet web déc 2014

Cms ecosystème etat des lieux et tendances

Usine à site

Drupal Commerce / Wordpress Commerce - Les nouvelles alternatives...

Reprise projet Drupal Drupagora2013

Conférence Gestion de projet digital

Wordpress Ecommerce - Core-Techs

3 Outils et Méthodes pour faire le bon choix de votre solution Ecommerce

Les moteurs de recherche pour Drupal

1.
Le meilleur moteur derecherche pour Drupal CORE-TECHSPar
2.
OBESITE DE L’INFORMATION
3.
Visuel Big Data BIGDATA
4.
HETEROGENEÏTE DES SOLUTIONS
6.
UN MOTEUR CAFAIT QUOI ?
7.
Indexe Restitue Expose
8.
1. Le moteurbasique de Drupal… 8/12CORE-TECHS
11.
PERFORMANCES !
12.
PERTINENCE !
13.
EVOLUTIVITE !
14.
2. SolR :le moteur historique 14/12 CORE-TECHS
16.
16/12 CORE-TECHS Vidéo Témoignage pourquoiSolR
17.
Optimisations de pertinenceavec SOLR 17/12 CORE-TECHS Optimisations linguistiques • Racinisation • Synonymie • Stop words • Orthographe Optimisations statistiques • Scoring et pondération • Text mining • Proximité
18.
Suggestions d’après lecorpus 18/12 CORE-TECHS
19.
Highlight des résultats 19/12 CORE-TECHS
20.
Moteur de recommandation 20/12 CORE-TECHS
21.
Recherche géospatiale 21/12 CORE-TECHS
22.
Multisite 22/12 CORE-TECHS
23.
Variabilité des facettes 23/12 CORE-TECHS •Facettes de valeurs • Facettes de date • Facette par arbre / pivot • Facette par intervalle • Facette par catégorie / type
24.
Multilinguisme 24/12 CORE-TECHS
25.
3. Elastic :la solution qui monte ! 25/12 CORE-TECHS
26.
Video témoignage pourquoiElastic 26/12 CORE-TECHS
27.
Drupal avec Elastic 27/12 CORE-TECHS
28.
Schéma évolutif etscalable 28/12 CORE-TECHS
29.
Clustering natif etsimplement paramétrable 29/12 CORE-TECHS
30.
Implémentation simplifiée 30/12 CORE-TECHS
31.
Paramétrage du scoring 31/12 CORE-TECHS
32.
Gestion plus efficacedes aggregations 32/12 CORE-TECHS • Facettes par distance géographique • Facettes métriques multiples : moyennes, maximum, sommes, … • Agrégation de filtres • Facettes de données manquantes • Facettes imbriquées • Facettes par agrégation de termes signifiants • …
33.
Des performances assezcomparables 33/12 CORE-TECHS
34.
Des performances assezcomparables 34/12 CORE-TECHS Temps de recherche http://www.flax.co.uk/
35.
Des performances assezcomparables 35/12 CORE-TECHS Requêtes par seconde http://www.flax.co.uk/
36.
Battle result 36/12 CORE-TECHS SolR • EspritOS ++ • Orienté vers la recherche texte Elastic • Simplicité, efficacité • Efficacité dans l’analyse quantitative
37.
4. Et lesmoteurs propriétaires ? 37/12 CORE-TECHS
38.
Vidéo témoignage –Pourquoi un moteur propriétaire 38/12 CORE-TECHS
43.
Des réponses fonctionnellesà des besoins particuliers 43/12 CORE-TECHS • Mises en avant, • Cross-content, • Combinaison d’expressions, • Gestion de campagnes promotionnelles, • Alertes et agents de veille • Réponses spécifiques pour des besoins d’ecommerce, (ou autre) • Outils de sauvegarde & restauration,
44.
Des réponses auWeb sémantique 44/12 CORE-TECHS • Outils de travail pour aligner les données • Structuration RDF & URI • Sparql End Point • Intégration de thésaurus et d’ontologies • …
45.
MERCI 45 tw itt er: @ drupagora

Notes de l'éditeur

#3 Obésite de l’information
#5 Hétérogénéïté technique : bases de données, fichiers, noSQL, RDF, .csv, document, …. Hétérogénéïté de structure : gabarits, documents non structurés, thésaurus, taxonomie, …
#6 Le moteur est censé donner du sens : au contenu produit, aux dépendances entre les contenus, réduire le bruit, donner de la pertinence à une recherche, … Dans un contexte Drupal, avec des sites toujours plus complexe, complets, fragmentés, multi-sites, mulitlingues, multi-droits, … Trouver la bonne information pour chaque logique de chaque utilisateur devient une gageure
#8 Un moteur, ça indexe : contenus web, documents, bases de données, fichiers, données structurées, non structurées. En indexant, ça traite : alignement, structuration, pondération, scoring, matching, enrichissement, …. Ca restitue : des résultats d’après des correspondances sémantiques, linguistiques, statistiques, mathématiques, ca propose des alternatives, suggestions, ca analyse une requête, … Ca expose : pour les autres, pour venir constituer le web des données,
#10 Les éléments basiques du module cœur sont : Un bloc pour afficher le champ de recherche Une recherche avancée pour gérer les opérateurs boléen et les types de contenu sur lesquels on recherche - scoring factor basique Vous pouvez augmenter les fonctionnalités avec d’autres modules, tels que custom search, où vous pouvez : on peut faire qqles opérations de style (modifier les boutons, créer d’autres blocs de recherche, proposer des filtres sur des logiques de taxonomie, ajouter des libellés, ajouter des filtres sur les pages, afficher des métadonnées dans les résultats, ….), vous pouvez gérer les droits d’utilisation,
#11 Vous pouvez aller plus loin avec Search API, search API Database search, Facette API, Views et Entity et gérer des facettes Types de contenu indexés, batch de cron, champs indexés, boost level, type d’inxation (string ou full text) Sauvegarde de recherches Autocomplétion Optimisation des facettes Recherches Ajax …. À compléter
#12 Performances ! Temps de réponse et temps d’indexation. Serveur en local sur le même serveur que la DB
#13 Pas d’indexation full text Pertinence ! Pas d’indexation plein texte, opérateurs logiques limités, pas de lemmatisation, pas d’analyse lexicale, pas d’analyse statistique
#14 Usage transverse : cross-content, suggestions, recommandations Extensibilité ! Personnalisation
#21 More like this See more like this (depuis la version 5 sur SolR) on donne les champs sur lesquels on veut le more like this
#22 More like this See more like this (depuis la version 5 sur SolR) on donne les champs sur lesquels on veut le more like this
#23 More like this See more like this
#24 More like this See more like this
#25 Dès qu’on veut sortir du cadre, ça commence à devenir compliqué : paramétrages XML, indexation multi-source, optimisation de la pertinence, … Il faut être un expert SolR Mais bcp de possibilités avec les modules de la communauté Interface de gestion limitée Mais depuis la version 5, SolR est encapsulé, plus besoin d’installer un tomcat
#29 Schema évolutif et scalable (non redémarrage serveur à chaque fois). Les index sont définis à la volée
#30 Clustering natif et simplement paramétrable Tolérance de panne de ouf : gère à chaud la répartition des shards en fonction de l’état du cluster
#31 Courbe d’apprentissage rapide Déploiement et administration simple Fonctionnalité techniques ++ (configuration simplifiée, optimisation du boost, …) Intégration des outils Kibana et Logstash Système de plugins avancés : analyseurs de langues, rivières, Développement et intégration de plugins + simples (ex : dév d’un plugin pour récupérer en live les stats + facile sur Elastic Meilleure documentation que SolR
#32 Scoring différent pour Elastic : algorithme de scoring personnalisable (intéressant dans un contexte e-commerce / scoring paramétrable. Par exemple : je veux d’abord remonter les articles qui ont moins de stock ou pour lesquels j’ai + de marge)
#33 More like this See more like this
#34 Performance-wise, they are roughly the same. I say “roughly”, because nobody has ever done comprehensive and non-biased benchmarks. For 95% of use cases either choice will be just fine in terms of performance, and the remaining 5% need to test both solutions with their particular data and their particular access patterns.
#35 Performance-wise, they are roughly the same. I say “roughly”, because nobody has ever done comprehensive and non-biased benchmarks. For 95% of use cases either choice will be just fine in terms of performance, and the remaining 5% need to test both solutions with their particular data and their particular access patterns.
#36 Performance-wise, they are roughly the same. I say “roughly”, because nobody has ever done comprehensive and non-biased benchmarks. For 95% of use cases either choice will be just fine in terms of performance, and the remaining 5% need to test both solutions with their particular data and their particular access patterns.
#37 but only employees of Elasticsearch can actually make changes to Elasticsearch. In Solr world the community has a bit more say even though at the end of the day it’s one of the Solr developers who has to accept and handle the contribution
#40 Il vous faut mettre les mains dans le cambouis Conseils et optimisation en search
#41 Les back-office sont minimalistes Suivi statistique avancé : gestion des indexations et des agents de recherche, suivi en temps réel des requêtes Outils de sauvegarde & restauration
#42 Les back-office sont minimalistes