Drupal et les solutions de recherche
Au programme

> Pourquoi la recherche ?
> Le fonctionnement « out of the box »
> La solution SolR avec Drupal
> Externaliser votre recherche
Pourquoi	
  la	
  recherche	
  est-­‐elle	
  
si	
  essen1elle	
  ?	
  
Les enjeux d’un bon moteur de recherche
Satisfaction
de l’utilisateur
qui trouve ce
qu’il cherche	
  

Réponse à
l’obésité de
l’information

Transformati
on &
conversion
plus efficace
Pourquoi les internautes utilisent un
moteur de recherche
•  Ils ne trouvent pas rapidement l’information par
la navigation habituelle
•  Ils savent ce qu’ils cherchent et préfèrent
utiliser le moteur pour accéder directement à
l’information
Ce que veulent les internautes :
Oublions la complexité des interfaces
multi-critères et boléennes
Respectons les conventions UX et
utilisons les facettes
Les critères d’analyse d’un bon
moteur de recherche
• 
• 
• 
• 

Efficacité
Rapidité
Pertinence
Personnalisation
La	
  fonc1on	
  de	
  recherche	
  par	
  
défaut	
  sous	
  Drupal	
  
Une fonction par défaut sous D7

•  Formulaire simple & multi-critère
•  Gestion intégrée des permissions
Les paramétrages de Search

• 
• 
• 
• 

Indexation manuelle
Fréquence d’indexation
Modules de recherche activés : par entité
Classification & poids des contenus
Les inconvénients de la recherche
basique
• 
• 
• 
• 
• 
• 

Performances limitées - SQL
Serveur nécessairement en local
Peu de paramétrage
Pas d’indexation plein texte
Gestion d’opérateurs logiques limités
La recherche doit matcher l’expression de
recherche
SolR	
  
Qui est SolR ?
SolR

• 
• 
• 
• 
• 

Moteur de recherche en JAVA
Open Source
Projet APACHE
Très très largement utilisé
Issu du projet LUCENE
Le schéma de fonctionnement
Les avantages de SolR

•  Indexation d’un
volume de
données
important
•  Rapidité
Les avantages de SolR

•  Gestion du cache
•  Scalabilité
•  Gestion multisite
Les avantages de SolR

•  Optimisation de la
pertinence
•  Optimisation de
l’efficacité
Indexation plein texte

•  Format de
fichiers
courants
•  Ajout possible
de
bibliothèques
Scoring
Filtres et facettes
•  Content type
•  Termes de
taxonomie par
vocabulaire
•  Auteurs
•  Dates de
publication &
modification
•  Textes et nombres
choisis dans des
listes déroulantes
Etendre les facette avec FacetAPI

•  Gestion de l’ordre
des items
•  Gestion de facettes
étendues selon
certains contextes
•  Paramétrage de
l’affichage
•  Exclusion de
certains items
Pertinence de l’indexation

•  Tout contenu /
taxonomie modifiée est
automatiquement
réindexé
•  Tout le contenu
dépublié est retiré de
l’index
•  Stemmatisation du
contenu
•  Gestion des « stop
words »
•  Support multilingue
Etendre SolR

• 
• 
• 
• 
• 
• 
• 
• 
• 
• 
• 
• 

Autocomplétion
Nuages de mots-clé
Correction orthographique
Slider de facettes
Optimisation des urls
Suggestions
Rich Snippet
Recommandations
Surlignage
Recherche géographique
Optimisation multilingue
…
Les limites de SolR

•  Installation d’un serveur
•  Compétences techniques étendues nécessaires
•  Temps de paramétrage et d’optimisation
•  Interface de gestion limitée
Des solutions
externalisées

30

Core-Techs
Acquia Search

•  Repose sur l’extension SolR
•  Service hébergé
•  Installation rapide en 5 minutes
Google Custom Search

•  Un mode gratuit et un mode payant
•  Rapide et facile à installer
•  Pas de maintenance nécessaire
Acquia Search

•  Service hébergé
•  Installation rapide en 5 minutes
Moteurs externalisés
• 

Back-office de gestion

• 

Amélioration pertinence et
performance : siglaison,
synonymie, gestion de thésaurus

• 

Moteurs de recherche Ecommerce

• 

Orienté traitement des contenus

• 

Saas ou licence

• 

Intégration de solutions tierce :
OCR, recherche de couleurs, …
Moteurs de recherche Open Source

•  Elasticsearch basé sur Lucène
•  Amélioration de la performance
•  Optimisation de la recherche temps réel
Les méthodologies d’intégration des
solutions externalisées

Intégra1on	
  
sta1que	
  

Iframe	
  

XML	
  

Webservices	
  
En résumé :
Recherche	
  na1ve	
  
•  Peu	
  de	
  contenus	
  
•  Besoins	
  simples	
  
de	
  recherche	
  
•  Budget	
  limité	
  

Recherche	
  SolR	
  
•  Nombreux	
  
contenus	
  
•  Capacités	
  de	
  
paramétrage	
  
•  Besoin	
  de	
  
recherche	
  
efficace	
  

Recherche	
  
externalisée	
  
•  Pas	
  de	
  ressources	
  
techniques	
  
•  Budget	
  variable	
  
selon	
  la	
  solu1on	
  
•  Besoins	
  
d’op1misa1on	
  :	
  
sources	
  
hétérogènes,	
  
mul1-­‐site,	
  
thésaurus,	
  …	
  
Et demain ?

Solution de recherche Drupal

  • 1.
    Drupal et lessolutions de recherche
  • 2.
    Au programme > Pourquoila recherche ? > Le fonctionnement « out of the box » > La solution SolR avec Drupal > Externaliser votre recherche
  • 3.
    Pourquoi  la  recherche  est-­‐elle   si  essen1elle  ?  
  • 4.
    Les enjeux d’unbon moteur de recherche Satisfaction de l’utilisateur qui trouve ce qu’il cherche   Réponse à l’obésité de l’information Transformati on & conversion plus efficace
  • 5.
    Pourquoi les internautesutilisent un moteur de recherche •  Ils ne trouvent pas rapidement l’information par la navigation habituelle •  Ils savent ce qu’ils cherchent et préfèrent utiliser le moteur pour accéder directement à l’information
  • 6.
    Ce que veulentles internautes :
  • 7.
    Oublions la complexitédes interfaces multi-critères et boléennes
  • 8.
    Respectons les conventionsUX et utilisons les facettes
  • 9.
    Les critères d’analysed’un bon moteur de recherche •  •  •  •  Efficacité Rapidité Pertinence Personnalisation
  • 10.
    La  fonc1on  de  recherche  par   défaut  sous  Drupal  
  • 11.
    Une fonction pardéfaut sous D7 •  Formulaire simple & multi-critère •  Gestion intégrée des permissions
  • 12.
    Les paramétrages deSearch •  •  •  •  Indexation manuelle Fréquence d’indexation Modules de recherche activés : par entité Classification & poids des contenus
  • 13.
    Les inconvénients dela recherche basique •  •  •  •  •  •  Performances limitées - SQL Serveur nécessairement en local Peu de paramétrage Pas d’indexation plein texte Gestion d’opérateurs logiques limités La recherche doit matcher l’expression de recherche
  • 14.
  • 15.
  • 17.
    SolR •  •  •  •  •  Moteur de rechercheen JAVA Open Source Projet APACHE Très très largement utilisé Issu du projet LUCENE
  • 19.
    Le schéma defonctionnement
  • 20.
    Les avantages deSolR •  Indexation d’un volume de données important •  Rapidité
  • 21.
    Les avantages deSolR •  Gestion du cache •  Scalabilité •  Gestion multisite
  • 22.
    Les avantages deSolR •  Optimisation de la pertinence •  Optimisation de l’efficacité
  • 23.
    Indexation plein texte • Format de fichiers courants •  Ajout possible de bibliothèques
  • 24.
  • 25.
    Filtres et facettes • Content type •  Termes de taxonomie par vocabulaire •  Auteurs •  Dates de publication & modification •  Textes et nombres choisis dans des listes déroulantes
  • 26.
    Etendre les facetteavec FacetAPI •  Gestion de l’ordre des items •  Gestion de facettes étendues selon certains contextes •  Paramétrage de l’affichage •  Exclusion de certains items
  • 27.
    Pertinence de l’indexation • Tout contenu / taxonomie modifiée est automatiquement réindexé •  Tout le contenu dépublié est retiré de l’index •  Stemmatisation du contenu •  Gestion des « stop words » •  Support multilingue
  • 28.
    Etendre SolR •  •  •  •  •  •  •  •  •  •  •  •  Autocomplétion Nuages demots-clé Correction orthographique Slider de facettes Optimisation des urls Suggestions Rich Snippet Recommandations Surlignage Recherche géographique Optimisation multilingue …
  • 29.
    Les limites deSolR •  Installation d’un serveur •  Compétences techniques étendues nécessaires •  Temps de paramétrage et d’optimisation •  Interface de gestion limitée
  • 30.
  • 31.
    Acquia Search •  Reposesur l’extension SolR •  Service hébergé •  Installation rapide en 5 minutes
  • 32.
    Google Custom Search • Un mode gratuit et un mode payant •  Rapide et facile à installer •  Pas de maintenance nécessaire
  • 33.
    Acquia Search •  Servicehébergé •  Installation rapide en 5 minutes
  • 35.
    Moteurs externalisés •  Back-office degestion •  Amélioration pertinence et performance : siglaison, synonymie, gestion de thésaurus •  Moteurs de recherche Ecommerce •  Orienté traitement des contenus •  Saas ou licence •  Intégration de solutions tierce : OCR, recherche de couleurs, …
  • 36.
    Moteurs de rechercheOpen Source •  Elasticsearch basé sur Lucène •  Amélioration de la performance •  Optimisation de la recherche temps réel
  • 37.
    Les méthodologies d’intégrationdes solutions externalisées Intégra1on   sta1que   Iframe   XML   Webservices  
  • 38.
    En résumé : Recherche  na1ve   •  Peu  de  contenus   •  Besoins  simples   de  recherche   •  Budget  limité   Recherche  SolR   •  Nombreux   contenus   •  Capacités  de   paramétrage   •  Besoin  de   recherche   efficace   Recherche   externalisée   •  Pas  de  ressources   techniques   •  Budget  variable   selon  la  solu1on   •  Besoins   d’op1misa1on  :   sources   hétérogènes,   mul1-­‐site,   thésaurus,  …  
  • 39.