#seocamp
Débloquons la boite noire des algos de
Google avec l’analyse de logs
Par Francois Goube, CEO @Oncrawl
  +10	years	SEO	experience	
  Serial	entrepreneur	
  Business	Angel	
Membre	du	CA	SeoCamp	
Administrateur	Frenchtech
JevousaideA retenirl important
#LogsOnCrawl
@OnCrawl – @SEMRush #LogsOncrawl
Au programme
1.  Pourquoi faire de l’analyse de logs et surtout pour qui ?
2.  Quelles données pour bien démarrer l’analyse de logs ?
3.  Alternatives Open Source et Solution en SaaS
4.  Les 10 clés pour ouvrir la boite noire de Google
5.  Q&A
@OnCrawl – @SEMRush #LogsOncrawl
Logs Serveur : Kezako ?
Serveurs
Internet
@OnCrawl – @SEMRush #LogsOncrawl
A quoi ressemblent des logs ?
Un serveur web enregistre toutes les requètes qu’il
reçoit. Ce sont les logs serveurs
ü  En général:
/var/log/httpd sous apache
ü  Ils permettent :
ü  D’identifier le trafic SEO
ü  De voir ce que fait le GoogleBot
@OnCrawl – @SEMRush #LogsOncrawl
Pour qui ?
ü  Pour tous !!!
ü  Audit :
o  Diagnostic des pages utiles / inutiles
o  Zones que Google crawle
o  Zones que Google ne connait pas
ü  Monitoring :
o  Alertes
o  Suivi des mise en productions / Optimisations
o  Attaques
@OnCrawl – @SEMRush #LogsOncrawl
Bien démarrer sur l’analyse de logs
ü  Savoir où sont vos logs et comment y accéder
ü  S’assurer d’avoir l’ensemble des logs
ü  Procéder à des tests de complétude et de validité des
données :
1.  Compter les hits de Google et comparer avec la search console
2.  Compter les visites depuis Google et comparer avec Analytics
ü  Attention aux systèmes de cache !!!
-$ grep “Googlebot” access.log | wc -l
-$ grep “google.fr” access.log | wc -l
@OnCrawl – @SEMRush #LogsOncrawl
Quels outils
ü  Outils Open Source
ü  Kibana
ü  Kibana by Oncrawl
ü  Logalize
ü  Graylog
ü  Outils SaaS
ü  Oncrawl Advanced
ü  Logs.io
ü  Kelo.gs
ü  Qbox Available	on	Github
@OnCrawl – @SEMRush #LogsOncrawl
Pourquoi utiliser ses logs ?
ü  Know what Google did!
ü  Quelles pages sont crawlées par Google Bot
ü  Quelles sont mes pages actives ?
ü  Google rencontre-t-il des erreurs ?
ü  Car Google cherche à optimiser ses ressources de crawl
OpBmisez	les	ressources	de	Google	vers	vos	“MONEY	PAGES”
@OnCrawl – @SEMRush #LogsOncrawl
Pourquoi utiliser ses logs ?
ü  Savoir ce que
Google fait
ü  Pour
comprendre
l’impact SEO
@OnCrawl – @SEMRush #LogsOncrawl
Ne pas attendre un message dans GWT
ü  Suivez les status codes en temps réel
ü  Recevez des alertes
ü  Contrôlez vos MEP
Alertes	u)les	:	
ü  AugmentaBon	anormale	des	404	
ü  Baisse	du	nombre	de	pages	recevant	du	Trafic	SEO	
ü  …
Les logs vont surtout nous aider à
comprendre comment Google fonctionne
Top 10 des usages
@OnCrawl – @SEMRush #LogsOncrawl
Savoir ce que Google crawle
ü  Combien de pages uniques crawlées ?
ü  Nb de nouvelles pages crawlées
ü  Fréquence de crawl
#1
@OnCrawl – @SEMRush #LogsOncrawl
Comprendre si certaines zones
sont privilégiées
#2
@OnCrawl – @SEMRush #LogsOncrawl
Savoir ce que Google aime
ü  Pages actives
ü  Qui reçoivent du trafic SEO
ü  Taux de pages actives
ü  Freshrank
#3
@OnCrawl – @SEMRush #LogsOncrawl
Identifier les freins de votre site
ü  Status codes rencontrés par les bots
ü  Comment s’est passée ma mise en prod ?
ü  Mes pages changent-elles de status ?
#4
@OnCrawl – @SEMRush #LogsOncrawl
Analyser mon impact SEO
par groupe de pages
ü  Pour savoir si mes optimisations
fonctionnent
ü  Pour détecter des régressions
#5
@OnCrawl – @SEMRush #LogsOncrawl
Croiser les données de logs et
les données de crawl
#6
@OnCrawl – @SEMRush #LogsOncrawl
Trouver le facteur à optimiser
ü  En fonction de votre thématique, l’impact du nombre
de mots peut être énorme
#7
@OnCrawl – @SEMRush #LogsOncrawl
Trouver le facteur à optimiser
ü  Le nombre de liens est un facteur à ne pas négliger
#7
@OnCrawl – @SEMRush #LogsOncrawl
Trouver le facteur à optimiser
ü  Prouvez à l’IT que si le temps de chargement, c’est
important ;-)
#7
@OnCrawl – @SEMRush #LogsOncrawl
Mesurer l’impact du contenu dupliqué
sur le comportement des bots
ü  Savez vous planter les canonicals ?
#8
@OnCrawl – @SEMRush #LogsOncrawl
L’impact de l’architecture
ü  Êtes vous sûr d’avoir bien organisé votre site?
#9
@OnCrawl – @SEMRush #LogsOncrawl
L’impact de l’architecture
ü  Êtes vous sûr d’avoir bien organisé votre site?
#9
@OnCrawl – @SEMRush #LogsOncrawl
Prioriser vos actions
ü  Sur quelles pages dois-je me focaliser?
#10
@OnCrawl – @SEMRush #LogsOncrawl
Prioriser vos actions
ü  Par quel levier commencer?
#10
@OnCrawl – @SEMRush #LogsOncrawl
Prioriser vos actions
ü  Toute hypothèse peut être validée ou
invalidée par des données
ü  Plus de 300 metrics à utiliser dans
notre data explorer!
#10
@OnCrawl – @SEMRush #LogsOncrawl
La clé est dans le croisement des données
ü  A partir des données de crawl…
ü  Control du balisage HTML
ü  Qualité des meta
ü  Analyse du contenu (near duplicates, nb de mots…)
ü  Popularité des pages (Inrank)
ü  … et des données de logs
à  Vous ouvrez la boite noire de l’algo de Google!
à  Pages orphelines
à  Pages actives / famille
à  Zones inconnues de Google
à  Impact de chacune de vos optimisations sur le GoogleBot
Q&A
www.oncrawl.com
1 Month Free
Coupon: SEMRUSHWEBINAR
MERCI
@Oncrawl
hello@oncrawl.com

Contenu connexe

PPTX
Cocon, metamots et plus si affinités sémantiques. Seo campus-03-2017
PDF
AMP, le nouveau cheval de Troie de Google pour un web mobile instantané
PDF
Etude de la position 0 (Featured Snippet) sur Google
PPTX
SEO : 10 clés pour réussir en 2019 et booster vos audiences
PPT
Comment prévenir ou sortir d'une pénalité Google ?
PDF
Recherche & SEO / Aujourd'hui & Demain QueDuWeb
PPTX
Google AMP 1 an après : quel bilan, quelles perspectives ?
PPTX
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Cocon, metamots et plus si affinités sémantiques. Seo campus-03-2017
AMP, le nouveau cheval de Troie de Google pour un web mobile instantané
Etude de la position 0 (Featured Snippet) sur Google
SEO : 10 clés pour réussir en 2019 et booster vos audiences
Comment prévenir ou sortir d'une pénalité Google ?
Recherche & SEO / Aujourd'hui & Demain QueDuWeb
Google AMP 1 an après : quel bilan, quelles perspectives ?
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016

Tendances (13)

PPTX
Migration seo - astuces techniques pour améliorer votre trafic
PPTX
Position 0 seocampus 2017 (Featured Snippets)
PPTX
OnCrawl Breakfast Paris 10/12/15
PPTX
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
PDF
Réussir son SEO à l’international - iProspect France
PDF
Optimiser son SEO avec Google Tag Manager
PDF
Les défauts de WordPress pour le SEO
PDF
Netlinking - Quelles stratégies gagnantes ont utilisées ces SEO ?
PDF
Audit SEO : les clés de la réussite
PPTX
Optimiser son seo avec google tag manager
PDF
Nouveautés Google Mobile 2016
PPTX
La casa de SEO : les questions à se poser pour le casse SEO parfait
PDF
Le content Marketing : chainon manquant entre SXO et SEO - Digimood
Migration seo - astuces techniques pour améliorer votre trafic
Position 0 seocampus 2017 (Featured Snippets)
OnCrawl Breakfast Paris 10/12/15
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Réussir son SEO à l’international - iProspect France
Optimiser son SEO avec Google Tag Manager
Les défauts de WordPress pour le SEO
Netlinking - Quelles stratégies gagnantes ont utilisées ces SEO ?
Audit SEO : les clés de la réussite
Optimiser son seo avec google tag manager
Nouveautés Google Mobile 2016
La casa de SEO : les questions à se poser pour le casse SEO parfait
Le content Marketing : chainon manquant entre SXO et SEO - Digimood
Publicité

Similaire à Débloquer la boîte noire de Google avec l'analyse de logs (20)

PPTX
SEO Campus 2016 Oncrawl Open Source Log Analysis
PPTX
SEO breakfast Toulouse - Analyse de logs
PDF
Analyse de Logs et SEO : Comment utiliser les logs pour optimiser son site po...
PDF
Analyse de logs SEO : pour qui, pour quoi, comment ?
PDF
Comment l'un des plus grand site média français a augmenté son trafic organiq...
PDF
Comment un grand site média a augmenté son trafic organique de plus de 80% gr...
PPTX
Analyse combinée crawl + logs - Search Foresight & Botify
PPTX
Analyse Logs + crawl : Retour sur 10 ans d’expérience - Mathieu Chapon - SEOC...
PDF
Being Googlebot - de nouvelles clés pour optimiser le SEO
PDF
Analyse de logs par l'exemple - seocampus 2017
PDF
Analyse de logs - Études de cas et best practices - SEO Campus 2017
PDF
Comment exploiter les données de la Search Console et en tirer des actions co...
PDF
L’évolution des crawls mobile de Google… - OnCrawl - 1er Février - Luxembourg
PPTX
Matin Neperien - Googlebot - 30 janvier 2025 Paris.pptx
PPTX
Deck seo campus 2011 utiliser les logs serveurs
PPTX
Analyse de logs, intervention SEO et interprétation par Google - Julie Chodor...
PDF
Analyse de logs, intervention SEO et interprétation par Google - SEO Campus P...
PPTX
SEOCamp Nantes : Comment utiliser le Knowledge Graph pour améliorer votre SEO ?
PDF
Du Crawl à l’indexation : les prérequis pour bien ranker
PDF
Page importance, l’algorithme de Google qui optimise les budgets de crawl - p...
SEO Campus 2016 Oncrawl Open Source Log Analysis
SEO breakfast Toulouse - Analyse de logs
Analyse de Logs et SEO : Comment utiliser les logs pour optimiser son site po...
Analyse de logs SEO : pour qui, pour quoi, comment ?
Comment l'un des plus grand site média français a augmenté son trafic organiq...
Comment un grand site média a augmenté son trafic organique de plus de 80% gr...
Analyse combinée crawl + logs - Search Foresight & Botify
Analyse Logs + crawl : Retour sur 10 ans d’expérience - Mathieu Chapon - SEOC...
Being Googlebot - de nouvelles clés pour optimiser le SEO
Analyse de logs par l'exemple - seocampus 2017
Analyse de logs - Études de cas et best practices - SEO Campus 2017
Comment exploiter les données de la Search Console et en tirer des actions co...
L’évolution des crawls mobile de Google… - OnCrawl - 1er Février - Luxembourg
Matin Neperien - Googlebot - 30 janvier 2025 Paris.pptx
Deck seo campus 2011 utiliser les logs serveurs
Analyse de logs, intervention SEO et interprétation par Google - Julie Chodor...
Analyse de logs, intervention SEO et interprétation par Google - SEO Campus P...
SEOCamp Nantes : Comment utiliser le Knowledge Graph pour améliorer votre SEO ?
Du Crawl à l’indexation : les prérequis pour bien ranker
Page importance, l’algorithme de Google qui optimise les budgets de crawl - p...
Publicité

Débloquer la boîte noire de Google avec l'analyse de logs

  • 1. #seocamp Débloquons la boite noire des algos de Google avec l’analyse de logs Par Francois Goube, CEO @Oncrawl
  • 2.   +10 years SEO experience   Serial entrepreneur   Business Angel Membre du CA SeoCamp Administrateur Frenchtech
  • 4. @OnCrawl – @SEMRush #LogsOncrawl Au programme 1.  Pourquoi faire de l’analyse de logs et surtout pour qui ? 2.  Quelles données pour bien démarrer l’analyse de logs ? 3.  Alternatives Open Source et Solution en SaaS 4.  Les 10 clés pour ouvrir la boite noire de Google 5.  Q&A
  • 5. @OnCrawl – @SEMRush #LogsOncrawl Logs Serveur : Kezako ? Serveurs Internet
  • 6. @OnCrawl – @SEMRush #LogsOncrawl A quoi ressemblent des logs ? Un serveur web enregistre toutes les requètes qu’il reçoit. Ce sont les logs serveurs ü  En général: /var/log/httpd sous apache ü  Ils permettent : ü  D’identifier le trafic SEO ü  De voir ce que fait le GoogleBot
  • 7. @OnCrawl – @SEMRush #LogsOncrawl Pour qui ? ü  Pour tous !!! ü  Audit : o  Diagnostic des pages utiles / inutiles o  Zones que Google crawle o  Zones que Google ne connait pas ü  Monitoring : o  Alertes o  Suivi des mise en productions / Optimisations o  Attaques
  • 8. @OnCrawl – @SEMRush #LogsOncrawl Bien démarrer sur l’analyse de logs ü  Savoir où sont vos logs et comment y accéder ü  S’assurer d’avoir l’ensemble des logs ü  Procéder à des tests de complétude et de validité des données : 1.  Compter les hits de Google et comparer avec la search console 2.  Compter les visites depuis Google et comparer avec Analytics ü  Attention aux systèmes de cache !!! -$ grep “Googlebot” access.log | wc -l -$ grep “google.fr” access.log | wc -l
  • 9. @OnCrawl – @SEMRush #LogsOncrawl Quels outils ü  Outils Open Source ü  Kibana ü  Kibana by Oncrawl ü  Logalize ü  Graylog ü  Outils SaaS ü  Oncrawl Advanced ü  Logs.io ü  Kelo.gs ü  Qbox Available on Github
  • 10. @OnCrawl – @SEMRush #LogsOncrawl Pourquoi utiliser ses logs ? ü  Know what Google did! ü  Quelles pages sont crawlées par Google Bot ü  Quelles sont mes pages actives ? ü  Google rencontre-t-il des erreurs ? ü  Car Google cherche à optimiser ses ressources de crawl OpBmisez les ressources de Google vers vos “MONEY PAGES”
  • 11. @OnCrawl – @SEMRush #LogsOncrawl Pourquoi utiliser ses logs ? ü  Savoir ce que Google fait ü  Pour comprendre l’impact SEO
  • 12. @OnCrawl – @SEMRush #LogsOncrawl Ne pas attendre un message dans GWT ü  Suivez les status codes en temps réel ü  Recevez des alertes ü  Contrôlez vos MEP Alertes u)les : ü  AugmentaBon anormale des 404 ü  Baisse du nombre de pages recevant du Trafic SEO ü  …
  • 13. Les logs vont surtout nous aider à comprendre comment Google fonctionne Top 10 des usages
  • 14. @OnCrawl – @SEMRush #LogsOncrawl Savoir ce que Google crawle ü  Combien de pages uniques crawlées ? ü  Nb de nouvelles pages crawlées ü  Fréquence de crawl #1
  • 15. @OnCrawl – @SEMRush #LogsOncrawl Comprendre si certaines zones sont privilégiées #2
  • 16. @OnCrawl – @SEMRush #LogsOncrawl Savoir ce que Google aime ü  Pages actives ü  Qui reçoivent du trafic SEO ü  Taux de pages actives ü  Freshrank #3
  • 17. @OnCrawl – @SEMRush #LogsOncrawl Identifier les freins de votre site ü  Status codes rencontrés par les bots ü  Comment s’est passée ma mise en prod ? ü  Mes pages changent-elles de status ? #4
  • 18. @OnCrawl – @SEMRush #LogsOncrawl Analyser mon impact SEO par groupe de pages ü  Pour savoir si mes optimisations fonctionnent ü  Pour détecter des régressions #5
  • 19. @OnCrawl – @SEMRush #LogsOncrawl Croiser les données de logs et les données de crawl #6
  • 20. @OnCrawl – @SEMRush #LogsOncrawl Trouver le facteur à optimiser ü  En fonction de votre thématique, l’impact du nombre de mots peut être énorme #7
  • 21. @OnCrawl – @SEMRush #LogsOncrawl Trouver le facteur à optimiser ü  Le nombre de liens est un facteur à ne pas négliger #7
  • 22. @OnCrawl – @SEMRush #LogsOncrawl Trouver le facteur à optimiser ü  Prouvez à l’IT que si le temps de chargement, c’est important ;-) #7
  • 23. @OnCrawl – @SEMRush #LogsOncrawl Mesurer l’impact du contenu dupliqué sur le comportement des bots ü  Savez vous planter les canonicals ? #8
  • 24. @OnCrawl – @SEMRush #LogsOncrawl L’impact de l’architecture ü  Êtes vous sûr d’avoir bien organisé votre site? #9
  • 25. @OnCrawl – @SEMRush #LogsOncrawl L’impact de l’architecture ü  Êtes vous sûr d’avoir bien organisé votre site? #9
  • 26. @OnCrawl – @SEMRush #LogsOncrawl Prioriser vos actions ü  Sur quelles pages dois-je me focaliser? #10
  • 27. @OnCrawl – @SEMRush #LogsOncrawl Prioriser vos actions ü  Par quel levier commencer? #10
  • 28. @OnCrawl – @SEMRush #LogsOncrawl Prioriser vos actions ü  Toute hypothèse peut être validée ou invalidée par des données ü  Plus de 300 metrics à utiliser dans notre data explorer! #10
  • 29. @OnCrawl – @SEMRush #LogsOncrawl La clé est dans le croisement des données ü  A partir des données de crawl… ü  Control du balisage HTML ü  Qualité des meta ü  Analyse du contenu (near duplicates, nb de mots…) ü  Popularité des pages (Inrank) ü  … et des données de logs à  Vous ouvrez la boite noire de l’algo de Google! à  Pages orphelines à  Pages actives / famille à  Zones inconnues de Google à  Impact de chacune de vos optimisations sur le GoogleBot
  • 30. Q&A