Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Gérer l'exploration des URL de navigation à facettes
La navigation à facettes est une fonctionnalité courante des sites Web qui permet aux visiteurs de modifier la façon dont les éléments (produits, articles ou événements, par exemple) sont affichés sur une page. Il s'agit d'une fonctionnalité populaire et utile. Toutefois, son implémentation la plus courante, basée sur les paramètres d'URL, peut générer des espaces d'URL infinis qui nuisent au site Web de plusieurs façons:
Surexploration: les URL créées pour la navigation à facettes semblent être nouvelles et les robots d'exploration ne peuvent pas déterminer si elles seront utiles sans les explorer au préalable. Par conséquent, les robots d'exploration accèdent généralement à un très grand nombre d'URL de navigation à facettes avant que leurs processus déterminent que les URL sont en fait inutiles.
Exploration plus lente: il découle de ce qui précède que, si les robots d'exploration explorent des URL inutiles, ils ont moins de temps à consacrer aux nouvelles URL utiles.
Une URL de navigation à facettes typique peut contenir différents paramètres dans la chaîne de requête, liés aux propriétés des éléments filtrés. Exemple :
Si vous modifiez l'un des paramètres d'URL products, color et size, un autre ensemble d'éléments s'affiche sur la page sous-jacente. Cela implique souvent un très grand nombre de combinaisons de filtres possibles, ce qui se traduit par un très grand nombre d'URL possibles. Pour économiser vos ressources, nous vous recommandons de gérer ces URL de l'une des manières suivantes:
Si vous n'avez pas besoin que les URL de navigation à facettes soient potentiellement indexées, empêchez en l'exploration.
Si vous souhaitez qu'elles soient potentiellement indexées, assurez-vous qu'elles respectent les bonnes pratiques décrites dans la section suivante. N'oubliez pas que l'exploration des URL à facettes a tendance à coûter aux sites de grandes quantités de ressources de calcul en raison du nombre considérable d'URL et d'opérations nécessaires pour afficher ces pages.
Empêcher l'exploration des URL de navigation à facettes
Si vous souhaitez économiser des ressources de serveur et que vous n'avez pas besoin que vos URL de navigation à facettes apparaissent dans la recherche Google, vous pouvez empêcher l'exploration de ces URL de l'une des manières suivantes.
Utilisez le fichier robots.txt pour interdire l'exploration des URL de navigation à facettes. Souvent, il n'y a aucune raison valable de permettre l'exploration des éléments filtrés, car cela consomme des ressources du serveur sans aucun avantage ou avec un avantage négligeable. Autorisez plutôt l'exploration des pages des éléments individuels, ainsi que d'une page de liste dédiée qui affiche tous les produits sans filtres appliqués.
Vous pouvez également indiquer les URL de navigation à facettes à explorer (ou non) à l'aide de l'élément rel="canonical"link et de l'attribut d'ancrage rel="nofollow". Toutefois, ces méthodes sont généralement moins efficaces à long terme que les méthodes mentionnées précédemment.
L'utilisation de rel="canonical" pour spécifier la version canonique d'une URL de navigation à facettes peut, à terme, réduire le volume d'exploration des versions non canoniques de ces URL. Par exemple, si vous disposez de trois types de pages filtrées, envisagez de rediriger rel="canonical" vers la version non filtrée : https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny spécifie <link rel="canonical" href="https://example.com/items.shtm?products=fish" >.
Il peut être utile d'utiliser des attributs rel="nofollow" sur les points d'ancrage redirigeant vers des pages de résultats filtrés. Toutefois, n'oubliez pas que chaque point d'ancrage redirigeant vers une URL spécifique doit comporter l'attribut rel="nofollow" pour fonctionner.
Assurez-vous que les URL de navigation à facettes sont optimales pour le Web
Si vous souhaitez que vos URL de navigation à facettes soient potentiellement explorées et indexées, assurez-vous de suivre ces bonnes pratiques pour minimiser les effets négatifs de l'exploration du grand nombre d'URL potentielles sur votre site:
Utilisez le séparateur de paramètres d'URL standard du secteur, &. Les robots d'exploration ont du mal à détecter des caractères comme la virgule (,), le point-virgule (;) et les crochets ([ et ]) en tant que séparateurs de paramètres (car le plus souvent ils ne sont pas utilisés comme séparateurs).
Si vous encodez des filtres dans le chemin d'URL, par exemple /products/fish/green/tiny, assurez-vous que leur ordre logique reste toujours le même et qu'aucun filtre en double ne peut exister.
Renvoyez un code d'état HTTP 404 lorsqu'une combinaison de filtres ne renvoie pas de résultats.
S'il n'y a pas de poisson vert dans l'inventaire du site, les utilisateurs et les robots doivent recevoir une erreur "Introuvable" avec le code d'état HTTP approprié (404). Il en va de même si l'URL contient des filtres en double ou des combinaisons de filtres non pertinentes, et des URL de pagination inexistantes. De même, si une combinaison de filtres ne renvoie aucun résultat, ne redirigez pas l'utilisateur vers une page d'erreur "Introuvable" standard. Au lieu de cela, affichez une erreur "Introuvable" avec le code d'état HTTP 404 sous l'URL où elle a été rencontrée.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/08/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Il n'y a pas l'information dont j'ai besoin","missingTheInformationINeed","thumb-down"],["Trop compliqué/Trop d'étapes","tooComplicatedTooManySteps","thumb-down"],["Obsolète","outOfDate","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Mauvais exemple/Erreur de code","samplesCodeIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/08/04 (UTC)."],[],["Faceted navigation URLs, often using parameters, can lead to overcrawling and slower discovery of new content. To manage this, prevent crawling of these URLs using `robots.txt` to disallow specific parameters or employ URL fragments instead of parameters. Alternatively, use `rel=\"canonical\"` or `rel=\"nofollow\"` to reduce crawling of these pages. If faceted URLs are needed, utilize `&` for parameters, maintain consistent filter order, and return `404` for no-result combinations.\n"],null,["# Managing crawling of faceted navigation URLs | Google Search Central\n\nManaging crawling of faceted navigation URLs\n============================================\n\n\nFaceted navigation is a common feature of websites that allows its visitors to change how items\n(for example, products, articles, or events) are displayed on a page. It's a popular and useful\nfeature, however its most common implementation, which is based on URL parameters, can generate\ninfinite URL spaces which harms the website in a couple ways:\n\n- **Overcrawling**: Because the URLs created for the faceted navigation seem to be novel and crawlers can't determine whether the URLs are going to be useful without crawling first, the crawlers will typically access a very large number of faceted navigation URLs before the crawlers' processes determine the URLs are in fact useless.\n- **Slower discovery crawls**: Stemming from the previous point, if crawling is spent on useless URLs, the crawlers have less time to spend on new, useful URLs.\n\n\nA typical faceted navigation URL may contain various parameters in the query string related to the\nproperties of items they filter for. For example: \n\n```\nhttps://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny\n```\n\n\nChanging any of the URL parameters `products`, `color`, and\n`size` would show a different set of items on the underlying page. This often means a\nvery large number of possible combinations of filters, which translates to a very large number of\npossible URLs. To save your resources, we recommend dealing with these URLs one of the following\nways:\n\n- If you don't need the faceted navigation URLs potentially indexed, prevent crawling of these URLs.\n- If you need the faceted navigation URLs potentially indexed, ensure that the URLs follow our best practices outlined in the following section. Keep in mind that crawling faceted URLs tends to cost sites large amounts of computing resources due to the sheer amount of URLs and operations needed to render those pages.\n\nPrevent crawling of faceted navigation URLs\n-------------------------------------------\n\n\nIf you want to save server resources and you don't need your faceted navigation URLs to show up in\nGoogle Search, you can prevent crawling of these URLs with one of the following ways.\n\n- **Use [robots.txt](/search/docs/crawling-indexing/robots/intro) to disallow crawling of faceted navigation URLs.** Oftentimes there's no good reason to allow crawling of filtered items, as it consumes server resources for no or negligible benefit; instead, allow crawling of just the individual items' pages along with a dedicated listing page that shows all products without filters applied. \n\n ```\n user-agent: Googlebot\n disallow: /*?*products=\n disallow: /*?*color=\n disallow: /*?*size=\n allow: /*?products=all$\n ```\n- **Use URL fragments to specify filters.** [Google Search generally doesn't support URL fragments in crawling and indexing](/search/docs/crawling-indexing/url-structure#fragments). If your filtering mechanism is based on URL fragments, it will have no impact on crawling (positive or negative). For example, instead of URL parameters, use URL fragments: \n\n ```\n https://example.com/items.shtm#products=fish&color=radioactive_green&size=tiny\n ```\n\n\nOther ways to signal a preference of which faceted navigation URLs (not) to crawl is using\n`rel=\"canonical\"` `link` element and the `rel=\"nofollow\"` anchor\nattribute. However, these methods are generally less effective in the long term than the\npreviously mentioned methods.\n\n- **Using [`rel=\"canonical\"`](/search/docs/crawling-indexing/consolidate-duplicate-urls#rel-canonical-link-method)\n to specify which URL is the canonical version of a faceted navigation URL** may, over time, decrease the crawl volume of non-canonical versions of those URLs. For example, if you have 3 filtered page types, consider pointing the `rel=\"canonical\"` to the unfiltered version: `https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny` specifies `\u003clink rel=\"canonical\" href=\"https://example.com/items.shtm?products=fish\" \u003e`.\n- **Using\n [`rel=\"nofollow\"`](/search/docs/crawling-indexing/qualify-outbound-links#nofollow)\n attributes on anchors pointing to filtered results pages** may be beneficial, however keep in mind that every anchor pointing to a specific URL must have the `rel=\"nofollow\"` attribute in order for it to be effective.\n\nEnsure the faceted navigation URLs are optimal for the web\n----------------------------------------------------------\n\n\nIf you need your faceted navigation URLs to be potentially crawled and indexed, ensure you're\nfollowing these best practices to minimize the negative effects of crawling the large number of\npotential URLs on your site:\n| Keep in mind that having these URLs crawled means an increased resource usage on your server and, potentially, slower discovery of new URLs on your site.\n\n1. **Use the industry standard URL parameter separator '`&`'.** Characters like comma (`,`), semicolon (`;`), and brackets (`[` and `]`) are hard for crawlers to detect as parameter separators (because most often they're not separators).\n2. If you're encoding filters in the URL path, such as `/products/`**fish** `/`**green** `/`**tiny**, ensure that the logical order of the filters always stays the same and that no duplicate filters can exist.\n3. **Return an HTTP `404` status code when a filter combination doesn't return\n results.** If there are no green fish in the site's inventory, users as well as crawlers should receive a \"not found\" error with the proper HTTP status code (`404`). This should also be the case if the URL contains duplicate filters or otherwise nonsensical filter combinations, and nonexistent pagination URLs. Similarly, if a filter combination has no results, don't redirect to a common \"not found\" error page. Instead, serve a \"not found\" error with the `404` HTTP status code under the URL where it was encountered. If [you have a single-page app](/search/docs/crawling-indexing/javascript/javascript-seo-basics#avoid-soft-404s) this might not be possible. Follow the best practices for single page apps."]]