
La première étape pour un référencement réussi consiste en l’indexation de vos pages dans les bases de données des moteurs de recherche. En effet si vous n’existez pas pour Google et compagnie, ça risque d’être compliqué pour apparaître dans les résultats. Pour être détecté par les moteurs, deux solutions : soit le robot découvre le site en cliquant sur un lien externe vers votre site, soit on lui soumet un Sitemap (littéralement « plan du site » en anglais). Nous allons aborder ensemble le protocole Sitemaps.
Qu’est-ce qu’un Sitemap ?
Il s’agit d’une représentation de la structure d’un site, présentéé généralement sous forme hiérarchique, dont l’objectif est de lister les ressources proposées. En d’autres termes un Sitemap est une liste exhaustive de toutes les pages qui forment un site.
Vous avez probablement remarqué sur certains sites la présence d’une page « plan du site ». Il s’agit d’une fonctionnalité similaire au protocole Sitemaps en ce sens qu’elle détaille l’arborescence d’un site, cependant elle n’a pas la même utilité. En effet un plan du site a plutôt vocation de favoriser la navigation pour les visiteurs, il n’est pas optimisé spécialement pour les moteurs de recherche contrairement aux Sitemaps.
Un Sitemap, pour quoi faire ?
Les Sitemaps aident à l’indexation d’un site en ce sens qu’ils permettent de s’assurer que l’ensemble des pages est accessible par les robots (crawlers).
Quand un robot ne détecte pas la présence d’un Sitemap il visite en général quelques pages du site en fonction des liens qu’ils trouvent, avant de repartir. Lorsque le site est de petite taille (quelques pages) l’exploration ne pose pas de problème et ne nécessite pas la mise en place d’un Sitemap, en revanche l’indexation devient beaucoup plus fastidieuse et lente lorsque le volume du site augmente considérablement.
L’utilisation des Sitemaps intervient donc pour stimuler la vitesse et la fréquence d’exploration d’un site, principalement pour ce type de situation :
- Votre site intègre du contenu dynamique,
- Toutes les pages de votre site n’ont pas été détectées lors du processus d’exploration,
- Votre site est récent et seuls quelques liens permettent d’y accéder,
- Votre site contient de nombreuses pages de contenu mal reliées.
Fonctionnalités et mise en oeuvre
Concrètement le protocole Sitesmap est un fichier XML qui liste les URL d’un site Web avec en prime quelques informations supplémentaires (meta-données) :
- La fréquence de modification des pages de votre site Web,
- La date de la dernière modification de chaque page,
- La priorité relative des pages de votre site. En effet, certaines pages de votre site peuvent avoir plus d’impact que les autres (la page d’accueil par exemple).
L’emplacement du fichier Sitemap n’a pas une importance essentielle mais il est préférable de le placer à la racine du site afin de s’éviter des modifications chronophages.
Le protocole Sitemap est souvent assimilé à Google qui en est le concepteur mais il est bon de rappeler que les autres principaux moteurs de recherche (Microsoft Live Search, Yahoo!, Ask.com et Exalead) utilisent le même protocole, ce qui le rend encore plus intéressant.
Dans le cas de sites dynamiques il va de soi qu’il est nécessaire de générer automatiquement le contenu d’un Sitemap en utilisant le PHP.
Voici un exemple de Sitemap XML, pour plus d’informations je vous suggère de potasser la référence sitemap.org.
< ?xml version= »1.0″ encoding= »UTF-8″?>
<urlset xmlns= »http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>

1 Commentaire
Trackbacks et pings
Votre commentaire