Le classement sémantique par tags

Publié le 16 novembre 2009 par Jennifer Carmichael, dans Web

tags

Il y a quelques années naquit un nouveau système de description de l’information : la navigation par tags (ou étiquettes, marqueurs, libellés). Un tel système de classification est né du besoin de référencer ce qui ne pouvait pas être retrouvé par un moteur de recherche classique : les images et puis les liens (notamment dans le contexte du social bookmarking qui consiste à partager ses URL).

Il est amusant de penser que les tags auraient pu ne jamais voir le jour, au profit des catégories (bien que cela semble peu probable). En effet, lorsqu’on cherche un moyen de retrouver un grand nombre de choses dans le monde physique, on pense avant tout aux catégorisations. Ce système pose évidemment des problèmes de stockage : pour des questions de place, on ne peut pas dupliquer des livres qui pourtant devraient être proposés dans plusieurs catégories.

Bien sûr, une catégorisation numérique pourrait s’affranchir de ce genre de contraintes (du moins plus facilement, mais pas sans entrainer d’autres soucis) mais alors,  ce ne serait plus un référencement par catégorie. C’est ce qu’a tenté Yahoo ! il y a quelques années en proposant aux internautes de ranger les liens dans des dossiers bien rigides. La société américaine a vite compris son erreur : chacun classe les choses à sa manière, pour certains Amazon.fr doit être rangé dans le dossier « vente en ligne » alors que pour vous, il a plus de raison de se trouver dans « littérature ».

Si les tags ont été créés, c’est donc bien pour permettre aux internautes de créer leur propre catégorisation. L’intérêt du tag a ensuite dépassé l’intérêt de ce pour quoi il avait était créé : en plus de référencer, les nuages de tags permettent maintenant d’avoir une vue d’ensemble d’un site. Sur des portails d’agrégation comme Technorati, les mots clés permettent de mettre en évidence ce qui est le plus recherché ; l’onglet wikipédia du moteur de recherche Exalead propose un système nuage de tags intelligents (et plutot très puissant ) que je vous invite à (re)découvrir…

Malheureusement, la perfection n’existe pas et de fait, les tags ont aussi un côté obscur. Ainsi, le fait qu’ils ne comportent pas de hiérarchie, peut parfois dérouter l’internaute. Un exemple : pour vous : est ce que le terme « Jaguar » est plutôt un nom de voiture où un animal ?

Le problème de la synonymie se pose aussi. Prenons l’exemple du social bookmarking : il se peut que, dans ce contexte, toutes les personnes qui ont stocké un même lien sur leur compte ne se retrouvent pas car ils ont assigné au lien des tags synonymes : les internautes qui ont  tagué le lien « google maps » avec les termes « carte », ne retrouveront pas ceux qui ont tagué ce même lien avec le terme « plan ».

Même combat pour les méprises linguistiques… « Pain » pour moi c’est un tag qui réfère à la boulangerie mais je ne crois pas qu’il en soit de même pour mes cousines franco-britanniques qui vivent Outre-Manche !

Ces soucis seront peut être résolus grâce à Common tags,  qui a vu le jour en juin 2009. Ce système est très futé : il se propose de formaliser les tags en RDF (langage de base du web sémantique). En fait, derrière le tag (le libellé en langage naturel, une chaine de caractères) se cache un concept qui peut être défini de façon formelle dans l’univers RDF, et permet ainsi pas mal d’utilisations comme nous l’explique leçon de choses.

Quoiqu’on en pense, n’oublions pas que le système de microformats repose sur un système de tags insérés directement dans le code HTML. Une toute petite magouille que l’internaute ne voit pas mais qui permet quand même de retrouver sur Google Maps l’endroit où une photo de Flickr préalablement géolocalisée a été prise. Le microformat c’est aussi importer un contact présent sur un site web dans son carnet d’adresse personnel. Exploiter les microformats présents sur un blog (cela est notamment vrai pour la plateforme Wordpress) peut aussi être intéressant. En effet, lorsqu’un internaute tague un de ses articles avec le terme « oiseau », il va être possible de trouver tout un tas de ressources ayant trait au terme « oiseau ».

Quelques services basés sur l’utilisation massive de tags : les produits amazon.com, les marque-pages del.ic.ious, les photos Flickr, les marque-pages Ma.gnolia, les blogs sur Technocrati.

Voter !

A lire également

Votre commentaire




WARNING

Your browser does not support JavaScript or has JavaScript disabled!

This will not compromise the possibility to leave a comment, although the automatic insertion of both markup tags and emoticons will not work.

Emoticons gras Italique Lien Smile Grin Sad Surprised Confused Cool Mad Razz Neutral Wink Lol Red Face Cry Roll