FLASH INFORMATIQUE FI



Les chiffres sont aux analystes ce que les lampadaires sont aux ivrognes : Ils fournissent bien plus un appui qu’un éclairage




Natalie MEYSTRE


Vous pouvez consulter les statistiques de fréquentation de votre site Web via le service Webalizer mis en place à l’Ecole pour les sites Jahia (et www.epfl.ch). Il suffit d’ajouter le suffixe /stats à l’adresse (url) de votre page d’entrée.
Exemple :
Portail Collaborateurs > collaborateurs.epfl.ch > collaborateurs.epfl.ch/stats/ .
Comme toute statistique, les chiffres proposés sont à prendre avec des pincettes. La plupart des termes employés ont une définition plutôt obscure et ne fournissent pas des informations immédiatement décodables. Vous pourrez trouver intéressant de comparer les flux de visites selon les heures de la journée ou les jours du mois. Vous serez curieux de connaître les mots-clé qui ont conduit les internautes sur votre site, ainsi que leur provenance. Si vous cherchez un moyen infaillible pour vous renseigner sur votre visibilité et la fonctionnalité de vos pages, mieux vaut mener une petite enquête auprès de votre public-cible.

Quelles sont les caractéristiques de Webalizer


• Tout d’abord, les statistiques sont faites globalement pour un site, et non pas pour chaque page.
• Webalizer produit des statistiques mensuelles et un tableau récapitulatif pour les 12 derniers mois.
• Les statistiques du mois en cours sont mises à jour toutes les nuits avec les données des connexions de la veille.
• Comme elles prennent en compte les accès faits par les robots des moteurs de recherche, ce qui n’est pas négligeable (ces robots visitent toutes les pages), les statistiques n’ont donc qu’une valeur relative.

Petit lexique

Webalizer fait des statistiques sur les hits, les fichiers, les pages, les visites, etc. Ces termes nécessitent quelques éclaircissements. En effet, ce qui est analysé est le flux entre la machine de votre visiteur et le serveur qui héberge votre site. Ce que vous voyez à l’écran et que vous appelez page Web est en fait décomposé en une série d’objets distincts possédant chacun leur propre adresse (images, pages, css, fichiers audio ou pdf,...).

JPEG - 4.5 ko
fig.1

Voici une définition des termes classés par leur ordre d’apparition :
(total) Hits : Toute requête au serveur qui héberge votre site est un hit (fichier de tout type, HTML, PHP, image, script CGI,...)
Exemple :
votre page contient 10 images et une feuille de style, cela est donc comptabilisé comme 12 hits (> page html + css + images). A noter que si une image est déjà apparue précédemment, soit sur une même page, soit sur des pages différentes (pixel.gif, le logo de l’epfl, ...), elle est stockée dans le cache de votre navigateur et ne compte que pour un hit. Le nombre de hits n’a donc pas beaucoup de sens.

(total) Files : Tout document (fichier ou document dynamique) renvoyé par le serveur en réponse à une requête. Toute requête (=hits) n’aboutit pas à l’envoi d’un fichier : elle peut correspondre à une erreur.

(total) Pages : Tout fichier renvoyé de type HTML ou HTM, c’est-à-dire toute page, sans les fichiers individuels qui la composent (images, clips audio,...). Webaliser compte cela approximativement en se basant sur le suffixe de l’objet demandé, et inclut les pages PHP.

(total) Visits : Une visite consiste en la consultation successive d’une ou plusieurs pages sur le même site et par le même client (visiteur), dans un laps de temps raisonnable (30 minutes).
Exemple :
Une personne qui consulte à la suite dix pages de votre site compte pour une visite. Mais si plus de 30 minutes s’écoule entre deux clicks, une nouvelle visite est alors comptabilisée.

(total) Kbytes : Donne le volume des fichiers renvoyés en kilo-octets (1 Ko = 1024 octets).

(total) Unique Sites : Nombre d’adresses IP (de clients) différentes. Ici le mot site n’a rien n’à voir avec votre site, mais désigne la machine de votre client.

(total) Unique URLs : Le nombre d’adresses (url des pages + des fichiers) consultées sur votre site.

(total) Unique Referrers : Un référent est le document que consultait le visiteur lorsqu’il a cliqué sur un lien l’amenant sur une de vos pages Web. Webalizer sait (plus ou moins bien) agréger les référents venant de moteurs de recherche tels que Google. La navigation à l’intérieur de votre propre site n’est pas prise en compte.

(total) Unique User Agents : Un autre nom pour désigner les navigateurs.

Top 30 of Total URLs : Chaque élément de votre site (page html, image, fichier audio,...) a sa propre adresse, ou URL. Cette rubrique donne la liste des adresses les plus consultées sur votre site.
Quelques exemples d’adresses :

 - Le signe / indique la page d’entrée du site. Attention, pour les sites Jahia, la page d’accueil a à la fois une adresse générique (monsite.epfl.ch) et une adresse Jahia (monsite.epfl.ch/page12346.html) ;

 - /favicon.ico est une requête pour la petite image qui s’affiche (sur certains navigateurs) à côté de l’url dans la barre d’adresse et dans la liste des favoris ;

 - /robots.txt est une requête venant des moteurs de recherche pour consulter le fichier définissant les règles de recherche (définition des robots.txt, voir bas de page) ;

 - des demandes de type /_vti_bin/owsssvr.dll, /MSOffice/cltreq.asp sont produites par des agents (agent = logiciel envoyé sur un réseau pour effectuer une tâche à la place de l’utilisateur et sans son intervention.)
 - /label.php, sur les sites Jahia, est une requête pour les images-titres (dans le bandeau, les boîtes)

 - /cgi-bin/csoldap est une demande à l’annuaire, depuis la boîte de recherche

 - ...

Top 10 of Total URLs by KBytes : Classement des pages et fichiers selon leur poids (une page contenant de nombreuses images aura plus de poids qu’un simple fichier favicon.)

Top 10 of Total Entry Pages : La première page lue lors d’une visite. Le signe / indique qu’il s’agit de la page d’accueil (homepage) de votre site.

Top 10 of Total Exit Pages : La dernière page lue lors d’une visite. Le signe / indique qu’il s’agit de la page d’accueil (homepage) de votre site.

Top 30 of Total Sites : Soit les serveurs auxquels sont rattachés les visiteurs de votre site, soit leur fournisseur d’accès, soit leur IP.
Exemple :
Exemple : bibpc34.epfl.ch > le serveur des postes publics de la bibliothèque centrale.

Top 10 of Total Sites by KBytes : La provenance des visiteurs en fonction de leur serveur selon le volume des requêtes.

Top 30 of Total Referrers : Les pages sur lesquels se trouvaient vos visiteurs lorsqu’ils ont utilisé un lien les conduisant à votre site. Direct request : le visiteur a écrit directement votre adresse dans la barre de navigation.

Top 15 of Total Search string : Il s’agit des mots-clés employés par les utilisateurs sur des moteurs de recherche.

Top 15 of Total User Agent : En principe, le navigateur employé par le visiteur, bien que la plupart ne s’annonce pas sous leur vrai nom. Ces données n’ont donc pas beaucoup de réalité.

Top 30 of Total Countries : La provenance (géographique) des visiteurs selon leur TLD (top level domain, exemple : .ch . fr, .com,...).

JPEG - 6.4 ko
fig.2
JPEG - 6.6 ko
fig.3

Sources

Ces informations sont issues d’une page de la CICT, qui utilise également Webalizer. Vous pouvez consulter cette page in extenso ou chercher plus d’informations sur le site même de l’outil (en anglais) www.cict.fr/WWW/statistiques.html et www.mrunix.net/webalizer/. Vulgarisation scientifique : tout ce que vous n’osez plus demander au sujet d’Internet : www.commentcamarche.net/internet/ Plus d’information sur les robots et les moteurs de recherche : article de Francis Lapique dans le FI/1-2.



Cherchez ...

- dans tous les Flash informatique
(entre 1986 et 2001: seulement sur les titres et auteurs)
- par mot-clé

Avertissement

Cette page est un article d'une publication de l'EPFL.
Le contenu et certains liens ne sont peut-être plus d'actualité.

Responsabilité

Les articles n'engagent que leurs auteurs, sauf ceux qui concernent de façon évidente des prestations officielles (sous la responsabilité du DIT ou d'autres entités). Toute reproduction, même partielle, n'est autorisée qu'avec l'accord de la rédaction et des auteurs.


Archives sur clé USB

Le Flash informatique ne paraîtra plus. Le dernier numéro est daté de décembre 2013.

Taguage des articles

Depuis 2010, pour aider le lecteur, les articles sont taggués:
  •   tout public
    que vous soyiez utilisateur occasionnel du PC familial, ou bien simplement propriétaire d'un iPhone, lisez l'article marqué tout public, vous y apprendrez plein de choses qui vous permettront de mieux appréhender ces technologies qui envahissent votre quotidien
  •   public averti
    l'article parle de concepts techniques, mais à la portée de toute personne intéressée par les dessous des nouvelles technologies
  •   expert
    le sujet abordé n'intéresse que peu de lecteurs, mais ceux-là seront ravis d'approfondir un thème, d'en savoir plus sur un nouveau langage.