• Accueil
  • À propos
  • Contact
  • Mon CV
  • Web analytique
  • NOFOLO

L’analyse statistique web n’est pas une science exacte

Classé dans Web analytique. Écrit le Tuesday, 24 October 2006 par Steph
Oct 24

Avec tous les outils statistiques d’analyse de trafic web, de mesure d’audience ou de web analytique on est enseveli sous des tonnes de métriques, de chiffres, de tendances, etc. Tout ça a pour but de comprendre les visiteurs de son site web, prédire des comportements et améliorer le taux de conversion, le ROI.

Par contre, aucune mesure n’est précise à 100%. Ce qui explique pourquoi nous voyons souvent des différences à travers différents outils.

Tout d’abord, le trafic web est principalement des visiteurs qui chargent et lisent des pages web. On peut donc compter des visiteurs, des visites et des pages web. Malheureusement, ces calculs ont un certain pourcentage d’erreurs dû à différents facteurs.

Ensuite, il faut faire la différence entre deux méthodes d’échantillonnage :  Les logs serveurs et le marqueur sur une page web. Dans le premier cas, le log serveur contient toutes les requêtes faites au serveur. Ceci inclut autant les véritables humains que les robots ou même les images placés sur un site externe.

Dans ce dernier cas, quelqu’un plaçant votre logo sur son site avec l’URL pointant vers votre site, chaque fois que cette image sera chargée, ce sera compté comme un visiteur et une page vue… même si cette personne n’a jamais été sur votre site!

D’autre part, les logs serveurs ajoutent les robots des engins de recherche tel que Google bot qui parcoure les sites pour mettre à jour son index. Il y a beaucoup de robots et ceux-ci peuvent compter pour 20% et plus de votre trafic.

Ensuite, il y a le marqueur comme utilise plusieurs outils de mesure, dont iMinR. Il s’agit de placer un bout de code, généralement du javascript, sur son site web et chaque fois que ce code est chargé, une visite ou une page vue est comptée. Dans ce cas, si le marqueur ou la page est dans la cache du navigateur alors on vient de raté un visiteur ou une page vue.

On ne peut pas compter précisément les visiteurs

Qu’est-ce qu’un visiteur sur Internet? C’est une personne qui demande à son ordinateur d’aller chercher une page sur un serveur quelque part sur le réseau. On se fie donc sur l’adresse IP pour identifier cet ordinateur comme un visiteur. Mais qu’en est-il des entreprises qui ont une passerelle pour tous leurs employés? Ceux-ci ont alors toute la même adresse IP. Alors si les 1 000 employés de tel bureau vont visiter un même site en même temps alors il ne sera compté qu’un unique visiteur.

L’autre problème des adresses IP est qu’une grande majorité des internautes ont encore des connexions « dial-up » donc ont une IP différente à chaque connexion. La même personne qui revient sera donc compté comme plusieurs visiteurs différents. Les cookies peuvent améliorer ceci, mais souvent ils sont blockés par les navigateurs.

Généralement, on peut croire que les calculs sont précis de 80 à 90% du temps.

On ne peut pas compter précisément les visites

Qu’est-ce qu’une visite? Généralement, les outils d’analyse statistique vont définir une visite comme l’ensemble des pages vues sur une période continue de 20 ou 30 minutes. Que se passe-t-il alors si vous visitez un site pendant 2 minutes et que vous revenez 10 minutes plus tard? Est-ce la même visite ou deux visite différentes? Et si, par exemple, vous écrivez un long message sur un site pendant 25 minutes, il y aura donc 2 visites comptées entre le moment où vous avez débuté votre message et l’envoi.

Il y a plusieurs autres exemples qui prouvent que le calcul des visites ne peut être 100% précis.

On ne peut calculer la durée d’une visite

Ce calcul est réellement tordu. Il existe plusieurs méthodes pour calculer la durée d’une visite, mais aucune ne peut être précise à 100%. La durée d’une visite est le temps entre l’appel de la première page et où le visiteur quitte la dernière. Si l’on peut savoir le temps sur chaque page en faisant la différence entre une page et celle précédemment visitée, quand est-il de la dernière page? Si vous fermez le navigateur? Si vous allez dîner avec cette page ouverte? Si vous ouvrez plusieurs pages du même site? Bref, il y a plusieurs exemple où il est évident que nous ne pouvons avoir une mesure exacte du temps qu’un visiteur a passé sur le site.

Conclusion

La mesure d’audience web, l’analyse de trafic web, le web mining, l’analytique web, etc. Ce sont tous des indicateurs de performance d’un site web, mais aucun ne peut être précis à 100%. Il faut donc garder en tête que chaque résultat comporte une marge d’erreur. Comme son nom le dit, c’est de la statistique et non de la mesure précise. On peut généralement dire que les chiffres sont bons avec une marge de plus ou moins 5%. Peut être même 10%.

Il est donc inutile de prendre des décisions sur un petit échantillon où la différence est minime. À l’inverse, lorsque les résultats s’appliquent à plus de 50% de l’ensemble total des données, on peut croire que le résultat est significatif.

À ce propos, c’est justement pour aider à mesurer la pertinence d’un résultat qu’il y a sur iMinR un ratio exprimant le pourcentage des données utilisées dans un rapport. Par exemple, si vous obtenez un ratio de 2% et que ça représente 2 visiteurs sur un total de 100 alors il ne vaudrait mieux ne pas trop accorder d’importance à ce résultat. À l’inverse, si ça représente 30% et plus, on peut considérer que ce résultat est fiable.

**
T'aimes ce billet? Dis-le à tes potes sur Facebook!

Articles sur le même sujet:

  • Statistiques et analyse Web
  • Statistiques Web : Doit-on exclure les rebonds des visites?
  • Quand du spam n’est pas du spam

2 Commentaires

  1. Xavier le 3 November 2006

    Je trouve cette analyse plutôt étrange.

    Les outils basés sur les technologie de marquage, comme Wysistat (par exemple) n’utilisent pas du tout l’adresse IP pour déterminer le nombre de visiteur, et heureusement (pour les raisons que vous expliquez), mais l’insertion d’un cookie. Ce n’est donc pas une IP mais un navigateur sur un poste qui est comptabilisé.
    Après, la marge d’erreur demeure face à des personnes qui utilisent la même machine et le même navigateur et pendant la même session du cookie, mais avouez que c’est un public négligeable.
    Non, le système de marqueur est fiable, quant aux nombre de visite, le problème vient de ce que la notion de visite est arbitraire (et a été définie par l’OJD une circulation sur un site sans interruption supérieure à 30 mn.
    Si l’on sait ce qu’ets une visite, on n’a pas de problème à analyser ces données, qui ne sont de toute façon pas les plus pertinentes.

  2. Steph le 3 November 2006

    Personnellement, je trouve ça pire avec le cookie qu’avec l’IP étant donné le nombre important de navigateurs IE qui bloquent les cookie des tiers par défaut. Mais bon, que ce soit IP ou cookie, bien que ce soit fiable, ce n’est pas 100% précis. C’est le but de mon article! :)



Laissez une réponse



Le techno-blogue à Steph!

MBA affaires électroniques, B.Sc.A

Web analytique, entreprenariat, Web, e-business, innovation, marketing Internet… etc!

Abonnez-vous

1. Via votre agrégateur de flux RSS :

2. Via Twitter :

Suivre @StephaneGuerin

3. Par email :

    • Popular
    • Comments
    • Featured
    • Faire de l’argent avec ACN? Non merci.
    • Devenir riche avec ACN et détester Steph
    • Devenir riche avec Internet sans se fatiguer
    • Que penser des pubs qui envahissent les blogues?
    • Question : Comment monétiser sans la pub?
    • Le truc pour faire de l'argent sur le web
    • Du snobisme à la Twitter
    • lothar2048 dit Il serait pas un peu du genre mytho instable l'info-contact, ou...
    • Info-contact dit Pas par les RI monsieur vous ne savez pas lire? Procés 2007 =...
    • bip! dit genial!!!! une societé deja comdamnée en 2007 pour PUB...
    • . dit martine = info contact
    • Arnie dit
    • lothar2048 dit Hé bé, les gars, je suis vraiment terrorisé... Dites m'en...
    • info-contact dit mais vous avez surement du confondre cher ami, je n'ai rien a...
    • Facebook a-t-il tué les retrouvailles d’école?
    • Ironman et entreprenariat
    • Quand les p’tites boîtes bottent le cul des grandes
    • De bonnes idées, mais où sont les revenus?
    • Les imposteurs du Web
    • Les caractéristiques d’un projet Web de rêve
    • En affaires comme dans la cuisine
    • Comment trouver son idée de startup
  • Recherche


  • Catégories
    • Articles - Réflexions
    • Blogues
    • bonnes idées
    • Cliniquement Chill
    • coup de pied au cul
    • E-Commerce
    • e-marketing
    • Entrepreneurship
    • iMinR - Tutoriels
    • kpi / indicateurs de performance clés
    • manche courte
    • Mauvais service
    • Mauvaises idées
    • Mes projets
    • mrk66433-Université
    • N'importe quoi
    • Nuouz
    • Plogues
    • Revenus web
    • SEO / SEM / SMO
    • Soirée Web & affaires à Québec
    • startups
    • Technologies
    • TLMEB
    • Vendredi
    • viral
    • Web 2.0
    • Web analytique
    • Web général
    • Yulbiz-Québec
  • Archives 12 mois
    • September 2010
    • August 2010
    • July 2010
    • June 2010
    • May 2010
    • April 2010
    • March 2010
    • February 2010
    • January 2010
    • December 2009
    • November 2009
    • October 2009
  • Archives par année
    • 2010
    • 2009
    • 2008
    • 2007
    • 2006
  • View Stéphane Guérin's profile on LinkedIn

    Nuouz: Partagez vos découvertes du web!

    104,936 spam comments
    blocked by
    Akismet





  • Accueil
  • À propos
  • Contact
  • Mon CV

© 2010 Le techno-blogue à Steph!

Designed by FTL.

Haut de page