samedi 17 mars 2012

Mensonges et statistiques

Benjamin Disraeli , un premier ministre britannique du 19e siècle, est célèbre pour avoir un jour déclaré de façon très pertinente je trouve:

Dans la vie, il y a trois sortes de mensonges:

* les petits mensonges
* les gros mensonges
* et les statistiques


Cette citation est d'ailleurs parfois également attribuée à Mark Twain.

La plupart du temps, ce sont les pourcentages et leur mauvaise utilisation par les hommes politiques ou les médias qui donnent aux statistiques cette si vilaine réputation.

Exemple type: Les statistiques du tourisme d'un pays imaginaire.

Voici la répartition des touristes en provenance de leur pays d'origine, et leur évolution entre 2010 et 2011:


D'après ce tableau; on constate une baisse globale fracassante de 42 560 touristes, soit moins 26%

Pourtant, un homme politique ou un journaliste peu rigoureux pourrait tenir le discours suivant (complètement bidon bien sûr):

Oui, on a eu une baisse de 35% sur la France et de 22% sur les USA. 
C'est vrai.
 Et ça fait donc une baisse de 57%

Mais heureusement le Japon et le Chili ont enregistré une très bonne progression 
de respectivement 1% et surtout 58% pour le Chili.
Donc en final, on est à l'équilibre.
 Et même à +2% !

Naturellement, tout ceci est archi faux car les % ne s'additionnent pas comme ça et ce qui compte c'est ce à quoi ils se réfèrent.

En l'occurence, ici, les 58% de progression du Chili ne font finalement que 300 touristes en plus.

Alors que la baisse pour la France et les USA est de:  29 210 + 13 870 = 43 080 touristes en moins !

Ni les 300 touristes en plus du Chili ni les 220 du japon ne pèsent bien lourd dans la balance et en fin de compte, le pays en question a vraiment perdu 42 560 touristes, soit une baisse réelle de 26%...

Mais quel pourcentage de lecteurs, d'auditeurs, de téléspectateurs dans la population, serait aujourd'hui capable de s'en apercevoir ?

Autre exemple: les corrélations linéaires et autres.

En ES ou en STG, mais pas en S bizarrement, on manipule quotidiennement  des séries de variables (xi; yi) qui, dans un repère,  donnent un nuage de points M(xi; yi)

Parfois ce nuage est plutôt rectiligne et on peut alors y tracer une droite et donc relier yi à xi par une relation affine du type yi = axi+b

Parfois, c'est plutôt une parabole, une hyperbole, ou une exponentielle.

Les calculatrices genre TI 82, 83, 84 etc... font ça très bien.  Même les Casio allez...

Pour les droites, ce caractère rectiligne est mesuré par le coefficient de corrélation r, compris entre -1 et 1

(disparu des calculatrices car disparu des programmes en ES et STG...)

Si r est proche de 1 alors le nuage est très rectiligne et on peut dire que y est x sont quasiment proportionnels, dans le même sens (si x augmente alors y aussi)

Si r est proche de -1, c'est pareil sauf que x et y évoluent en sens contraire:

Exemple: xi = durée du sommeil des enfants   et  yi = nombre de mauvaises notes à l'école...

Si l'enfant ne dort pas assez, il est normal que ces résultats scolaires s'en ressentent.

Mais on peut avoir parfois des résultats surprenants: certains ont trouvé une forte corrélation inverse entre la Bourse de New York (xi ) et la longueur des mini-jupes (yi).  On pourra toujours tenter d'y trouver à posteriori une tentative d'explication ou de justification.

Plus étonnant encore, certains cherchent (et trouvent parfois) des corrélations entre le taux d'équipement des ménages australiens en machine à laver et l'évolution du salaire médian des tourneurs-fraiseurs unijambistes de petite taille de Clermont-ferrand.

Donc méfiance quand même avec ces trucs là.


Les compteurs web.

Je viens de me rendre compte qu'un autre gros mensonge du moment est celui des compteurs web.






Locations of visitors to this page


Et des gadgets java comme la jolie sphère animée qui indique en temps réel les visiteurs du blog:


Cette jolie sphère animée montre que beaucoup de visiteurs viennent sur le blog.

A chaque petit cercle correspond un visiteur, avec son emplacement géographique.

 Un jour, il y en a eu 12 en même temps.

En pratique, il y a entre 100 et 250 visiteurs par jour sur mon blog. C'est pas mal.

Oui mais si on regarde dans le détail les statistiques de chaque article, et on peut le faire maintenant grâce à la nouvelle version du gestionnaire de blog que Blogspot vient de créer, on obtient ceci:

* Statistiques sur la journée qui vient de s'écouler (17 mars 2012)



* Statistiques sur la semaine qui vient de s'écouler:


* Statistiques sur le mois qui vient de s'écouler: (30 jours glissants)


* Pour finir, les statistiques totales des articles de ce blog:



Conclusion: 

C'est le post "Apprenez le piano en 1 leçon" , vu plus de 19 500 fois en un an, qui draine la quasi-totalité des visiteurs du blog (via Google) suivi par "Paris, meilleure ville étudiante au monde", vu 2300 fois en un mois.

Puis quelques vieux articles: Lunettes 3D, Escher,etc...

Il y a finalement très peu de visiteurs réguliers, qui viendraient voir chaque jour s'il y a des nouveaux posts .

Donc bien peu de visiteurs sur les articles d'astronomie par exemple.

Si je veux avoir plein de visiteurs, il suffit donc que je fasse des posts sur la musique, Lady Gaga, le PSG ou les élections présidentielles. Mais pas sur l'astronomie ou les maths.

Sauf les sujets/corrigés du bac ou du brevet, qui ont à chaque fois pas mal de succès (ce qui est rassurant quand même).

Quel visionnaire ce Benjamin Disraeli. Que tout cela était trompeur.

Petit ralentissement sur le blog à prévoir...



Merci quand même à tous les visiteurs, mais surtout à ceux, assez rares finalement,  qui viennent régulièrement.

2 commentaires:

Anonyme a dit…

J'avoue que les articles sur l'astronomie et les démo de maths ne sont pas mes préférés mais je passe souvent sur le blog, et ce n'est pas parce qu'ils intéressent relativement peu de gens qu'ils n'intéressent personne ..
La preuve avec la personne qui a corrigé la donnée du tableau distance Terre-Lune !

Est ce que le compteur prend en compte les articles devant lesquels on est passés ? parce que si on clique sur le lien général ( DoRéhttp://raiateabac.blogspot.fr/MiFaSol ( enlever les notes) ) et qu'on descend ensuite pour voir les autres articles, est ce que c'est comptabilisé ?

Aha !!

allez, bon courage !!
R.

CdM a dit…

On ne devrait jamais lire les statistiques quand on fait un blog philanthropique à visée ludo-didactique ou facétieuse. Précisément parce que les visites atteignent rarement les articles dont on aimerait qu'ils soient lus et inversement.
Au total, l'apprentissage du piano en une leçon a attiré certaines et certains visiteurs jusqu'aux étoiles, non ? Positivons les résultats statistiques de nos blogs perso !