samedi 17 mai 2014

Intervalle de confiance, de fluctuation, loi binomiale, normale : le kit de survie

Parmi les nouveautés du programme de mathématiques de ces dernières années en seconde, première et terminale figurent les fameux intervalles de confiance et de fluctuation

Comme vous allez vite le constater, ce n'est pas si compliqué que ça, surtout avec l'aide d'une calculatrice type TI-82, 83.. etc...

1. Intervalle de confiance:  Ici, la proportion p n'est pas connue, mais on veut l'estimer à l'aide d'un sondage réalisé sur un échantillon de taille n.

Soit f la fréquence observée. Alors il y a 95% de chances que la vraie proportion p, celle que l'on ne connait pas, soit dans l'intervalle:

Intervalle de confiance
Exemple: M. Durand, candidat aux élections veut estimer son futur résultat aux prochaines élections. Il fait faire un sondage sur n = 80 personnes. Parmi elles, 47 déclarent vouloir voter pour lui.

On a donc n = 80  et  f = 47/80 = 0,5875   (soit 58,75%)

Son intervalle de confiance est donc Iconfiance = [ 0,4756966 ; 0,6993] = [ 0,47; 0,70] par excès
Le résultat final de M.Durand aux vraies élections a donc 95% de chances d'être entre 47% et 70%


Remarques: cette formule reste la même en seconde, première et terminale. C'est déjà une bonne nouvelle.
L'amplitude de l'intervalle est facile à calculer et vaut 2 / n^(1/2) = 2 / racine(n)
Plus n est grand, plus c'est précis (mais onéreux ! car un sondage bien réalisé coûte cher)

Pour aller plus vite, on peut réaliser le programme suivant: Prgm/ Nouveau/INTCONF

PROGRAM: INTCONF
:Input "F:", F
:Input "N:",N
:Disp F- 1/N^0.5
:Disp F+1/N^0.5
:Disp: "Amplitude:", 2/N^0.5

Notes: a) Input et Disp (display= afficher en anglais) se trouvent dans PRGM /  E/S(entrée/sortie) ou I/O (IN/OUT)
b) la racine carrée de N s'obtient avec N^0.5


2. Intervalle de fluctuation:  Cette fois-ci, on connait p. Mais on voudrait quand même vérifier !
C'est typiquement le cas où M. Durand affirme que la proportion de tel ou tel caractère est, par exemple p = 0,25.

Dans tous les cas (seconde, première, terminale), on détermine l'intervalle de fluctuation associé à p, et on regarde si la fréquence obtenue au sondage est dedans: si, ce n'est pas le cas, on peut mettre en doute l'affirmation de M. Durand (avec un risque d'erreur en général de 5%). Sinon, on l'accepte, toujours au risque 5%.

Ce qui change ici entre les niveaux 2nde, première et terminale, c'est la façon de déterminer cet intervalle de fluctuation.

* En classe de seconde: l'intervalle est tout simplement:


... et ressemble comme deux gouttes d'eau à l'intervalle de confiance (retenir quand même: conFiance: c'est avec F)

Pour aller plus vite, on peut réaliser le programme suivant: Prgm/ Nouveau/INTFLUC2

PROGRAM: INTFLUC2
:Input "P:", P
:Input "N:",N
:Disp P- 1/N^0.5
:Disp P+1/N^0.5

Ou alors on utilise le programme INTCONF et on entre p à la place de f


* En classe de première (S, ES, STG): c'est nettement plus compliqué car on utilise la loi binomiale B(n:p)

Et là, la TI-82-83.. est d'une aide prodigieuse !

Il faut d'abord savoir que si X suit une loi binomiale B(n,p), alors p(X= k) s'obtient très facilement grâce à la touche distrib (2nde Var). On descend sur 0: binomFdp( ou bien binompdf(   si elle est en anglais).

Ainsi, supposons que X suive une loi binomiale B(n;p) = B( 20; 0,3), et que l'on cherche p(X=5)

Plutôt que de calculer " l'épouvantable" formule habituelle avec les 5 parmi 20, multipliés par 0,3^5 x (1-0,3)^(20-5), il suffit de taper: binomFdp(n,p,k) = binomFdp(20, 0.3, 5) et on obtient directement le résultat: 0,178863...

Remarque: la virgule entre n, p et k s'obtient par la touche ","  au dessus du 7.

Et si on veut p( X < 6) = p( X<= 5) = p(X=0) + p(X=1) +.....+ p(X=5)
il suffit de taper: binomFrep( n,p,k) = binomFRep(20, 0.3,5) = 0,41637...


En anglais, cette "instruction fonction de répartition (FRep)" est: binomcdf(


Mais il y a encore bien mieux: les listes L1, L2 et L3 (stats EDIT )

Dans L1 on met les valeurs k de 0 à 20, dans L2 les p(X = k) et dans L3 les p(X <= k)

Pour remplir L1:
on tape 0 (enter) 1 (enter) etc... jusqu'à 20 (c'est parfois long...mais on verra plus loin qu'il y a une autre méthode pour tout remplir d'un coup)

Pour remplir L2:
positionner le curseur sur L2 (tout en haut) et taper 2nd distrib/binomfdp(20,0,3,L1)   (enter)

Et pour remplir L3:
positionner le curseur sur L3 et taper 2nd distrib/binomFrep(20,0,3,L1)   (enter)

Et là, miracle, tout le tableau habituel apparaït.

C'est-à-dire le tableau qu'on voit la plupart du temps dans les livres, et qui provient le plus souvent d'un tableur type Excel.

C'est ce tableau qui permet de trouver les nombres a et b de l'intervalle de fluctuation de la classe de première: [ a/n; b/n ]


Version tableur (Excel, open office):



et version TI-82-83...:


On le voit, c'est la même chose.

En fait, la colonne du milieu "p(X=k)"  (c'est-à-dire L2 ) ne sert à rien.

On trouve a et b lorsque dans L3, on franchit pour la première fois les seuils 0,025 et 0,975

Ici, c'est pour a = 2 et b = 10

L'intervalle de fluctuation de première est donc:



Remarques: 1°) en classe de seconde, avec p = 0,3 et n =20, on aurait eu: [ 0,076 ; 0,524], qui est moins précis (plus large)

2°) Pour remplir L1 automatiquement de 0 à 20 : 2nd list : OPS/ 5: Suite(  ou Seq( en anglais:
Suite(A,A,0,20,1) -> L1



En classe de terminale (S, ES): c'est plus simple: il y a une formule, comme en seconde.

Mais le principe est toujours le même: quelqu'un affirme qu'une proportion est p, alors on calcule l'intervalle de fluctuation (dit de fluctuation asymptotique à 95%), on fait un sondage qui donne f, et on regarde si f est dedans.

La formule est ici:


Pour aller plus vite, on peut réaliser le programme suivant: Prgm/ Nouveau/INTFLUCT

PROGRAM: INTFLUCT
:Input "P:", P
:Input "N:",N
:(P*(1-P)/N)^(1/2)->W
:Disp P-1,96*W
:Disp P+1,96*W

Remarques: 1°) Pourquoi 1,96 ? il vient de loi normale centrée réduite N(0;1) car on a
p( -1,96 < X < 1,96) = 0,95 et on veut un intervalle où 95% des valeurs soient dedans.

On peut le vérifier avec: 2nd distrib / 2: normalFrep(-1.96 , 1.96, 0, 1) = 0,9500043497...

2°) Il y a aussi l'intervalle à 68%: on remplace le 1,96 par 1 (car p(-1< X < 1) = 0,68 environ)
et l'intervalle à 99%: on remplace 1,96 par 2,58 car p( -2,58 < X < 2,58 ) =0,9901199 environ

3°) Toujours avec = 0,3 et n = 20 on obtient également [0,1; 0,5]


Aucun commentaire: