Exemple :

Un contrôleur mesure le contenu exact de 16 bouteilles (en cl).

75.5 76 77 75
75.8 76.1 76.2 76.3
75.9 75.3 75.8 76.4
76.1 75 75.6 77.2

Il se demande si le contenu suit bien une loi normale, ce qui a été considéré comme sûr jusqu'ici.

Une première description rapide donne :

Boîte à moustaches   Histogramme
 

Si le contenu X suit une loi N ( m ; ) ,

suit une loi N ( ; ), de fonction de répartition P.

Dans ce cas, la fonction de répartition empirique Fn ( x ) est proche de P ( )

et P-1 ( Fn ( x ) ) est proche de , fonction affine de x.

Donc les points de coordonnées ( xi , P-1 ( Fn ( xi ) ) ) doivent être à peu près : (cochez la bonne réponse)

le long d'une courbe semblable à P
alignés verticalement
alignés horizontalement
alignés le long d'une droite de pente 1 /

Si on trie par ordre croissant les valeurs obtenues : x1 £ x2 £ ... £ xn , Fn ( x ) =

Pour des raisons difficiles à expliquer ici, on utilise plutôt la formule :

Compléter le tableau :

i xi Fn ( xi ) P-1 ( Fn ( xi ) )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
75
75
75.3
75.5


75.8
75.8
75.9
76
76.1
76.1
76.2
76.3
76.4
77
77.2
0.038
0.100
0.162
0.223


0.346
0.408
0.469
0.531
0.592
0.654
0.715
0.777
0.838
0.900
0.962
-1.769
-1.282
-0.988
-0.762

-0.396
-0.233
-0.077
0.077
0.233
0.396
0.569
0.762
0.988
1.282
1.769

A part quelques valeurs extrêmes, les points sont à peu près alignés. Il faudra faire un test plus précis pour savoir s'il s'agit effectivement d'une loi normale. Pour l'instant cette hypothèse n'est pas à rejeter.

Il existe un moyen plus rapide de tracer ce nuage de points : utiliser un papier "gausso-arithmétique" directement gradué en P-1 : en positionnant Fn, en %, selon cette échelle, on a directement P-1 ( Fn ( x ) ), sans calcul : ce diagramme "quantile-quantile" (ou QQ plot en Anglais) donne les quantiles de N ( 0 , 1 ) correspondant aux quantiles observés en abscisse.

Droite de Henry ou QQ plot

La droite qui passe "au plus près" du nuage de points s'appelle Droite de Henry.

L'ordonnée 50 % correspond sur le graphique précédent à ,

et % correspond à + 1 ; correspond à - 1.

Si les points sont alignés, la droite obtenue représente ,

donc une estimation de m est, sur cette droite, l'abcisse de : %,

une estimation de m + l'abscisse de : % ;

une estimation de m - l'abscisse de : %.

Si n est grand, on procède de même après regroupement en classes, par exemple :

Classes (kg) Effectifs

[ 7500 ; 7700 ]
[ 7700 ; 7800 ]
[ 7800 ; 7900 ]
[ 7900 ; 8000 ]
[ 8000 ; 8100 ]
[ 81
00 ; 8200 ]
[ 8200 ; 8300 ]
[ 8300 ; 8600 ]

1
2
16
10
8
7
4
2

L'aspect concave de cet exemple vient de la dissymétrie de la distribution :

On verra plus loin comment tester précisément si cette dissymétrie est significative.

Autre exemple : on peut aussi déceler sur un graphique de Henry si une distribution est bimodale :

Répartition des tailles de 171 personnes dont 1/3 de femmes et 2/3 d'hommes