Exemple :
Un contrôleur mesure le contenu exact de 16 bouteilles (en cl).
Il se demande si le contenu suit bien une loi normale, ce qui a été considéré comme sûr jusqu'ici.
Une première description rapide donne :
Si le contenu X suit une loi N ( m ; ) ,
suit une loi N ( ; ), de fonction de répartition P.
Dans ce cas, la fonction de répartition empirique Fn ( x ) est proche de P ( )
et P-1 ( Fn ( x ) ) est proche de , fonction affine de x.
Donc les points de coordonnées ( xi , P-1 ( Fn ( xi ) ) ) doivent être à peu près : (cochez la bonne réponse)
Si on trie par ordre croissant les valeurs obtenues : x1 £ x2 £ ... £ xn , Fn ( x ) =
Pour des raisons difficiles à expliquer ici, on utilise plutôt la formule :
Compléter le tableau :
A part quelques valeurs extrêmes, les points sont à peu près alignés. Il faudra faire un test plus précis pour savoir s'il s'agit effectivement d'une loi normale. Pour l'instant cette hypothèse n'est pas à rejeter.
Il existe un moyen plus rapide de tracer ce nuage de points : utiliser un papier "gausso-arithmétique" directement gradué en P-1 : en positionnant Fn, en %, selon cette échelle, on a directement P-1 ( Fn ( x ) ), sans calcul : ce diagramme "quantile-quantile" (ou QQ plot en Anglais) donne les quantiles de N ( 0 , 1 ) correspondant aux quantiles observés en abscisse.
La droite qui passe "au plus près" du nuage de points s'appelle Droite de Henry.
L'ordonnée 50 % correspond sur le graphique précédent à ,
et % correspond à + 1 ; correspond à - 1.
Si les points sont alignés, la droite obtenue représente ,
donc une estimation de m est, sur cette droite, l'abcisse de : %,
une estimation de m + l'abscisse de : % ;
une estimation de m - l'abscisse de : %.
Si n est grand, on procède de même après regroupement en classes, par exemple :
[ 7500 ; 7700 ] [ 7700 ; 7800 ] [ 7800 ; 7900 ] [ 7900 ; 8000 ] [ 8000 ; 8100 ] [ 8100 ; 8200 ] [ 8200 ; 8300 ] [ 8300 ; 8600 ]
L'aspect concave de cet exemple vient de la dissymétrie de la distribution :
On verra plus loin comment tester précisément si cette dissymétrie est significative.
Autre exemple : on peut aussi déceler sur un graphique de Henry si une distribution est bimodale :