I.2 - Test de Kolmogorov
I.2.1 - Cas d'une loi entièrement spécifiée, continue
Ce test est basé sur les résultats suivants :
La fonction de répartition empirique, Fn ( x ) d'un échantillon de loi F continue est telle que : suit une loi connue, qui ne dépend pas de F, et tabulée pour les petites valeurs de n. Pour n tendant vers l'infini, tend vers une loi connue.
La fonction de répartition empirique, Fn ( x ) d'un échantillon de loi F continue est telle que : suit une loi connue, qui ne dépend pas de F, et tabulée pour les petites valeurs de n.
Pour n tendant vers l'infini, tend vers une loi connue.
Le test de H0 : F = F0 , contre H1 : F ¹ F0 est basé sur la variable de décision
: écart maximal entre la fonction de répartition théorique et l'empirique.
La permet de conclure : on rejette H0 si Dn est supérieur à la valeur critique lue dans la table.
Application : ajustement à une loi uniforme.
On a noté l'heure d'arrivée de 10 clients dans une boutique, entre 9 h et 10 h (en minutes après 9 h) : peut-on considérer qu'il s'agit d'un échantillon de loi uniforme ? (on ne met pas en doute l'indépendance des arrivées).
Les valeurs obtenues sont :
La fonction de répartition de la loi uniforme sur [ 0 , 60 ] est :
pour 0 £ x £ 60
Dn =
La donne comme valeur critique :
pour a = 0.05 , Da = ;
pour a = 0.01 , Da =
Donc on l'hypothèse H0 selon laquelle les arrivées sont uniformes ?
- Il faut noter que pour ce type de test, non paramétrique, on ne peut pas calculer b, ni la puissance 1 - b, car H1 est trop vaste.
La comparaison de différents tests pour résoudre un même problème se fera à partir de calculs de puissances empiriques, vérifiés sur de nombreux exemples. Mais, comme toujours, la puissance d'un test est meilleure si n est grand.
- Si F0 dépend d'un (ou plus) paramètre(s), estimés sur l'échantillon, il existe des variantes du test de Kolmogorov, adaptées à chaque type de loi, notamment :
I.2.2 - Cas de la loi normale
m est estimé par , et par s .
On rejette l'hypothèse H0 selon laquelle X suit une loi N ( m , ) lorsque :
ici car on compare une courbe en escalier à une courbe continue :
Exemple du contenu des 16 bouteilles :
= cl
s = cl
Compléter le tableau :
75 75 75.3 75.5 75.6 75.8 75.8 75.9 76 76.1 76.1 76.2 76.3 76.4 77 77.2
-0.001 0.021 0.045 0.035 0.091 0.029 0.032 0.034 -0.029 -0.030 -0.035 -0.045 0.081 0.041
Au risque a = 0.05, peut-on dire que le contenu des bouteilles suit une loi normale ?
Remarque :
Un logiciel utilisé sur ces données pour le test de Kolmogorov nous donne une probabilité de dépassement p = 0.992, bien supérieure à 1 - a = 0.95.
On aboutit donc à la même conclusion.