I.2 - Test de Kolmogorov

I.2.1 - Cas d'une loi entièrement spécifiée, continue

Ce test est basé sur les résultats suivants :

La fonction de répartition empirique, Fn ( x ) d'un échantillon de loi F continue est telle que : suit une loi connue, qui ne dépend pas de F, et tabulée pour les petites valeurs de n.

Pour n tendant vers l'infini, tend vers une loi connue.

Le test de H0 : F = F0 , contre H1 : F ¹ F0 est basé sur la variable de décision

: écart maximal entre la fonction de répartition théorique et l'empirique.

La permet de conclure : on rejette H0 si Dn est supérieur à la valeur critique lue dans la table.

Application : ajustement à une loi uniforme.

On a noté l'heure d'arrivée de 10 clients dans une boutique, entre 9 h et 10 h (en minutes après 9 h) : peut-on considérer qu'il s'agit d'un échantillon de loi uniforme ? (on ne met pas en doute l'indépendance des arrivées).

Les valeurs obtenues sont :

13 14 22 27 33
37 41 42 50 58

La fonction de répartition de la loi uniforme sur [ 0 , 60 ] est :

pour 0 £ x £ 60

Dn =

 

La donne comme valeur critique :

pour a = 0.05 , Da = ;

pour a = 0.01 , Da =

Donc on l'hypothèse H0 selon laquelle les arrivées sont uniformes ?

- Il faut noter que pour ce type de test, non paramétrique, on ne peut pas calculer b, ni la puissance 1 - b, car H1 est trop vaste.

La comparaison de différents tests pour résoudre un même problème se fera à partir de calculs de puissances empiriques, vérifiés sur de nombreux exemples. Mais, comme toujours, la puissance d'un test est meilleure si n est grand.

- Si F0 dépend d'un (ou plus) paramètre(s), estimés sur l'échantillon, il existe des variantes du test de Kolmogorov, adaptées à chaque type de loi, notamment :

I.2.2 - Cas de la loi normale

m est estimé par , et par s .

On rejette l'hypothèse H0 selon laquelle X suit une loi N ( m , ) lorsque :

Dn > 0.895 au seuil a = 0.05
ou > 1.035 au seuil a = 0.01

ici car on compare une courbe en escalier à une courbe continue :

Exemple du contenu des 16 bouteilles :

= cl

s = cl

Compléter le tableau :

xi i Fn (xi) = i/n F(xi) = P((xi - )/s) F( xi) - i/n F(xi) - (i-1)/n

75
75
75.3
75.5
75.6

75.8
75.8
75.9
76
76.1
76.1
76.2
76.3
76.4
77
77.2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
0.0625
0.125
0.1875
0.25
0.3125
0.375
0.4375


0.5625
0.625
0.6875
0.75
0.8125
0.875
0.9375
1
0.062
0.062
0.146
0.233
0.285
0.404
0.404


0.532
0.596
0.596
0.657
0.715
0.767
0.956
0.979
-0.001
-0.063
-0.042
-0.017
-0.027
0.029
-0.034


-0.030
-0.029
-0.091
-0.093
-0.098
-0.108
0.018
-0.021


-0.001
0.021
0.045
0.035

0.091
0.029


0.032
0.034
-0.029
-0.030
-0.035
-0.045
0.081
0.041

Dn =

Dn =

Au risque a = 0.05, peut-on dire que le contenu des bouteilles suit une loi normale ?

Remarque :

Un logiciel utilisé sur ces données pour le test de Kolmogorov nous donne une probabilité de dépassement p = 0.992, bien supérieure à 1 - a = 0.95.

On aboutit donc à la même conclusion.