Estimation d'une moyenne et d'un écart-type

Comment, à partir de moyenne et écart-type calculés sur un échantillon, estimer au mieux m et dans la population, et quelle est la précision de cette estimation ?

Exemple 1 : pour étudier la solidité de câbles métalliques fabriqués selon un certain procédé, on mesure la charge de rupture de n câbles choisis au hasard.

Les calculs de et s (moyenne et écart-type dans l'échantillon) vont permettre de construire un intervalle de confiance contenant la charge de rupture moyenne avec une probabilité de 0.95 par exemple.

Nous verrons que dans ce cas on calcule les bornes de l'intervalle de confiance au moyen de la formule :

1.96

Voyons concrètement ce que pourrait donner l'application de cette formule si la charge de rupture (en kg) suivait une loi N ( 8 000 ; 150 ) : simulez plusieurs tirages d'échantillons.

Dans 95 % des cas, la "vraie" valeur (inconnue en principe) 8 000 se trouve dans l'intervalle calculé à partir de l'échantillon.

Vous pouvez aussi constater qu'en augmentant n, l'intervalle se resserre, autour de 8 000 dans 95 % des cas.

Exemple 2 : pour étudier le poids moyen des enfants de 10 ans, et la variabilité de ce poids, on en pèse n (par exemple ici n = 100), et on peut en déduire des intervalles de confiance.

- Pour le poids moyen m

- Pour l'écart-type du poids

Ceci à l'aide de formules que nous établirons dans cette leçon.

Voici ce que pourrait donner sur plusieurs échantillons l'application de ces formules :

Si on augmentait la taille n de l'échantillon, pensez-vous que l'on aurait pour m un intervalle

?

Nous verrons aussi comment résoudre le problème suivant : quelle est la valeur minimale de n qui nous permette d'estimer le poids moyen à 1 kg près, par exemple, lorsque est connu ? (pour un niveau de confiance donné).

La méthode générale est la même pour estimer le rendement moyen d'une variété de blé cultivée dans certaines conditions, le salaire moyen des employés d'un secteur industriel, le taux moyen de glucose dans le sang de personnes en bonne santé, etc...

Dans un premier temps nous nous intéresserons aux estimations ponctuelles de m et de ;

dans un second temps aux estimations par intervalle,

puis à la recherche de la valeur de n mimimum pour atteindre un objectif fixé.

Tout ceci sera fait essentiellement dans le cadre d'un tirage aléatoire simple, indépendant, dans une population gaussienne (de loi normale).

Développement