Exercice 1 : L'Afrique
Le tableau "Afrique" donne un certain nombre de renseignements sur 38 pays d'Afrique pour lesquels ces données sont disponibles.
1) Quels sont ici les individus statistiques ?
Combien de caractères a-t-on noté sur ces individus ?
Combien y-a-t-il de variables :
2) Remplir le tableau ci-dessous en ce qui concerne le PNB pour 1997 (trier d'abord). Chaque bouton vous permet d'obtenir ses valeurs triées par ordre croissant ou alphabétique.
Quel histogramme vous semble le plus juste pour représenter ces valeurs ?
Quel est le pourcentage de pays dont le PNB est inférieur à 1 000 ?
Quel est le pourcentage de pays dont le PNB est supérieur à 600 ?
3) Toujours pour le PNB de 1997, déterminer la médiane :
Q2 =
Et les quartiles :
Q1 =
Q3 =
Y-a-t-il des données statistiquement "aberrantes" ?
Faites les mêmes calculs pour le PNB de 1996
Donner par ordre croissant les PNB les plus "aberrants " :
Parmi les présentations ci-contre, laquelle vous paraît juste pour comparer le PNB en 96 et en 97 ?
Pourrait-on pour cela utiliser un nuage de points ?
4) Les nuages de points ci-contre représentent l'espérance de vie Y en fonction du PNB 97, X, puis de la fécondité Z.
Le coefficient de corrélation r ( X , Y )
est-il proche de 1 ?
est-il positif ?
Le coefficient de corrélation r ( Y , Z )
est-il égal à r ( Z , Y ) ?
A partir des calculs intermédiaires ci-dessous, déterminer ces coefficients de corrélation :
r ( X , Y ) =
r ( Y , Z ) =
Peut-on en déduire qu'avoir beaucoup d'enfants fait mourir plus jeune ?
5) L'histogramme ci-contre vous paraît-il correct ?
Pensez-vous que la "région" puisse "expliquer" une part non négligeable de la variance de "espérance de vie" ?
Pour la région (a), soit na = 8 pays, la moyenne de l'espérance de vie est
a = ans
avec un écart-type de sa = ans
Pour la région (n), soit nb = 4 pays, la moyenne est de :
n = ans
avec un écart-type
de sn = ans
On rappelle que l'espérance de vie moyenne, sur les 38 pays considérés, est de 52.8132, avec un écart-type de 8.0381 (ans).
Calculer la variance de Y (espérance de vie) :
La variance expliquée par R (région) :
La variance résiduelle :
Le rapport de corrélation :
e²Y/R =