II.2 - Variable Quantitative

Dans le cas d'une variable quantitative, les valeurs observées, numériques, seront toujours placées selon un axe, en suivant une échelle précise.

II.2.1 - Le cas des séries chronologiques est particulier : l'ordre des individus étant primordial, on n'effectue pas de tri à plat, et on représente directement les données brutes en ordonnée, l'échelle du temps étant placée en abscisse. Le temps étant continu, on relie par des segments de droite les points obtenus.

Si un phénomène saisonnier apparaît (même type de variations d'année en année par exemple), il est possible de superposer plusieurs graphiques, ou de les remplacer par des moyennes.

II.2.2 - Pour une variable discrète, après un tri à plat conduisant à la distribution observée, on représente celle-ci par un diagramme en bâtons les xi sont placés suivant une échelle sur l'axe des abscisses, et les effectifs ni sont matérialisés par un "bâton" de longueur ni(axe des ordonnées).
Nombre d'enfants xi Effectifs ni Fréquences fi
0 6 0.33
1 4 0.22
2 5 0.28
3 2 0.11
4 1 0.06
Total : 18 1

Le fait d'avoir des "bâtons" séparés les uns des autres permet de voir l'aspect ponctuel et discontinu des valeurs de la variable sur lesquelles l'effectif total est réparti.

Chaque individu est représenté par un segment de longueur 1 unité.

Si on place en ordonnée les fréquences fi au lieu des ni, aura-t-on le même graphique ?

En fait, on verra leçon 4 que la représentation des fréquences est utile surtout pour comparer plusieurs séries d'effectif total différent, ainsi que pour comparer une distribution observée à une distribution "théorique" (voir le module VARIABLES ALEATOIRES)

Nombre d'enfants xi Effectifs ni Effectifs cumulés croissants Ni Effectifs cumulés décroissants N'i
0 6 6 18
1 4 10 12
2 5 15 8
3 2 17 3
4 1 18 1

On appelle courbe cumulative croissante le tracé de la fonction N qui à tout x réel associe
N( x ) = nombre d'observations ≤ x.

Pour l'exemple ci-contre :

N ( 2 ) = 15
N ( 3 ) = 17
N ( 2.5 ) =

Si x est < 0,

N ( x ) =
N ( 0 ) =
N ( 0.3 ) =
N ( 1 ) =
N ( 1.5 ) =
Si 0 ≤ x < 1 , N( x ) = 6
Si 1 ≤ x < 2 , N ( x ) =
Si 2 ≤ x < 3 , N ( x ) = 15
Si 3 ≤ x < 4 , N ( x ) = 17
Si x ≥ 4 , N ( x ) =

Plus généralement, pour toute variable discrète de distribution ( xi , ni ) i = 1 , ... , K, la courbe cumulative croissante est une fonction "en escalier" (constante par morceaux), croissante de 0 à n telle que :

N ( x ) = 0 si x < x1 , N ( x ) = Ni si xix < xi+1 ,

N ( x ) = n si xkx

 

De même la courbe cumulative décroissante est le tracé de la fonction N' qui a tout x associe N' ( x ) = nombre d'observations > x .

Y a-t-il une relation entre N et N' ?

Nombre d'enfants xi Effectifs ni Effectifs cumulés croissants Ni Effectifs cumulés décroissants N'i
0 6 6 18
1 4 10 12
2 5 15 8
3 2 17 3
4 1 18 1

Pour l'exemple ci-dessus :

Si x est < 0 , N' ( x ) =

Si 0 ≤ x < 1, N' ( x ) =

Si 1 ≤ x < 2 , N'( x ) = 8

Si 2 ≤ x < 3 , N'( x ) =

Si 3 ≤ x < 4 , N' ( x ) = 1

Si 4 ≤ x , N' ( x ) = 0

Plus généralement, c'est une fonction "en escalier", décroissante de n à 0, telle que

N' ( x ) = n - N ( x )

Les ordonnées des "marches d'escalier" sont les effectifs cumulés décroissants.

Les 2 courbes cumulatives sont-elles symétriques ?

On peut de même représenter les fréquences cumulées croissantes et décroissantes :
F(x) = proportion d'observations ≤ x = est appelée aussi fonction de répartition (empirique)

Nombre d'appels Fréquences en % Fréquences cumulées croissantes Fréquences cumulées décroissantes
0 2.08 2.08 100
1 14.58 16.66 97.92
2 23.96 40.62 83.34
3 25.00 65.62 59.38
4 18.75 84.37 34.38
5 9.38 93.75 15.63
6 6.25 100 6.25

Soit le tracé, en fréquences, des courbes cumulatives associées au nombre d'appels téléphoniques.

Quel est le % de jours où le nombre d'appels a été inférieur à 3 ?

%

Quel est le % de jours où le nombre a été supérieur à 3 ?

%

F est-elle toujours croissante, de 0 à 1 ?

Les 2 courbes sont symétriques par rapport à un axe d'ordonnée  

 

Ici aussi, il est équivalent de représenter les effectifs ou les fréquences cumulés (à un changement d'échelle près),

mais le tracé en fréquences permet de comparer plusieurs distributions.