Statistique descriptive cours

Statistique descriptive cours

Statistique descriptive cours. C’est un cours complet sur les statistiques descriptives.

Population statistique / Caractère (Statistique descriptive cours)

Population statistique

Définition 1 La population statistique est l’ensemble qui fait l’objet de l’étude et chaque élément de cet ensemble est appelé ”individu” ou ” unité statistique ” .

Exemple 2 L’étude suivante donne une répartition de 10 élèves suivant le nombre de villes visitées par chacun d’eux :

5 − 4 − 3 − 1 − 1 − 2 − 4 − 5 − 4 − 4

Dans cet exemple la population statistique est l’ensemble des élèves.

Caractère

Définition 3 La caractère qu’on veut étudier chez une population statistique s’appelle ” le caractère ” ou ” la variable statistique ” . Le caractère peut être quantitatif ou qualitatif.

Types de caractères

Caractère quantitatif

Définition 4 Le caractère quantitatif est une caractère qui peut s’exprimer par des nombres, on distingue le caractère quantitatif discrète et le caractère quantitatif continu.

Caractère discret

Définition 5 Le caractère quantitatif discret est celui qui prend des valeurs isolées, comme le numéro du mois de naissance d’un élève par exemple.

Exemple 6 Si on étudie le nombre de frères et sœurs des élèves d’une classe, les modalités possibles seront : 0, 1, 2, 3, …cette série statistique à caractère discret.

Caractère continu

Définition 7 Le caractère quantitatif continu est celui qui prend des valeurs très proches, dans ce cas les valeurs du caractère sont rassemblées dans des intervalles qu’on appelle aussi ”classes” .

Exemple 8 Les vitesses de 150 voitures ont été détectées sur l’autoroute entre Rabat et Casa, on a obtenu le tableau suivant :

Vitesse[50, 70[[70, 90[[90, 110[[110, 130[[130, 150[
Nombres des voitures1040602515

Dans cet exemple la population statistique est l’ensemble des voitures, et le caractère : les vitesses de 150 voitures. (C’est un caractère quantitatif).

Caractère qualitatif

Définition 9 Le caractère qualitatif est un caractère qu’on ne peut pas associer à un ensemble numérique discret ou continu. On parle de caractère qualitatif quand ce caractère n’est pas chiffré (langue, préférence, secteur, couleur, …)

Effectif – Effectifs cumulés – Fréquences – Pourcentage (Statistique descriptive cours)

Effectif

Définition 10 L’effectif d’une donnée dans un relevé statistique correspond au nombre de fois ou la donnée apparait. L’effectif total correspond à la somme de tous les effectifs.

Exemple 11 Voici la liste des notes des élèves d’une classe du tronc commun science lors d’un devoir de mathématiques.

2 − 2 − 2 − 5 − 5 − 6 − 11 − 12 − 13 − 15 − 7 − 9 − 3 − 14

Les notes xi2356791112131415
Effectif ni31211111111

L’effectif total est : N = 3 + 1 + 2 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 = 14

Effectifs cumulés
Définition 12

Si dans une série statistique, les valeurs d’un caractère peuvent être ordonnées, l’effectif cumulé de la valeur x est la somme des effectifs de toutes les valeurs inférieures ou égales à x. Il s’agit ici d’effectif cumulé croissant, on pourrait de même définir un effectif cumulé décroissant en prenant la somme des effectifs de toutes les valeurs supérieurs ou égale à x.

Exemple 13

D’après l’exemple précédent on a :

Les notes xi2356791112131415
Effectif ni 31211111111
Effectif cumulé croissant Ni3467891011121314

Fréquence
Définition 14

La fréquence d’une valeur est le quotient de l’effectif de cette valeur par l’effectif total.

Statistique descriptive cours
Exemple 15

Dans l’exemple précédent on obtient le tableau suivant :

Les notes xi2356791112131415total
Effectif ni3121111111114
Fréquence ƒi3/141/142/141/141/141/141/141/141/141/141/141

Pourcentage
Définition 16

Le pourcentage relatif à la valeur \inline x_{i}~est~:p_{i}=f_{i}\times 100=\frac{n_{i}}{N}\times 100

Paramètres de position

Le mode
Définition 17

Le mode d’une série statistique (xi , ni)1≤i≤k c’est la valeur du caractère ou la classe correspondant au plus fort effectif.

Exemple 18 Dans l’exemple précédent le mode est la note 2.

La moyenne arithmétique
Définition 10

La moyenne d’une série statistique \inline (x_{i},n_{i})_{1\leq i\leq k} est le nombre réel noté \inline \bar{x} ou \inline m tel que :

Statistique descriptive cours

en fonction des fréquences, on obtient :

Statistique descriptive cours
Exemple 20

Dans l’exemple précédent la moyenne de la classe dans ce devoir est :

Statistique descriptive cours
Statistique descriptive cours
La médiane 
Définition 21

La médiane d’une série statistique notée Me est le nombre tel que 50% au moins des individus ont une valeur du caractère inférieure ou égale à ce nombre et 50% au moins des individus ont une valeur du caractère supérieure ou égale à ce nombre.

Exemple 22

Déterminer la médiane de la série statistique suivante : 2 − 2 − 2 − 5 − 6 − 7 − 7 − 8 − 8.

Cette série statistique contient 9 valeurs. Donc :

Statistique descriptive cours

L’effectif total est impair le médiane Me est la valeur située au milieu. Donc : Me = 6.

Exemple 23

Déterminer la médiane de la série statistique suivante : 3 − 5 − 5 − 6 − 7 − 8 − 8 − 9 − 9.

Statistique descriptive cours

Cette série statistique contient 10 valeurs. Donc :

L’effectif total est pair la médiane Me est la demi-somme des 2 valeurs situées au milieu.

Donc : \inline Me=\frac{7+8}{2}=7,5.

Remarque 24

On considère une liste de N données rangées par ordre croissant.

  • Si la série est de taille impair (N = 2n +1), la médiane est la donnée de rang n + 1.
  • Si la série est de taille pair (N = 2n), la médiane est la demi-somme des données de rang n et de rang n + 1.
Série statistique en classes

Lorsque les données d’une série sont trop nombreuses, on range ces données par intervalles appelés classes…

Si xi et xi+1 sont les valeurs de deux caractères de la série statistique, la classe correspondante est dite classe xi − xi+1 . Elle est notée [xi, xi+1[ . La valeur xi est incluse et xi+1 est une valeur exclue.

La moyenne arithmétique 

Soit (Ii, ni)1≤i≤k une série statistique en classes et N est l’effectif total et ci est le centre de l’intervalle Ii = [xi−1, xi[ . La moyenne arithmétique de cette série statistique est le nombre :

Statistique descriptive cours
Exemple 25

Soit la série statistique suivante :

Caractère Ii[0,10[[10, 20[[20, 30[[30, 40[[40, 50[
Effectifs ni13440385
Centre ci515253545

l’effectif total est : N = 13 + 4 + 40 + 38 + 5 = 100. Donc :

Statistique descriptive cours
Statistique descriptive cours
La médiane d’une série statistique en classes 

Soit (Ii, ni)1≤i≤k une série statistique en classes. On pose Ii = [ai−1, ai] et Ni l’effectif cumulé correspondant à la classe Ii et soit p un entier naturel tel que : Np−1 ≤ N/2 ≤ Np . La médiane de cette série statistique est le nombre Me qui appartient à la classe [ap−1, ap[ et on a :

Statistique descriptive cours
Exemple 26

Soit la série statistique suivante :

Classe Ii [0, 10[ [10, 20[ [20, 30[ [30, 40[ [40, 50[
Effectif ni13440385

Déterminer la médiane de cette série statistique.

On commence par ajouter une ligne pour les effectifs cumulés.

Classe Ii[0, 10[[10, 20[[20, 30[[30, 40[[40, 50[
Effectif ni13440385
Effectif cumulé Ni13175795100

On a : N = 100. Donc \inline \frac{N}{2}=50 et \inline 17\preceq 50\prec 57 de plus [ap−1, ap[ = [20, 30[ et comme  \inline N_{p}=57~et~N_{p-1}=17,~alors:Me\in [20, 30[.  

D’autre part, on sait que : \inline (Me-a_{p-1})(N_{p}-N_{p-1})=(\frac{N}{2}-N_{p-1})(a_{p}-a_{p-1}). Donc : 

Statistique descriptive cours

Paramètre de dispersion : Etendue, Ecart−moyen, Variance et Ecart−type

Etendue
Définition 27

C’est la différence entre les valeurs extrêmes.

Exemple 28

Dans l’exemple précédent les notes des élèves (paragraphe 3), on a 2 est la valeur minimale et 15 est la valeur maximale. Donc l’étendue est égale à : 15 − 2 = 13.

Ecart−moyen
Définition 29

Soit \inline (x_{i},n_{i})_{1\leq i\leq k} une série statistique et \inline \bar{x} sa moyenne arithmétique. L’écart-moyen est défini par : 

e=\frac{n_{1}\left | x_{1}-\bar{x} \right |+n_{2}\left |x_{2}-\bar{x} \right |+...+n_{k}\left | x_{k}-\bar{x} \right |}{N}
Remarque 30 

Pour faire le calcul de l’écart-type, on ajoute les lignes \inline \left | x_{i}-\bar{x} \right |  et \inline n_{i}\left | x_{i}-\bar{x} \right |  au tableau statistique.

Variance et écart-type
Définition 31

La variance V d’une série statistique de moyenne arithmétique \inline \bar{x} dont les valeurs du caractère sont \inline x_{1},x_{2},x_{3},...,x_{k} et les effectifs correspondants sont : \inline n_{1},n_{2},n_{3},...,n_{k} est égale à : 

V=\frac{n_{1}(x_{1}-\bar{x})^{2}+n_{2}(x_{2}-\bar{x})^{2}+...+n_{k}(x_{k}-\bar{x})^{2}}{N}

L’écart-type \inline \sigma d’un série statistique de variance V est égale à : \inline \sigma =\sqrt{V}

Remarque 32

L’écart-type exprime la dispersion des valeurs d’une série statistique autour de sa moyenne. Les valeurs extrêmes influencent l’écart-type.

Propriété 33

La variance d’une série statistique \inline (x_{i},n_{i})_{1\leq i\leq k}~est~:V=\frac{n_{1}x_{1}^{2}+n_{2}x_{2}^{2}+...+n_{k}+x_{k}^{k}}{N}-(\bar{x})^{2} tel que \inline \bar{x} est la moyenne arithmétique.

Exemple 34

Soit la série statistique suivante :

Caractère xi127
Effectif ni541
  • La moyenne arithmétique de cette série statistique :
\bar{x}=\frac{5\times 1+2\times 4+7\times 1}{5+4+1}=2
  • L’écart-moyen

On ajoute la ligne de \inline \left | x_{i}-\bar{x} \right | au tableau statistique.

Donc 

e=\frac{n_{1}\left | x_{1}-\bar{x} \right |+n_{2}\left | x_{2}-\bar{x} \right |+n_{3}\left | x_{3}-\bar{x} \right |}{N}=\frac{5\times 1+4\times 0+1\times 5}{10}=1
  • La variance 

V=\frac{n_{1}(x_{1}-\bar{x})^{2}+n_{2}(x_{2}-\bar{x})^{2}+n_{3}(x_{3}-\bar{x})^{2}}{N}=\frac{5\times 1+2\times 0+1\times 25}{10} = 3

  • L’écart-type

on a : \inline \sigma =\sqrt{V}=\sqrt{3.}

Représentation graphique des données statistiques

Variable discrète

Si l’on souhaite représenter les effectifs correspondant à une variable discrète, on obtient un diagramme en bâtons en portant, dans un repère orthogonal, les valeurs xi en abscisses, les effectifs ni en ordonnées. Le polygone des effectifs est la ligne polygonale obtenue en joignant les extrémités des bâtons ( à la règle ). Le polygone permet de visualiser plus facilement la variable discrète. On peut de la même façon représenter le diagramme en bâtons des effectifs cumulés croissantes ou décroissant ( ou des fréquences ), ainsi que les polygones correspondants.

Exemple 35

Dans une classe, les notes obtenues à un devoir de mathématiques sont :

Le diagramme à bâtons correspondant est :

On remplace parfois l’effectif par la fréquence, ce qui donne bien sûr le même aspect au diagramme.

Variable continue

On trace principalement des histogrammes, c’est-à-dire une suite de rectangles dont l’aire est proportionnelle à l’effectif. Dans la pratique, on porte en abscisses les classes, et en ordonnées les effectifs, si les classes ont même amplitudes. On trace alors des rectangles dont les bases représentent les amplitudes de la classe, et en hauteur l’effectif correspondant. La méthode est la même lorsqu’on représente les fréquences, les effectifs cumulés croissant ou décroissant (et les fréquences du même genre).

Exemple 36

Voici la répartition des tailles des enfants d’un club de sport.

Taille[130, 140[[140, 150[[150, 160[
Effectif4106

Les valeurs du caractère étudié (la taille) se présentent sous forme d’intervalles. On construit un histogramme avec :

  • Sur l’axe horizontal, les tailles.
  • Sur l’axe vertical, les effectifs.
  • Les hauteurs des barres sont proportionnelles aux effectifs représentés.

Cliquer ici pour télécharger Statistique Descriptive cours

Partager

Yahya Matioui

Titulaire d'un master en métiers d'enseignement de mathématiques et diplômé de l'Ecole Normale Supérieure de Rabat, a une longue expérience de l'enseignement des mathématiques notamment au lycée et dans les cursus supérieurs. Il est également auteur de nombreux ouvrages.

Voir tous les articles de Yahya Matioui →

Une réflexion sur « Statistique descriptive cours »

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.