Olivier DAVID

Enseignement

Mathématiques > Troisième Générale

Séquence n°5

Représentation et traitement de données

I) Mise en situation

Notre société et notre mode de communication sont de plus en plus envahis par des informations numériques ou dites « chiffrées ». Le principal exemple donné est la presse (télévision; journaux ou Internet). Il ne se passe pas une seule journée sans qu'on nous donne des pourcentages ou des quantités sur les sujet les plus divers (politiques, élections, maladies, chomage, énergie, pollution, réussites et échec, etc ...

Il devient alors important de bien savoir lire, interpréter et analyser toutes ces données car des décisions et des choix peuvent en sortir. Ce n'est certes pas avec cette séquence que nous réussirons à traduire et analuser toutes les données reçues mais nous allons commencer à les interpréter par le biais de premiers calculs et de représentations graphiques.

Commençons par travailler sur l'activité suivante : activité n°5

II) Rappels sur le vocabulaire utilisés en statistique

Le domaine des staitistiques regorge de nombreux mots de vocabulaire dont il est important d'en connaitre la signification.

1) La population

La population est l'ensemble des individus ou objets, interrogés ou mesurés.

2) L'échantillon

L'échantillon est une partie de la population. Souvent, les individus et les objets sont inaccessibles. Par conséquent, on procède à un échantillonnage pour récupérer quelques données.

A titre d'exemple, si nous souhaitons mesurer la circonférence à un mètre du sol de tous les arbres de la forêt de Chantilly, le travail devient fastidieux voir impossible. On procède alors à une partie de la forêt, ou plusieurs parties, que l'on appelle alors un échantillon.

3) Le caractère d'étude

Le caractère d'étude est le thème étudié, la grandeur qui est mesurée ou calculée. Dans l'exemple des arbres, le caractère d'étude est la circonférence en mètre.

4) La modalité

La modalité est la valeur mesurée du caractère d'étude. Si dans une classe, on mesure l'âge de chaque élève, le caractère d'étude est l'âge et le résultat des mesures sont appelées les modalités (Dans une classe de troisème, on trouvera généralement les modalités 13 ans, 14 ans, 15 ans ou 16 ans)

La modalité peut être qualitative ou quantitative. La modalité quantitative peut être quantifiée alors que la modalité qualitative ne le peut pas.

Si l'étude porte sur l'âge des élèves, alors les modalités sont quantitatives : on peut compter le nombre d'année des élèves depuis leur naissances.

Si l'étude porte sur leur orientation : bac professionnel, bac technologique ou bac général, alors on ne peut pas compter les modalités et elles sont dites qualitatives.

5) L'effectif

L'effectif est la quantité de mesures effectuées pour chaque modalité. Dans la classe, si sept élèves sont âgés de 14 ans, l'effectif pour la modalité 14 est 7.

La somme total des effectifs est appelé l'effectif total et est généralement représentée par la lettre \( \displaystyle N \).

6) La fréquence

La fréquence est le rapport établi entre l'effectif d'une modalité et l'effectif total. La fréquence notée \( \displaystyle f \) pour une modalité se calcule par \( \displaystyle f=\frac{n}{N} \) où \( \displaystyle n \) est l'effectif de la modalité et \( \displaystyle N \) l'effectif total.

III) Rappels sur les paramètres de position

Comme son nom l'indique, le paramètre de position permet de se positionner parmi les données statistiques. Il permet de résumer en une seule valeur, toutes les données.

1) La moyenne

La moyenne est définie selon la pondération des valeur. Une valeur est dite pondérée lorsqu'elle est affectée d'un coefficient, d'un « poids ».

Définition : La moyenne d'une série de modalités non pondérées est le nombre égal à la somme des modalités de la série divisée par l'effectif total de la série.

Exemple : En considérant 3 modalités \( \displaystyle x_1\), \( \displaystyle x_2 \) et \( \displaystyle x_3 \) non pondérées, la moyenne notée \( \displaystyle m \) se calcule par \( \displaystyle m=\frac{x_1+x_2+x_3}{3} \).

Définition : La moyenne d'une série de modalités pondérées est le nombre égal à la somme des modalités de la série multipliées. par leur pondération, le tout divisé par l'effectif total de la série (ou la pondération).

Exemple : En considérant 3 modalités 3 modalités \( \displaystyle x_1\), \( \displaystyle x_2 \) et \( \displaystyle mx_3 \) pondérées respectivement par \( \displaystyle n_1\), \( \displaystyle n_2 \) et \( \displaystyle n_3 \), la moyenne notée \( \displaystyle m \) se calcule par \( \displaystyle m=\frac{n_1x_1+n_2x_2+n_3x_3}{n_1+n_2+n_3} \).

2) La médiane

La médiane est définie de la façon suivante :

Définition : La médiane d'une série de modalités est une valeur telle qu'il y a au moins la moitié des valeurs inférieures ou égales à cette médiane et au moins la moitié des valeurs supérieures ou égales à cette médiane.

Le calcul de la médiane dépend de l'effectif \(\displaystyle N\) de la série. Les modalités doivent d'abord être rangées dans l'ordre croissant.

- Si \( \displaystyle N \) est pair, en prenant par exemple \(\displaystyle N=8\), on effectue la moyenne de la modalité de rang 4 et la modalité de rang 5.

- Si \( \displaystyle N \) est impair, en prenant par exemple \(\displaystyle N=9\), la médiane est la modalité au rang 5.

Exemple 1 : Prenons la série de nombres : 7 ; 18 ; 12 ; 11 ; 9 ; 11 ; 17 ; 18. Pour calculer la médiane, on range dans l'ordre les modalités : 7 ; 9 ; 11 ; 11 ; 12 ; 17 ; 18 ; 18. Comme l'effectif total est paire, on repère les deux modalités du milieu, à savoir 11 et 12. On effectue la moyenne est on obtient une médiane égale à 11,5.

Exemple 2 : Prenons la série de nombres : 10 ; 11 ; 14 ; 13 ; 12 ; 13 ; 12 ; 10 ; 8. Pour calculer la médiane, on range dans l'ordre les modalités : 8 ; 10 ; 10 ; 11 ; 12 ; 12 ; 13 ; 13 ; 14. Comme l'effectif total est impaire, on repère la modalité du milieu, à savoir 12. La médiane est égale à 12.

IV) Les paramètres de dispersion

Les paramètres de dispersion vont donner un aperçu des écarts qui existent entre les valeurs.

1) L'étendue

L'étendue est définie de la façon suivante :

Définition : L'étendue d'une série de modalités est la différence entre la plus grande valeur et la plus petite valeur de cetet série. Si \(\displaystyle E\) est cette étendue, alors on a \( \displaystyle E=\text{max}\left(x\right)-\text{min}\left(x\right) \)

2) La variance

La variance permet de mesurer la variablilité d'un phénomène. Elle est hors programme.

2) L'écart-type

L'écart type est aussi hors programme. La variance est un paramètre qui est mis au carré. Avec des valeurs de masses, on obtiendrait des kg2, ce qui n'a aucun sens. On utilise alors la racine carré de la variance pour nous ramener à l'unité kg : c'est ce qu'on appelle l'écart-type.