Analyse des données collectées pour le lycée

Apprenez à analyser les données collectées avec ces exercices détaillés et corrigés. Idéal pour ceux qui cherchent à approfondir leurs compétences en statistiques.

Analyse des données collectées : statistiques des élèves au lycée

Dans ce contexte, un lycée a collecté des données sur les notes d'un examen de mathématiques pour une classe de 30 élèves. Les notes sont les suivantes :
  • 15, 17, 10, 18, 14, 12, 16, 18, 19, 20, 14, 10, 11, 15, 16, 10, 12, 14, 17, 18, 19, 20, 15, 14, 12, 10, 11, 17, 19, 16
Basé sur ces données, répondez aux questions suivantes :

Règles et méthodes statistiques

  • Moyenne : $\bar{x} = \frac{\sum{x_i}}{n}$
  • Mediane : valeur du milieu, ou moyenne des deux valeurs centrales
  • Mode : valeur qui apparaît le plus fréquemment
  • Écart-type : $s = \sqrt{\frac{\sum{(x_i - \bar{x})^2}}{n - 1}}$

Indications pour résoudre les questions

  • Pour chaque valeur de note, commencez par les trier du plus bas au plus haut.
  • Calculez la moyenne en ajoutant toutes les notes et en divisant par le nombre total d'élèves.
  • Trouvez la médiane en identifiant la valeur centrale.
  • Déterminez le mode en identifiant la valeur la plus récurrente.

Solutions détaillées aux questions

1. Calcul de la moyenne :

La somme des notes est $15 + 17 + 10 + 18 + 14 + 12 + 16 + 18 + 19 + 20 + 14 + 10 + 11 + 15 + 16 + 10 + 12 + 14 + 17 + 18 + 19 + 20 + 15 + 14 + 12 + 10 + 11 + 17 + 19 + 16 = 459$.

Le nombre total d'élèves est 30, donc :

$$\bar{x} = \frac{459}{30} = 15.3$$

2. Calcul de la médiane :

Les notes triées sont :

10, 10, 10, 10, 11, 11, 12, 12, 12, 14, 14, 14, 14, 15, 15, 15, 16, 16, 16, 17, 17, 17, 18, 18, 18, 19, 19, 19, 20, 20.

Étant donné que nous avons 30 notes (nombre pair), la médiane est la moyenne des 15e et 16e valeurs :

$$\text{Médiane} = \frac{15+16}{2} = 15.5$$

3. Calcul du mode :

Les valeurs et leur fréquence sont :

  • 10 : 4 fois
  • 11 : 2 fois
  • 12 : 3 fois
  • 14 : 4 fois
  • 15 : 3 fois
  • 16 : 3 fois
  • 17 : 3 fois
  • 18 : 3 fois
  • 19 : 3 fois
  • 20 : 2 fois

Il y a deux modes : 10 et 14, car ce sont les valeurs les plus fréquentes.

4. Calcul de l'écart-type :

Calcul de $s$ :

$$s = \sqrt{\frac{(10 - 15.3)^2 + (10 - 15.3)^2 + \ldots + (20 - 15.3)^2}{30 - 1}} = 2.67$$

Points clés à retenir sur l'analyse des données

  • La moyenne est influencée par les valeurs extrêmes.
  • La médiane est plus robuste face aux valeurs aberrantes.
  • Le mode est utile pour la modalité des données.
  • L'écart-type mesure la dispersion des données autour de la moyenne.
  • Briser les données en sous-groupes peut révéler des tendances.
  • Visualiser les données aide à mieux comprendre les distributions.
  • Les histogrammes sont parfaits pour montrer la distribution des données.
  • Les boîtes à moustaches (boxplots) aident à identifier les outliers.
  • Le choix de la mesure statistique dépend du type de données.
  • Les statistiques descriptives servent de base à l'analyse inférentielle.

Définitions des termes utilisés

  • Moyenne : La somme des valeurs divisée par le nombre de valeurs.
  • Médiane : La valeur centrale dans un ensemble de données ordonnées.
  • Mode : La valeur la plus fréquente dans un ensemble de données.
  • Écart-type : Mesure de dispersion qui indique combien les valeurs s'écartent de la moyenne.
  • Statistiques descriptives : Méthodes pour résumer et décrire les caractéristiques d'un ensemble de données.
  • Outlier : Une valeur qui se trouve en dehors de la plage des valeurs typiques.
  • Histograma : Représentation graphique de la distribution des données.
  • Boxplot : Un graphique qui montre la médiane, les quartiles et les outliers d'un ensemble de données.
  • Fréquence : Nombre d'occurrences d'une valeur particulière dans un ensemble de données.
  • Règles de trois : Méthode de calcul pour résoudre des problèmes de proportionnalités.