Analyse des données collectées pour le lycée
Apprenez à analyser les données collectées avec ces exercices détaillés et corrigés. Idéal pour ceux qui cherchent à approfondir leurs compétences en statistiques.
Analyse des données collectées : statistiques des élèves au lycée
Dans ce contexte, un lycée a collecté des données sur les notes d'un examen de mathématiques pour une classe de 30 élèves. Les notes sont les suivantes :- 15, 17, 10, 18, 14, 12, 16, 18, 19, 20, 14, 10, 11, 15, 16, 10, 12, 14, 17, 18, 19, 20, 15, 14, 12, 10, 11, 17, 19, 16
Règles et méthodes statistiques
- Moyenne : $\bar{x} = \frac{\sum{x_i}}{n}$
- Mediane : valeur du milieu, ou moyenne des deux valeurs centrales
- Mode : valeur qui apparaît le plus fréquemment
- Écart-type : $s = \sqrt{\frac{\sum{(x_i - \bar{x})^2}}{n - 1}}$
Indications pour résoudre les questions
- Pour chaque valeur de note, commencez par les trier du plus bas au plus haut.
- Calculez la moyenne en ajoutant toutes les notes et en divisant par le nombre total d'élèves.
- Trouvez la médiane en identifiant la valeur centrale.
- Déterminez le mode en identifiant la valeur la plus récurrente.
Solutions détaillées aux questions
1. Calcul de la moyenne :
La somme des notes est $15 + 17 + 10 + 18 + 14 + 12 + 16 + 18 + 19 + 20 + 14 + 10 + 11 + 15 + 16 + 10 + 12 + 14 + 17 + 18 + 19 + 20 + 15 + 14 + 12 + 10 + 11 + 17 + 19 + 16 = 459$.
Le nombre total d'élèves est 30, donc :
$$\bar{x} = \frac{459}{30} = 15.3$$
2. Calcul de la médiane :
Les notes triées sont :
10, 10, 10, 10, 11, 11, 12, 12, 12, 14, 14, 14, 14, 15, 15, 15, 16, 16, 16, 17, 17, 17, 18, 18, 18, 19, 19, 19, 20, 20.
Étant donné que nous avons 30 notes (nombre pair), la médiane est la moyenne des 15e et 16e valeurs :
$$\text{Médiane} = \frac{15+16}{2} = 15.5$$
3. Calcul du mode :
Les valeurs et leur fréquence sont :
- 10 : 4 fois
- 11 : 2 fois
- 12 : 3 fois
- 14 : 4 fois
- 15 : 3 fois
- 16 : 3 fois
- 17 : 3 fois
- 18 : 3 fois
- 19 : 3 fois
- 20 : 2 fois
Il y a deux modes : 10 et 14, car ce sont les valeurs les plus fréquentes.
4. Calcul de l'écart-type :
Calcul de $s$ :
$$s = \sqrt{\frac{(10 - 15.3)^2 + (10 - 15.3)^2 + \ldots + (20 - 15.3)^2}{30 - 1}} = 2.67$$
Points clés à retenir sur l'analyse des données
- La moyenne est influencée par les valeurs extrêmes.
- La médiane est plus robuste face aux valeurs aberrantes.
- Le mode est utile pour la modalité des données.
- L'écart-type mesure la dispersion des données autour de la moyenne.
- Briser les données en sous-groupes peut révéler des tendances.
- Visualiser les données aide à mieux comprendre les distributions.
- Les histogrammes sont parfaits pour montrer la distribution des données.
- Les boîtes à moustaches (boxplots) aident à identifier les outliers.
- Le choix de la mesure statistique dépend du type de données.
- Les statistiques descriptives servent de base à l'analyse inférentielle.
Définitions des termes utilisés
- Moyenne : La somme des valeurs divisée par le nombre de valeurs.
- Médiane : La valeur centrale dans un ensemble de données ordonnées.
- Mode : La valeur la plus fréquente dans un ensemble de données.
- Écart-type : Mesure de dispersion qui indique combien les valeurs s'écartent de la moyenne.
- Statistiques descriptives : Méthodes pour résumer et décrire les caractéristiques d'un ensemble de données.
- Outlier : Une valeur qui se trouve en dehors de la plage des valeurs typiques.
- Histograma : Représentation graphique de la distribution des données.
- Boxplot : Un graphique qui montre la médiane, les quartiles et les outliers d'un ensemble de données.
- Fréquence : Nombre d'occurrences d'une valeur particulière dans un ensemble de données.
- Règles de trois : Méthode de calcul pour résoudre des problèmes de proportionnalités.