Que sont les lacunes, les groupes et les valeurs aberrantes en maths?

Posted on
Auteur: Louise Ward
Date De Création: 11 Février 2021
Date De Mise À Jour: 19 Novembre 2024
Anonim
Statistiques pour l’économie L3 - TD 1 exercice 5
Vidéo: Statistiques pour l’économie L3 - TD 1 exercice 5

Contenu

Les activités commerciales, gouvernementales et universitaires nécessitent presque toujours la collecte et l'analyse de données. L'un des moyens de représenter des données numériques consiste à utiliser des graphiques, des histogrammes et des graphiques. Ces techniques de visualisation permettent aux utilisateurs de mieux comprendre les problèmes et de trouver des solutions. Les lacunes, les groupes et les points aberrants sont les caractéristiques des ensembles de données qui influencent l'analyse mathématique et sont facilement visibles sur les représentations visuelles.


Trous dans les données

Les espaces font référence aux zones manquantes dans un ensemble de données. Par exemple, si une expérience scientifique recueille des données de température comprises entre 50 et 100 degrés Fahrenheit, mais rien entre 70 et 80 degrés, cela constituerait un vide dans l'ensemble de données. Un tracé linéaire de cet ensemble de données aurait des marques "x" pour des températures comprises entre 50 et 70 et encore entre 80 et 100, mais il n'y aurait rien entre 70 et 80. Les chercheurs peuvent aller plus en profondeur et explorer pourquoi certains points de données ne sont pas visibles. dans un échantillon collecté.

Groupes isolés

Les clusters sont des groupes isolés de points de données. Les tracés linéaires, qui sont l’un des moyens de représenter les ensembles de données, sont des lignes avec des marques "x" placées au-dessus de nombres spécifiques pour décrire leur fréquence d’apparition dans l’ensemble de données. Un cluster est décrit comme une collection de ces marques "x" dans un petit intervalle ou un sous-ensemble de données. Par exemple, si les notes d’examen pour une classe de 10 étudiants sont 74, 75, 80, 72, 74, 75, 76, 86, 88 et 73, le plus grand nombre de "x" points sur un tracé linéaire se trouverait dans les 72- à 76 intervalle de score. Cela représenterait un cluster de données. Notez que la fréquence pour 74 et 75 est deux, mais pour tous les autres scores, c'est un.


Aux extrêmes

Les valeurs aberrantes sont des valeurs extrêmes - les points de données qui se situent nettement en dehors des autres valeurs d'un jeu de données. Une valeur aberrante doit être nettement inférieure ou supérieure à la majorité des nombres d'un ensemble de données. La définition du terme "extrême" dépend des circonstances et du consensus des analystes impliqués dans la recherche. Les valeurs aberrantes peuvent être de mauvais points de données, également appelés bruit, ou peuvent contenir des informations précieuses sur le phénomène étudié et sur la méthode de collecte de données elle-même. Par exemple, si les scores de la classe se situent généralement dans la fourchette des 70 à 80, mais que quelques scores se situent dans la tranche basse des 50, ceux-ci pourraient représenter des valeurs aberrantes.


Mettre tous ensemble

Les lacunes, les valeurs aberrantes et les grappes dans les ensembles de données peuvent avoir une incidence sur les résultats de l'analyse mathématique. Les lacunes et les grappes peuvent représenter des erreurs dans la méthodologie de collecte de données. Par exemple, si une enquête téléphonique interroge uniquement certains indicatifs régionaux, tels que les complexes de logements à faible revenu ou les zones résidentielles de banlieue haut de gamme, et non un large échantillon de la population, il y a des chances qu'il y ait des lacunes et des grappes dans les données. . Les valeurs aberrantes peuvent biaiser la valeur moyenne ou moyenne d'un ensemble de données. Par exemple, la moyenne ou la valeur moyenne d'un ensemble de données composé de quatre nombres - 50, 55, 65 et 90 - est 65. Sans la valeur aberrante 90, la moyenne est d'environ 57.