Contenu
- TL; DR (Trop long; n'a pas lu)
- Points de données de commande
- Déterminer la position du premier quartile
- Déterminer la position du troisième quartile
- Calculer l'intervalle interquartile
- Avantages et inconvénients de l'IQR
L'intervalle interquartile, souvent abrégé en IQR, représente l'intervalle allant du 25e au 75e centile, ou le 50% du milieu, d'un ensemble de données donné. La plage interquartile peut être utilisée pour déterminer la plage moyenne de performances d'un test: vous pouvez l'utiliser pour voir où se situent les scores de la plupart des utilisateurs lors d'un test donné, ou pour déterminer le montant qu'un employé moyen d'une entreprise gagne chaque mois. . La plage interquartile peut constituer un outil d'analyse des données plus efficace que la moyenne ou la médiane d'un jeu de données, car elle vous permet d'identifier la plage de dispersion plutôt qu'un simple nombre.
TL; DR (Trop long; n'a pas lu)
L'intervalle interquartile (IQR) représente les 50% centraux d'un ensemble de données. Pour le calculer, commencez par classer vos points de données du plus petit au plus grand, puis déterminez vos positions de premier et troisième quartiles en utilisant les formules (N + 1) / 4 et 3 * (N + 1) / 4 respectivement, où N est le nombre. de points dans l'ensemble de données. Enfin, soustrayez le premier quartile du troisième quartile pour déterminer la plage interquartile de l'ensemble de données.
Points de données de commande
Le calcul de la plage interquartile est une tâche simple, mais avant de procéder au calcul, vous devez disposer les différents points de votre jeu de données. Pour ce faire, commencez par classer vos points de données du plus petit au plus grand. Par exemple, si vos points de données étaient 10, 19, 8, 4, 9, 12, 15, 11 et 20, vous les réorganiseriez comme suit: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Une fois que vos points de données ont été commandés de cette manière, vous pouvez passer à l’étape suivante.
Déterminer la position du premier quartile
Ensuite, déterminez la position du premier quartile en utilisant la formule suivante: (N + 1) / 4, où N est le nombre de points de l’ensemble de données. Si le premier quartile se situe entre deux nombres, prenez la moyenne des deux nombres comme score du premier quartile. Dans l'exemple ci-dessus, puisqu'il y a neuf points de données, vous ajouteriez 1 à 9 pour obtenir 10, puis divisez par 4 pour obtenir 2,5. Comme le premier quartile se situe entre les deuxième et troisième valeurs, vous prendriez la moyenne de 8 et 9 pour obtenir un premier quartile de 8,5.
Déterminer la position du troisième quartile
Une fois que vous avez déterminé votre premier quartile, déterminez la position du troisième quartile en utilisant la formule suivante: 3 * (N + 1) / 4, où N est à nouveau le nombre de points de l’ensemble de données. De même, si le troisième quartile se situe entre deux chiffres, prenez simplement la moyenne comme vous le feriez pour calculer le score du premier quartile. Dans l'exemple ci-dessus, puisqu'il y a neuf points de données, vous devez ajouter 1 à 9 pour obtenir 10, multiplier par 3 pour obtenir 30, puis diviser par 4 pour obtenir 7,5. Étant donné que le premier quartile se situe entre la septième et la huitième valeur, vous prendriez la moyenne de 15 à 19 pour obtenir un score de 17 au troisième quartile.
Calculer l'intervalle interquartile
Une fois que vous avez déterminé vos premier et troisième quartiles, calculez la plage interquartile en soustrayant la valeur du premier quartile de la valeur du troisième quartile. Pour terminer l'exemple utilisé au cours de cet article, vous devez soustraire 8,5 sur 17 pour constater que l'intervalle interquartile de l'ensemble de données est égal à 8,5.
Avantages et inconvénients de l'IQR
La plage interquartile présente l’avantage de pouvoir identifier et éliminer les valeurs aberrantes aux deux extrémités d’un jeu de données. IQR constitue également une bonne mesure de la variation dans les cas de distribution de données asymétrique, et cette méthode de calcul de l'IQR peut fonctionner pour des ensembles de données groupés, à condition que vous utilisiez une distribution de fréquence cumulative pour organiser vos points de données. La formule de la plage interquartile pour les données groupées est la même que pour les données non groupées, avec un IQR égal à la valeur du premier quartile soustraite de la valeur du troisième quartile. Cependant, il présente plusieurs inconvénients par rapport à l’écart type: une sensibilité moindre à quelques scores extrêmes et une stabilité d’échantillonnage moins forte que l’écart type.