Tout ensemble de données accumulé à des fins statistiques, telles que les données de recensement des États-Unis, contient des informations nécessitant une addition et une agrégation. Il est presque impossible d'énumérer les attributs, par exemple, en tant que revenus individuels et tailles de famille. Les statisticiens utilisent des graphiques de distribution de fréquence pour représenter les données de manière complète. Par exemple, un histogramme divise les données en intervalles de classe et compte la fréquence à laquelle tous les membres appartenant à cet intervalle de classe se produisent.Bien qu'il n'y ait pas de règles strictes sur la manière de calculer la taille et le nombre d'intervalles de classe, il existe quelques critères conventionnels utiles.
Calculez la plage de données, c’est-à-dire la différence entre les points de données le plus élevé et le plus bas. Par exemple, supposons que la personne la mieux payée aux États-Unis gagne 30 milliards de dollars par an et la plus basse gagne zéro. La fourchette est égale à 30 - 0, ce qui équivaut à 30 milliards de dollars.
Déterminez le nombre de classes à partir de la taille de l'échantillon. En règle générale, cinq à sept classes sont utilisées pour des échantillons allant jusqu'à 50, huit à 10 classes pour des échantillons compris entre 50 et 100, 10 à 15 classes pour des échantillons compris entre 100 et 250 et 15 à 20 classes pour des échantillons plus petits. plus de 250.
Calculez l'intervalle de classe à l'aide de la formule suivante: Intervalle de classe = plage nombre de classes. Si vous avez 15 classes de revenus dans l'exemple de répartition des revenus, calculez 30 15 = 2 milliards de dollars. Souvent, les statisticiens ignorent les valeurs extrêmement hautes et basses et se concentrent sur les fréquences moyennes. Pour cette raison, la répartition du revenu aux États-Unis est présentée par intervalles de 10 000 dollars, avec des revenus supérieurs à un certain chiffre, généralement un million, regroupés dans un seul intervalle de classe.
Utilisez votre discrétion pour calculer l'intervalle de classe. Le Saint Graal d’un graphique, tel qu’un histogramme, consiste à transmettre des informations pertinentes de manière simple et significative. Choisissez vos intervalles de classe pour transmettre les informations que vous jugez dignes d'attirer l'attention des lecteurs.