Contenu
Le chi carré, mieux connu sous le nom de test du chi-carré de Pearsons, est un moyen d'évaluer statistiquement des données. Il est utilisé lorsque les données catégoriques d'un échantillon sont comparées aux résultats attendus ou "vrais". Par exemple, si nous pensons que 50% de tous les bonbons dans une corbeille sont rouges, un échantillon de 100 haricots de cette corbeille devrait en contenir environ 50. Si notre nombre diffère de 50, le test de Pearsons nous indique si notre hypothèse de 50% est suspecte ou si nous pouvons attribuer cette différence à une variation aléatoire normale.
Interprétation des valeurs du chi carré
Déterminez les degrés de liberté de votre valeur chi-carré. Si vous comparez les résultats pour un seul échantillon avec plusieurs catégories, les degrés de liberté correspondent au nombre de catégories moins 1. Par exemple, si vous évaluiez la distribution des couleurs dans un pot de jellybeans et qu’il y avait quatre couleurs, les degrés de la liberté serait de 3. Si vous comparez des données tabulaires, les degrés de liberté sont égaux au nombre de lignes moins 1 multiplié par le nombre de colonnes moins 1.
Déterminez la valeur critique p que vous utiliserez pour évaluer vos données. Il s'agit du pourcentage de probabilité (divisé par 100) qu'une valeur de Khi-deux spécifique ait été obtenue par hasard. Une autre façon de penser à p est qu’il s’agit de la probabilité que vos résultats observés s’écartent des résultats attendus du montant qu’ils ont fait uniquement en raison d’une variation aléatoire du processus d’échantillonnage.
Recherchez la valeur p associée à votre statistique de test du chi carré à l'aide du tableau de distribution du chi carré. Pour ce faire, regardez le long de la ligne correspondant à vos degrés de liberté calculés. Trouvez la valeur de cette ligne la plus proche de votre statistique de test. Suivez la colonne qui contient cette valeur jusqu'à la rangée supérieure et lisez la valeur p. Si votre statistique de test se situe entre deux valeurs dans la première ligne, vous pouvez lire une valeur approximative de p intermédiaire entre deux valeurs de p dans la première ligne.
Comparez la valeur p obtenue à partir du tableau à la valeur critique p décidée précédemment. Si votre valeur p tabulaire est supérieure à la valeur critique, vous conclurez que tout écart entre les valeurs de catégorie d'échantillon et les valeurs attendues était dû à une variation aléatoire et n'était pas significatif. Par exemple, si vous choisissez une valeur critique p de 0,05 (ou 5%) et que vous trouvez une valeur tabulaire de 0,20, vous conclurez qu'il n'y a pas de variation significative.