Contenu
Trouver la force de l'association entre deux variables est une compétence importante pour les scientifiques de tous types. Si deux variables sont corrélées l'une à l'autre, cela indique qu'il existe un lien entre elles. Une corrélation positive signifie que, lorsqu'une variable augmente, l'autre aussi. Une corrélation négative signifie que, lorsqu'une variable augmente, l'autre diminue. Les corrélations ne prouvent pas la causalité, bien qu'il soit possible que d'autres tests prouvent une relation de causalité entre les variables. Le coefficient de corrélation R montre la force de la relation entre les deux variables, et s’il s’agit d’une corrélation positive ou négative.
TL; DR (Trop long; n'a pas lu)
Appeler une variable X et une variable y. Calculer la valeur de R en utilisant la formule:
R = ÷ √ {}
Où n est la taille de votre échantillon.
Faites un tableau de vos données. Ceci devrait inclure une colonne pour le numéro de participant, une colonne pour la première variable (intitulée X) et une colonne pour la deuxième variable (intitulée y). Par exemple, si vous cherchez à savoir s’il existe une corrélation entre la taille et la taille de la chaussure, une colonne identifiera chaque personne que vous mesurez, une colonne indiquera la taille de chaque personne et une autre indiquera la taille de leur chaussure. Faites trois colonnes supplémentaires, une pour xy, un pour X2 et un pour y2.
Utilisez vos données pour remplir les trois colonnes supplémentaires. Par exemple, imaginez que votre première personne mesure 75 pouces de hauteur et 12 pieds. le X (hauteur) afficherait 75, et le y (taille de chaussure) la colonne afficherait 12. Vous devez trouver xy, X2 et y2. Donc, en utilisant cet exemple:
xy = 75 × 12 = 900
X2 = 752 = 5,625
y2 = 122 = 144
Effectuez ces calculs pour chaque personne pour laquelle vous disposez de données.
Créez une nouvelle ligne au bas de votre tableau pour les sommes de chaque colonne. Ajouter ensemble tous les X valeurs, tous les y valeurs, tous les xy valeurs, tous les X2 valeurs et tous les y2 valeurs, puis placez les résultats au bas de la colonne correspondante dans votre nouvelle ligne. Vous pouvez nommer votre nouvelle ligne «somme» ou utiliser un symbole sigma ().
Tu trouves R à partir de vos données en utilisant la formule:
R = ÷ √ {}
Cela semble un peu intimidant, vous pouvez donc le scinder en deux parties, que nous appellerons s et t.
s = n (Σxy) - (Σx) (y)
t = √ {}
Dans ces équations, n est le nombre de participants que vous avez (la taille de votre échantillon). Le reste des parties de l'équation sont les sommes que vous avez calculées à la dernière étape. Donc pour s, multipliez la taille de votre échantillon par la somme des xy colonne, puis soustrayez la somme des X colonne multipliée par la somme des y colonne de cela.
Pour t, il y a quatre étapes principales. Tout d'abord, calculer n multiplié par la somme de votre X2 colonne, puis soustrayez la somme de votre X colonne au carré (multipliée par elle-même) à partir de cette valeur. Deuxièmement, faire exactement la même chose mais avec la somme des y2 colonne et la somme des y colonne au carré à la place du X pièces (c.-à-d. n × y2 -). Troisièmement, multipliez ces deux résultats (pour le Xle sable ys) ensemble. Quatrièmement, prenez la racine carrée de cette réponse.
Si vous avez travaillé en plusieurs parties, vous pouvez calculer R aussi simplement R = s ÷ t. Vous obtiendrez une réponse comprise entre -1 et 1. Une réponse positive montre une corrélation positive, toute valeur supérieure à 0,7 étant généralement considérée comme une relation solide. Une réponse négative montre une corrélation négative, tout ce qui dépasse −0,7 étant considéré comme une relation fortement négative. De même, ± 0,5 correspond à une relation modérée et ± 0,3 à une relation faible. Tout ce qui est proche de 0 montre un manque de corrélation.