Comment calculer une matrice de corrélation

Posted on
Auteur: John Stephens
Date De Création: 25 Janvier 2021
Date De Mise À Jour: 15 Peut 2024
Anonim
Comment calculer une matrice de corrélation - Science
Comment calculer une matrice de corrélation - Science

Contenu

La corrélation (r) est une mesure de la relation linéaire entre deux variables. Par exemple, la longueur des jambes et la longueur du torse sont fortement corrélées; la taille et le poids sont moins fortement corrélés, et la taille et la longueur du nom (en lettres) ne sont pas corrélées.


Une corrélation positive parfaite: r = 1. (Quand on monte, l'autre monte) Une corrélation négative parfaite: r = -1 (Quand on monte, l'autre descend) Aucune corrélation: r = 0 (Il n'y a pas de linéaire relation)

Une matrice de corrélation est une matrice de nombreuses corrélations.

Calcul d'une matrice de corrélation avec R

    Obtenez les données. Si vos données sont dans Excel, la méthode la plus simple consiste à les enregistrer au format .csv (dans Excel 7, cliquez sur "Fichier", puis "Enregistrer sous", puis "autres formats". Puis, dans "Type de fichier", faites défiler CSV (valeurs séparées par des virgules). Chaque ligne doit contenir des données sur un sujet et chaque colonne doit être une variable.

    Lisez les données dans R en utilisant read.csv. Par exemple, si vos données sont dans "c: mydisk mydir data.csv", entrez mydata <- read.csv ("c: /mydisk/mydir/data.csv").


    Calculez la matrice de corrélation à l'aide de cor (). Par exemple: cor (mydata). Vous pouvez également stocker la matrice de corrélation en tant qu'objet pour une utilisation ultérieure, à l'aide de: cormat <- cor (mydata).

Calcul d'une matrice de corrélation avec SAS

    Obtenez les données. SAS peut lire des données dans de nombreux formats. Si vous stockez vos données dans Excel, ayez un sujet sur chaque ligne et une variable dans chaque colonne.

    Lisez les données dans SAS. Vous pouvez utiliser l'assistant IMPORT pour obtenir vos données. Cliquez sur "Fichier", puis "Importer des données", puis choisissez un type de données en utilisant le menu déroulant. Cliquez sur "Suivant" et accédez à vos données, puis cliquez sur "Terminer".

    Calculez la matrice de corrélation. Si vos données sont enregistrées dans SAS en tant que mydata, avec les variables VAR1, VAR2 et VAR3, tapez: PROC CORR data = mydata; VAR var1 var2 var3; COURIR;


    Conseils

    Avertissements