Comment calculer une matrice de corrélation

La corrélation (r) est une mesure de la relation linéaire entre deux variables. Par exemple, la longueur des jambes et de la longueur du torse sont très correlated- hauteur et le poids sont moins fortement corrélés, et la hauteur et la longueur du nom (en lettres) sont corrélées.


Sommaire

  • Le calcul d'une matrice de corrélation r
  • Le calcul d'une matrice de corrélation avec sas
  • Conseils & avertissements

  • Une corrélation positive parfaite: r = 1. (Quand on va jusqu'à l'autre monte)
    Une corrélation négative parfaite: r = -1 (Lorsque l'on monte, l'autre descend)
    Aucune corrélation: r = 0 (Il n'y a aucune relation linéaire)


    Une matrice de corrélation est une matrice de nombreuses corrélations.

    Choses que vous devez

    • Ordinateur avec R, SAS ou un autre logiciel de statistiques
    1. Le calcul d'une matrice de corrélation R

      • 1

        Obtenir les données. Si vos données sont dans Excel, la méthode la plus simple est de l'enregistrer comme un fichier .csv (Dans Excel 7, cliquez sur "Fichier", Puis "Enregistrer sous," puis "d'autres formats." Puis, en "Save as type," faites défiler jusqu'à CSV (Comma Separated Values). Chaque ligne doit avoir des données sur un sujet, et chaque colonne doit être une variable.

      • 2



        Lire les données en utilisant R read.csv. Par exemple, si vos données sont en "c: mydisk mydir data.csv" entrer
        mydata lt; - read.csv ("c: /mydisk/mydir/data.csv").

      • 3

        Calculer la matrice en utilisant corrélation COR (). Par exemple: cor (mydata). Ou, vous pouvez stocker la matrice de corrélation comme un objet pour une utilisation ultérieure, en utilisant: CORMAT lt; - cor (mydata).

      • Le calcul d'une matrice de corrélation avec SAS

        • 1



          Obtenir les données. SAS peut lire des données dans de nombreux formats. Si vous stockez vos données dans Excel, disposent d'un sujet sur chaque rangée et une variable dans chaque colonne

        • 2



          Lire les données dans SAS. Vous pouvez utiliser l'assistant d'importation pour obtenir vos données. Cliquer sur "Fichier," puis "Importation de données," puis choisissez un type de données en utilisant le menu déroulant. Cliquez "Suivant" et accédez à vos données, puis cliquez sur "Terminer."

        • 3

          Calculer la matrice de corrélation. Si vos données sont sauvegardées dans SAS mydata, avec des variables VAR1, VAR2 et VAR3, puis tapez: données PROC CORR = mydata- VAR var1 var2 var3- RUN;

      Conseils & Avertissements

      • Dans les deux SAS et R, il ya des options pour différents types de corrélations (e .G, Pearson, Spearman'S).
      • Rappelez-vous que les corrélations ne trouvent relations linéaires. Si la relation entre deux corrélations est pas linéaire, les corrélations ne sont pas un bon choix.
      • Pour obtenir plus d'aide avec R, R commencer, puis tapez? Cor.
      • Si la deuxième référence ci-dessous (R Aide) ne fonctionne pas, puis commencer R et tapez? Cor.
      » » » » Comment calculer une matrice de corrélation