본문 바로가기
11. 상관분석/피어슨

[파이썬 통계] 상관계수 행렬 (데이터프레임)

by 만다린망고 2022. 1. 5.

아래 두 패키지를 불러옵니다. 

import pandas as pd
import numpy as np


np.rand.rand 함수를 이용하여 0~1 사이 균등분포에서 배열을 생성합니다. 생성한 배열로 데이터프레임을 생성합다. 행과 열의 이름을 아래와 같이 입력합니다. 

df1=pd.DataFrame(np.random.rand(3,4),index=["R1","R2","R3"],columns=["C1","C2","C3","C4"])

>>> df1
          C1        C2        C3        C4
R1  0.164916  0.830350  0.660695  0.265124
R2  0.589403  0.526125  0.003763  0.876114
R3  0.427236  0.193434  0.708168  0.644957


상관계수 행렬은 corr 메소드를 이용합니다.

>>> df1.corr()
          C1        C2        C3        C4
C1  1.000000 -0.591717 -0.752259  0.999991
C2 -0.591717  1.000000 -0.086020 -0.595089
C3 -0.752259 -0.086020  1.000000 -0.749492
C4  0.999991 -0.595089 -0.749492  1.000000

'11. 상관분석 > 피어슨' 카테고리의 다른 글

[파이썬 통계] 피어슨 상관분석  (0) 2022.01.05