아래 두 패키지를 불러옵니다.
import pandas as pd
import numpy as np
np.rand.rand 함수를 이용하여 0~1 사이 균등분포에서 배열을 생성합니다. 생성한 배열로 데이터프레임을 생성합다. 행과 열의 이름을 아래와 같이 입력합니다.
df1=pd.DataFrame(np.random.rand(3,4),index=["R1","R2","R3"],columns=["C1","C2","C3","C4"])
>>> df1
C1 C2 C3 C4
R1 0.164916 0.830350 0.660695 0.265124
R2 0.589403 0.526125 0.003763 0.876114
R3 0.427236 0.193434 0.708168 0.644957
상관계수 행렬은 corr 메소드를 이용합니다.
>>> df1.corr()
C1 C2 C3 C4
C1 1.000000 -0.591717 -0.752259 0.999991
C2 -0.591717 1.000000 -0.086020 -0.595089
C3 -0.752259 -0.086020 1.000000 -0.749492
C4 0.999991 -0.595089 -0.749492 1.000000
'11. 상관분석 > 피어슨' 카테고리의 다른 글
[파이썬 통계] 피어슨 상관분석 (0) | 2022.01.05 |
---|