본문 바로가기

전체 글3

[파이썬 통계] 상관계수 행렬 (데이터프레임) 아래 두 패키지를 불러옵니다. import pandas as pd import numpy as np np.rand.rand 함수를 이용하여 0~1 사이 균등분포에서 배열을 생성합니다. 생성한 배열로 데이터프레임을 생성합다. 행과 열의 이름을 아래와 같이 입력합니다. df1=pd.DataFrame(np.random.rand(3,4),index=["R1","R2","R3"],columns=["C1","C2","C3","C4"]) >>> df1 C1 C2 C3 C4 R1 0.164916 0.830350 0.660695 0.265124 R2 0.589403 0.526125 0.003763 0.876114 R3 0.427236 0.193434 0.708168 0.644957 상관계수 행렬은 corr 메소드를 이용.. 2022. 1. 5.
[파이썬 통계] 피어슨 상관분석 아래 세 패키지를 불러옵니다. import pandas as pd import numpy as np import scipy.stats as stats 1. 넘파이 배열이용 넘파이 배열을 이용하여 상관분석을 해봅시다. 같은 크기의 배열을 생성합니다. >>> ar1=np.random.rand(5) >>> ar2=np.random.rand(5) >>> ar1 array([0.71586954, 0.95337158, 0.03220131, 0.78345032, 0.9929689 ]) >>> ar2 array([0.18955187, 0.61692872, 0.19200319, 0.57322939, 0.60968089]) stats.pearsonr 함수를 이용하여 상관분석을 수행합니다. >>> stats.pearsonr.. 2022. 1. 5.
[파이썬 통계] 정규분포함수 그리는 방법 [파이썬 통계] 정규분포함수 그리는 방법 파이썬에서 통계와 관련된 작업을 수행할 때는 scipy 패키지를 사용합니다. scipy 패키지의 stats 모듈을 불러와 사용하는데 일반적으로 아래와 같이 불러옵니다. import scipy.stats as stats 그래프를 그려봅시다. stats 모듈의 norm 함수를 사용합니다. numpy의 array를 사용가능하기 때문에 numpy array로 x값을 만들고 norm 함수에 대입하여 y값을 생성합니다. x,y 값을 matplotlib 의 plot 함수를 이용하여 그래프로 그려줍니다. import scipy.stats as statsimport numpy as npfrom matplotlib import pyplot as plt x=np.linspace(-4.. 2020. 11. 27.