본문 바로가기

코딩으로 익히는 Python/Pandas

[Python] 16. pandas DataFrame 상관관계 : corr(),heatmap()예제

728x90
반응형
SMALL
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import rc
import matplotlib

rc('font', family='AppleGothic')
plt.rcParams['axes.unicode_minus'] = False

 

데이터 불러오기 (pd.read_csv)

python 파일 경로에 data폴더 만든 후 다음의 crime_in_Seoul.csv 파일 넣어놓기

crime_in_Seoul.csv
0.00MB

 

df = pd.read_csv('data/crime_in_Seoul.csv',index_col=0,encoding = 'euc-kr',thousands = ',')
df.head(20)


상관관계

  • r이 -1.0과 -0.7 사이이면 강한 음적 선형관계
  • r이 -0.7과 -0.3 사이이면 뚜렷한 음적 선형관계
  • r이 -0.3과 -0.1 사이이면 약한 음적 선형관계
  • r이 -0.1과 +0.1 사이이면 거의 무시될 수 있는 선형관계
  • r이 +0.1과 +0.3 사이이면 약한 양적 선형관계
  • r이 +0.3과 +0.7 사이이면 뚜렷한 양적 선형관계
  • r이 +0.7과 +1.0 사이이면 강한 양적 선형관계

 

df.corr()

 

df.plot(kind='scatter',x='살인 발생',y='폭력 발생')
# plt.scatterr(df['살인 발생'],df['폭력 발생'])
plt.show()

 

df[['살인 발생', '폭력 발생']].head(10)

 

sns.heatmap(df.corr(),vmin=-1,vmax=1,annot=True,linewidths=0.2,cmap='Reds')
plt.show()


review
- corr() 시각화에 주로 쓰이는 heatmap()
728x90
반응형
LIST