본문 바로가기

728x90
반응형
SMALL

통계

(3)
[Python] 15. pandas DataFrame 통계&시각화 : sum(), unstack(), mean(), values, min(), idxmax(), median(), quantile(), count(), describe()예제 import pandas as pd import numpy as np import matplotlib.pyplot as plt from matplotlib import rc import matplotlib rc('font', family='AppleGothic') plt.rcParams['axes.unicode_minus'] = False data = {'eng':[10,30,50,70], 'kor':[20,40,60,80], 'math':[90,50,20,70]} df = pd.DataFrame(data, index=['a','b','c','d'] ) df def fn( v ): print("=========") print("v=>",v) print("=========") return v.sum() d..
[Python] 14. pandas DataFrame 통계 : sum(), unstack(), mean(), values, min(), idxmax(), median(), quantile(), count(), describe()예제 import pandas as pd import numpy as np data = {'eng':[10,30,50,70], 'kor':[20,40,60,80], 'math':[90,50,20,70]} df = pd.DataFrame(data, index=['a','b','c','d'] ) df 데이터프레임 통계함수 default(column별), axis=1 (row별) ※ 일반함수들은 default(row별), axis=1(column별) 이므로 주의 ex) df.dropna(axis=1) 은 NaN이 있는 column삭제 df.sum() [OUT] : eng 160 kor 200 math 230 dtype: int64 df.sum(axis=1) [OUT] : a 120 b 120 c 130 d 220 ..
[Python] 05. numpy 통계 : argmin(), std(), median(), quantile(),sum(),max(),zip()예제 import numpy as np arr = np.array([22,11,33,44,55]) numpy의 통계 함수 argmin() std() median() quantile() 통계 함수 예제 arr.argmin() # arr중 가장 작은 값의 인덱스 반환 [OUT] : 1 arr.std() # arr의 표준 편차 반환 [OUT] : 15.556349186104045 np.median(arr) #데이터를 정렬했을때 가운데 값 [OUT] : 33.0 np.quantile(arr,[0.25,0.5,0.75]) # arr의 제 1사분위수(0.25), 중앙값(0.5), 제 3사분위수(0,75) 값을 반환 [OUT] : array([22., 33., 44.]) 연습문제 kor = np.array( [60,55,..

728x90
반응형
LIST