본문 바로가기

728x90
반응형
SMALL

파이썬통계

(5)
[Python] 10. confusion matrix : precision,recall,f1,ROC from sklearn.datasets import make_classification, load_breast_cancer from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split import pandas as pd import matplotlib.pyplot as plt import numpy as np import seaborn as sns from sklearn.pipeline import make_pipeline from sklearn.preprocessing import StandardScaler from sklearn.preprocessing import OneHo..
[Python] 1. 선형회귀분석 import pandas as pd import numpy as np import seaborn as sns from sklearn.datasets import load_boston, load_iris from sklearn.linear_model import LinearRegression,Ridge, SGDRegressor # SGDRegressor은 학습 나머지는 공식 from sklearn.neural_network import MLPRegressor # MLPRegressor은 딥러닝 학습 from sklearn.metrics import r2_score # 선형 모델(Linear Models) from sklearn.model_selection import train_test_split impo..
[Python] 6. 표준정규분포(z검정,t검정) import numpy as np import pandas as pd import matplotlib.pyplot as plt import math 정규분포 확률분포함수 pmf 확률질량함수(probability mass function) pdf 확률밀도함수(probability density function) cdf 누적분포함수(cumulative distribution function) ppf 누적분포함수의 역함수(inverse cumulative distribution function) sf 생존함수(survival function) = 1 - 누적분포함수 isf 생존함수의 역함수(inverse survival function) rvs 랜덤 표본 생성(random variable sampling) x..
[Python] 2. 대표값, 산포도, 정규화, 도수 import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy.stats import mode 데이터 불러오기 (pd.read_csv) python 파일 경로에 data3 폴더 만든 후 다음의 ch2_scores_em.csv파일 넣어놓기 대표값 평균값 중앙값 최빈값 df = pd.read_csv('data3/ch2_scores_em.csv', index_col='student number') df.head() scores = df['english'].values scores [OUT] : array([42, 69, 56, 41, 57, 48, 65, 49, 65, 58, 70, 47, 51, 64, 62, 70, 71, ..
[Python] 1. 데이터 종류 : 이산 변수, 연속 변수 import pandas as pd 데이터 불러오기 (pd.read_csv) python 파일 경로에 data3 폴더 만든 후 다음의 ch1_sport_test.csv 파일 넣어놓기 데이터 종류 이산 변수(범주형 변수) : 주사위 눈, 연령, 결석 횟수, 학생수 (1점, 2점 이렇게 끊어지는 경우도 해당) 연속 변수 : 길이, 무게, 시간, 온도 (소수점까지 계속 연속인 경우) df = pd.read_csv( 'data3/ch1_sport_test.csv', index_col='학생번호') df 이산 변수 : 학생 번호, 학년, 윗몸일으키기, 점수, 순위 연속 변수 : 악력 review - 이산 변수와 연속 변수 차이 구분

728x90
반응형
LIST