본문 바로가기

728x90
반응형
SMALL

groupby

(5)
[Python] 22. pandas DataFrame 졸음운전 데이터 분석 연습문제 : read_csv(),concat(),to_datetime(),nlargest(1,kee='all')예제 import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib from datetime import datetime from pandas_datareader import data matplotlib.rcParams['font.family']='Malgun Gothic' matplotlib.rcParams['axes.unicode_minus'] = False 데이터 불러오기 (pd.read_csv) python 파일 경로에 data폴더 만든 후 다음의 파일들 넣어놓기 data1 = pd.read_csv('data/2014년 졸음운전 교통사고.csv',encoding='euc-kr') data2 = pd.read..
[Python] 19. 기상청데이터 파싱 분석 및 시각화 : bs4 BeautifulSoup, urlib.request , REQ예제 from bs4 import BeautifulSoup import urllib.request as REQ import pandas as pd import numpy as np import matplotlib.pyplot as plt from matplotlib import rc import matplotlib import seaborn as sns rc('font', family='AppleGothic') plt.rcParams['axes.unicode_minus'] = False 중앙일보 전체기사xml jurl = 'https://rss.joins.com/joins_news_list.xml' response = REQ.urlopen( jurl ) soup = BeautifulSoup( response,..
[Python] 18. pandas DataFrame pivot_table : groupby(), sum(), max(), min(), count(), agg(), aggfunc=[] 예제 import pandas as pd import numpy as np import matplotlib.pyplot as plt from matplotlib import rc import matplotlib rc('font', family='AppleGothic') plt.rcParams['axes.unicode_minus'] = False 데이터 불러오기 (pd.read_csv) python 파일 경로에 data폴더 만든 후 다음의 hotel.xlsx 파일 넣어놓기 df = pd.read_csv('data/grade.csv') df g = df.groupby('학년') g.mean() df.info() # pivot_table에서는 수치형 데이터들의 mean 계산(기본) [OUT] : RangeIndex..
[Python] 17. pandas DataFrame groupby : groupby(), sum(), max(), min(), count(), agg()예제 import pandas as pd import numpy as np import matplotlib.pyplot as plt from matplotlib import rc import matplotlib rc('font', family='AppleGothic') plt.rcParams['axes.unicode_minus'] = False 데이터 불러오기 (pd.read_csv) python 파일 경로에 data폴더 만든 후 다음의 hotel.xlsx 파일 넣어놓기 df = pd.read_excel('data/hotel.xlsx',index_col=0) df.head() df['grade'].unique() [OUT] : array([10, 8, 6, 9, 7, 5]) df['grade'].value_c..
[Python 실습] 부산광역시 세금 데이터 분석 : groupby(),idxmax(),unstack(),fillna() 데이터 전처리/시각화 부산광역시 세금 데이터 불러오기 taxDF = pd.read_csv('data/부산광역시_부산시인터넷지방세청(사이버지방세청)_지방세등 납부현황_20200630.csv', thousands=',',encoding='euc-kr') taxDF = pd.DataFrame(taxDF) # taxDF의 컬럼에 공백이있어 공백 제거 작업 colList = [] for col in taxDF.columns: colList.append(col.strip()) taxDF.columns = colList taxDF.head(15) 1. 납부년도에 따른 기관별 최대 건수의 납부금액 시각화 # 연도별 데이터프레임 구축 li = taxDF['납부년도'].unique().tolist() taxList = [] for i in r..

728x90
반응형
LIST