파이썬 PANDAS 데이터프레임 사용하기

PANDAS 데이터프레임 기본 명령어

import pandas as pd
# df, test 는 예시 dataframe 이름입니다. 
 
특정 목록만 출력 
df.columns # 칼럼명(필드)목록 출력
df.index # 인덱스(레코드)목록  출력 
df.dtypes # 칼럼 타입 출력
df.values # 인덱스를 제외한 나머지 칼럼들의 값
df.칼럼명 # 해당 칼럼 출력 
df['칼럼명'] # 칼럼을 출력하는 같은 명령어 

목록을 리스트타입(list)으로 바꾸기 
df.columns.tolist() # 필드명 리스트
df.values.tolist() # 전체 값 리스트(2차원 리스트로 출력)
df.칼럼명.tolist() # 특정 칼럼만 리스트로 출력 
df.index.tolist() # 인덱스 -> 리스트로 출력

(전체 인덱스)날짜 포맷으로 변환하기
df.index.strftime('%Y-%m-%d').tolist()

날짜 포맷 데이터
pd.datetime(2018,1,6)

날짜 계산하기 
pd.datetime(2018,1,6)-pd.DateOffset(90) # 90일전 날짜 계산

(인덱스)특정 연도조건에 해당하는 항목 출력
df[df.index.year >= 2016]
df[df.index.year == 2016]

(인덱스) 특정 연도 범위주기 
test[pd.datetime(2018,1,1):pd.datetime(2018,1,6)]
test[test.index <= pd.datetime(2018,1,6)]
test.loc[pd.datetime(2018,1,1):pd.datetime(2018,1,6)]

null(NaN) 값 처리
df.y.fillna('null') # y 는 필드이름

소수점 반올림 
df.yhat.round(2) # yhat은 필드이름

 

데이터 프레임 합치기 (칼럼 복사하기)

 

data1 = pd.DataFrame({'ds':forecast.ds, 'yhat':forecast.yhat})
data1 = data1.set_index('ds') # 인덱스 셋팅해주기

다른방법
new_data = data1.join(data2)

 

 

댓글

댓글 본문