프로그래밍/인공지능
데이터 타입을 datetime으로 변환하여 분석하기
갑자기 내리는 비
2021. 3. 3. 21:02
데이터의 형식이 datetime일 경우 데이터를 분석하기 쉬워집니다.
현재는 날짜의 형식이 str으로 되어있습니다.
날짜가 어떤식으로 저장되어있는지 알려주지 않으면 오류가 발생하거나 시간이 오래 걸립니다. 데이터의 형식에 맞게format을 설정해줍니다. 변환해주기 전에 미리 날짜데이터를 확인합니다.
chicago_df['Date'] = pd.to_datetime(chicago_df['Date'], format = '%m/%d/%Y %I:%M:%S %p')
pandas에서 제공하는 to_datetime()함수를 이용해서 datetime으로 변환시켜줍니다.
(만약 데이터 타입이 int형이라면 str으로 바꿔준 후 실행합니다. chicago_df['Date'] = chicago_df['Date'].astype(str))
datetime형식으로 바꾼다면 .resample().size() 함수를 이용해서 연단위 혹는 주단위나 하루단위로도 데이터를 확인할 수 있어 데이터 분석에 효과적입니다.
또한 인덱스로 지정해주면 없는 날짜도 조건식으로 넣어 슬라이싱을 할 수 있기 때문에 데이터 가공이 수월해집니다.