R/R basic

날짜 데이터 읽기 (1): 문자를 날짜로 데이터 변환 (as.Date)

시키테이 2021. 5. 23. 09:16
반응형

R에서 날짜 변수들이 있는 경우가 종종 있는데요. 예를 들어 특정 칼럼 항목에 2020-01-01 같은 문자 값이 들어가 있으면 R이 무조건 날짜라고 인식하는 게 아니라 이건 날짜 변수야 라고 지정해주는 게 필요합니다. 

 

예를 들어 df라는 데이터프레임에 날짜 데이터가 들어간 칼럼 이름이 strDate라고 하면 (아직까지는 문자로 인지되고 있습니다. 날짜가 아니라) 

 

df$Dates<-as.Date(df$strDate) 이렇게  as.Date 함수를 이용해줘서 Dates라는 새로운 칼럼을 만들어 보겠습니다. 여기서  as.Date는 기본적으로 연도-월-일 (yyyy-mm-dd)를 기본적으로 format으로 인지하고 있습니다. 새 칼럼을 굳이 만들지 않고 기존 칼럼에 덮어 쓰기 하면 그냥 df$strDate<-as.Date(df$strDate) 

 

만약 날짜 적힌 칼럼이 월부터 시작하면 어떻게 하느냐고 (예: 05-01-1990) 하면 그 때는 

df$Dates<-as.Date(df$strDate, "%m-%d-%Y") 이런 식으로 format 형식 붙여주구요. 

-가 아니라 /로 나뉘어 있으면 (예:05/01/1990)

df$Dates<-as.Date(df$strDate, "%m/%d/%Y") 뭐 이런 식으로 해주면 됩니다.  

 

날짜 구조를 정리한 그래프는 다음과 같습니다. 참고하세요. 

 

 

반응형