반응형
R에서 날짜 변수들이 있는 경우가 종종 있는데요. 예를 들어 특정 칼럼 항목에 2020-01-01 같은 문자 값이 들어가 있으면 R이 무조건 날짜라고 인식하는 게 아니라 이건 날짜 변수야 라고 지정해주는 게 필요합니다.
예를 들어 df라는 데이터프레임에 날짜 데이터가 들어간 칼럼 이름이 strDate라고 하면 (아직까지는 문자로 인지되고 있습니다. 날짜가 아니라)
df$Dates<-as.Date(df$strDate) 이렇게 as.Date 함수를 이용해줘서 Dates라는 새로운 칼럼을 만들어 보겠습니다. 여기서 as.Date는 기본적으로 연도-월-일 (yyyy-mm-dd)를 기본적으로 format으로 인지하고 있습니다. 새 칼럼을 굳이 만들지 않고 기존 칼럼에 덮어 쓰기 하면 그냥 df$strDate<-as.Date(df$strDate)
만약 날짜 적힌 칼럼이 월부터 시작하면 어떻게 하느냐고 (예: 05-01-1990) 하면 그 때는
df$Dates<-as.Date(df$strDate, "%m-%d-%Y") 이런 식으로 format 형식 붙여주구요.
-가 아니라 /로 나뉘어 있으면 (예:05/01/1990)
df$Dates<-as.Date(df$strDate, "%m/%d/%Y") 뭐 이런 식으로 해주면 됩니다.
날짜 구조를 정리한 그래프는 다음과 같습니다. 참고하세요.
반응형
'R > R basic' 카테고리의 다른 글
string 문자열 알파벳 세기, 문자열 합치기, 일부 보이기 (str_length, str_c, str_sub) (0) | 2021.12.07 |
---|---|
날짜 데이터 읽기 (2): 두 개 이상 날짜 칼럼 합쳐서 변환 (with, sprintf) (0) | 2021.05.25 |
데이터 문자값 바꾸기 (sub, gsub 함수) (0) | 2021.05.04 |
%>%란 무엇인가 (dplyr) (0) | 2021.04.30 |
3개 이상의 데이터프레임을 한 번에 합치기 (join 함수) (0) | 2021.04.26 |