R/R basic

missing value(결측값, 결측치) 0 (혹은 다른 값)으로 바꾸기

시키테이 2022. 7. 28. 02:08
반응형

데이터는 많은 경우 missing value(결측값)들이 많은데요. 이걸 drop 할 수도 있습니다만 (아래 링크 참조), 

열(row) 제거하기 (tistory.com)

 

열(row) 제거하기

앞서 칼럼(column)제거하는 글을 올렸는데 정작 열을 제거하는 법은 올리지 않았네요. 특정 열(column)만 선택 (keep) 혹은 제거(drop)하기 (tistory.com) 특정 열(column)만 선택 (keep) 혹은 제거(drop)하기 R에..

approximation.tistory.com

경우에 따라서 그냥 0 혹은 다른 값으로 바꾸고 데이터를 유지하고 싶은 경우도 있을 겁니다. 그럼 결측값을 특정 숫자로 바꾸는 명령어는 무엇일까요? 의외로 매우 간단합니다. 만약 df라는 데이터프레임에 모든 칼럼의 모든 결측값을 예를 들어 0으로 바꿔라 하면, 그냥 

 

df[is.na(df)]<-0

이렇게 하면 모든 결측값을 싹 다 0으로 바꿉니다. 만약 특정 칼럼만 0으로 바꿔라라고 한다면 (칼럼이름이 예를 들어 year라고 합시다), 아래처럼. 

df$year[is.na(df$year)] <- 0

물론 0 대신 다른 값을 적어도 되긴 하겠죠. 

반응형