반응형
데이터는 많은 경우 missing value(결측값)들이 많은데요. 이걸 drop 할 수도 있습니다만 (아래 링크 참조),
열(row) 제거하기
앞서 칼럼(column)제거하는 글을 올렸는데 정작 열을 제거하는 법은 올리지 않았네요. 특정 열(column)만 선택 (keep) 혹은 제거(drop)하기 (tistory.com) 특정 열(column)만 선택 (keep) 혹은 제거(drop)하기 R에..
approximation.tistory.com
경우에 따라서 그냥 0 혹은 다른 값으로 바꾸고 데이터를 유지하고 싶은 경우도 있을 겁니다. 그럼 결측값을 특정 숫자로 바꾸는 명령어는 무엇일까요? 의외로 매우 간단합니다. 만약 df라는 데이터프레임에 모든 칼럼의 모든 결측값을 예를 들어 0으로 바꿔라 하면, 그냥
df[is.na(df)]<-0
이렇게 하면 모든 결측값을 싹 다 0으로 바꿉니다. 만약 특정 칼럼만 0으로 바꿔라라고 한다면 (칼럼이름이 예를 들어 year라고 합시다), 아래처럼.
df$year[is.na(df$year)] <- 0
물론 0 대신 다른 값을 적어도 되긴 하겠죠.
반응형
'R > R basic' 카테고리의 다른 글
R 다른 코드 스크립트 불러올 때 (0) | 2022.08.18 |
---|---|
조건 걸어 평균값 구하기 (0) | 2022.08.17 |
날짜 데이터 읽기 (3): 연, 월, 일 형태는 맞춰주는 게 좋다 (0) | 2022.07.26 |
열려 있는 데이터(혹은 파일) 제거하기 #2: rm 함수 (0) | 2022.07.01 |
문자 앞이나 뒤에 억지로 숫자나 문자를 붙여야 할 때: str_pad 함수 (0) | 2022.06.25 |