반응형
그냥 평균값 구하는 거야 mean을 쓰면 되는데 예를 들어 어떤 칼럼이 뭐 이상일 때 다른 칼럼의 평균값을 구해라, 뭐 이런 식의 조건이 들어가면 R에서는 직관적으로 명령문이 잘 안 나옵니다. stata나 sas는 이런 게 그냥 한 번에 쓸 수 있는데, R은 좀 솔직히 이런 간단한 것도 조금 불필요한 수식이 있죠.
어쨌든 예를 들어 df라는 데이터프레임에 T10Y2Y라는 칼럼 값이 음수일 때 Close라는 칼럼의 평균 값을 구하라는 명령어를 적으려면 아래처럼 하면 됩니다.
mean(df[df$T10Y2Y < 0, "Close"], na.rm=TRUE)
여기서 중요한 게 na.rm인데 결측값을 무시하라는 얘기입니다. 다른 통계프로그램에서는 자연스럽게 결측값을 무시하는데 R은 그렇지 않으니, 결측값이 있고 평균이나 다른 기본 통계 값을 구하려면 na.rm=True로 하는 것을 잊지 마세요!
반응형
'R > R basic' 카테고리의 다른 글
R 다른 코드 스크립트 불러올 때 (0) | 2022.08.18 |
---|---|
missing value(결측값, 결측치) 0 (혹은 다른 값)으로 바꾸기 (0) | 2022.07.28 |
날짜 데이터 읽기 (3): 연, 월, 일 형태는 맞춰주는 게 좋다 (0) | 2022.07.26 |
열려 있는 데이터(혹은 파일) 제거하기 #2: rm 함수 (0) | 2022.07.01 |
문자 앞이나 뒤에 억지로 숫자나 문자를 붙여야 할 때: str_pad 함수 (0) | 2022.06.25 |