반응형
dplyr library에 가장 많이 쓰이는 기능? 중에 하나가 %>%일 겁니다. 이게 무슨 말이냐면 쉽게 말해 왼쪽있는 걸 한 다음에 오른쪽에 있는 걸로 해라 이런 pipe 기능 같은 건데요 (pipe랑 비슷하게 생기지 않았습니까?). 뭐 chain 기능 같은 것이기도 합니다.
예를 들어 iris %>% head() %>% summary() 이런 게 있다고 하면
이 뜻은 iris라는 데이터프레임을 열어서 거기 첫 5줄에 있는 내용 뽑은 다음에 (head) 그것을 요약해라 (summary) (평균 등) 이런 것인데요. 이 기능은 사실
summary(head(iris))라는 같은 것이라고 보면 됩니다. 결국 nesting으로 대체할 수도 있긴 한데 그러면 사실 막 헷갈리기 때문에 (괄호 3개 넘어가면 헷갈립니다..) %>% 풀어서 쓴 것이라고 보면 됩니다. %>%는 혼란을 줄여준다는 점에서 꽤 유용합니다.
반응형
'R > R basic' 카테고리의 다른 글
날짜 데이터 읽기 (1): 문자를 날짜로 데이터 변환 (as.Date) (0) | 2021.05.23 |
---|---|
데이터 문자값 바꾸기 (sub, gsub 함수) (0) | 2021.05.04 |
3개 이상의 데이터프레임을 한 번에 합치기 (join 함수) (0) | 2021.04.26 |
두 개의 데이터프레임 합치기 (join 함수) (0) | 2021.04.23 |
데이터 불러서 한 번에 통합 (plyr::ldply 함수) (0) | 2021.04.21 |