반응형

전체 글 88

Python numpy/pandas library 들어가기에 앞서

저도 이제 막 파이썬에 입문한 사람으로 파이선에서 가장 많이 사용되는 library 둘, numpy와 pandas library에 관한 중요 내용들을 요약하려 합니다. 아래 링크를 보시면 아시겠지만 파이썬에서 가장 많이 사용되는 top 10 라이브러리에 이 둘이 들어가 있고, 아마 데이타 사이언스 하는 분들이라면 거의 기본적으로 이용하는 라이브러리라고 봐도 무방할 듯 합니다. https://towardsdatascience.com/top-10-python-libraries-for-data-science-cd82294ec266 Top 10 Python Libraries for Data Science Some cool help for your Data Science explorations! towardsda..

열 (column) 이름 바꾸기: colnames or rename

R에서 열 (column) 이름을 바꾸는 방법은 크게 두가지가 있습니다. 우선 별 다른 library 없이 데이터프레임 안에서 바꿀 경우는 colnames()를 쓰면 됩니다. colnames(df)[1]%라는 연산자를 이용해서 하는 게 좀 편합니다. %>%는 앞의 명령어를 한 다음에 그 다음 것을 해라는 연산자 정도로 생각해주시면 됩니다. df %>% rename(b1=a1, b2=a2, ...., b10=a10) 아예 벡터를 만들어서 rename 한 칼에 해주는 것도 나쁘지 않은 것 같습니다. oldnames=c('a1', 'a2' ... ,'a10') newnames=c('b1', 'b2', ... ,'b10') df %>%remane_at(vars(oldnames), ~newnames) 검색을 해보..

R/R basic 2020.05.03

[R machine learning] Decision Tree/Random Forest

decision tree나 random forest를 위한 기본적으로 library는 다음과 같습니다. install.packages('rpart') install.packages('rpart.plot') install.packages('randomForest') library(rpart) library(rpart.plot) library(randomForest) 여기에 내장된 kyphosis 데이타를 사용합니다. 구조와 미싱 여부를 확인하구요. 미싱은 없는 것으로 나오네요. str(kyphosis) head(kyphosis) print(is.na(kyphosis)) rpart가 의사결정나무 즉 decision tree 기본 함수입니다. ~.는 종속변수를 제외한 모든 변수를 넣는다는 말이구요. 이어서 랜..

반응형