'R/R machine learning' 카테고리의 글 목록

R/R machine learning 2

[Quanteda] keyword analysis visualization

요즘 많이 쓰이고 있는 quanteda library를 통해서 Natural Language Processing을 해보려고 합니다. 이번에 할 작업은, 각 사고 원인별로 따라 그 원인을 설명하는 특정 단어들이, "다른 원인들에 비해", 더 많이 나오는가 적게 나오는가를 그래픽화해보려고 합니다. 자세한 설명은 생략하고 핵심 명령어로 바로 들어가죠. 우선 원 자료는 accident_data_copy.csv라는 파일이고 여기서 NARRATIVE 칼럼을 핵심 단어 분석을 하려고 합니다. 우선 library를 불러오구요. require(quanteda) require(readtext) require(quanteda.corpora) require(ggplot2) 필요없는 리스트들 먼저 지워버리구요. rm(list=..

R/R machine learning 2020.06.10

[R machine learning] Decision Tree/Random Forest

decision tree나 random forest를 위한 기본적으로 library는 다음과 같습니다. install.packages('rpart') install.packages('rpart.plot') install.packages('randomForest') library(rpart) library(rpart.plot) library(randomForest) 여기에 내장된 kyphosis 데이타를 사용합니다. 구조와 미싱 여부를 확인하구요. 미싱은 없는 것으로 나오네요. str(kyphosis) head(kyphosis) print(is.na(kyphosis)) rpart가 의사결정나무 즉 decision tree 기본 함수입니다. ~.는 종속변수를 제외한 모든 변수를 넣는다는 말이구요. 이어서 랜..

R/R machine learning 2020.04.29

sound of silence

데이터 정리, 분석, 그리고 시각화에 관한 단편적인 지식 모음

파이썬엑셀, 파이썬, Pandas, 오픈파이엑셀, R기본, 판다스, 파이썬 자연어, openpyxl, dplyr, R결측, 파이썬 텍스트, R프로그램, stringr, 엑셀파이썬, 엑셀, 엑셀프로그래밍, r, 엑셀정리, 데이터프레임, R통계,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

R/R machine learning 2

티스토리툴바