-
[R language] gbm(부스팅 모형) package 함수 에러 해결 방법Data Science/Data Science in R 2018. 12. 17. 04:09
gbm을 사용하다 보면 에러가 종종 발생된다. 다음 사항들을 보고 해결하도록 하자.
Error ① gbm() 사용 중, R Session Aborted 라는 메세지와 함께 New Session으로 변경되는 경우
- 원인 : 컴퓨터 내 프로그램에서 버그 충돌이 일어나는 것
- 해결 방법 : 기존의 gbm package 제거 후, 개발 버전 gbm package 설치
- 소스코드
remove.packages("gbm") #기존 gbm 패키지 제거
install.packages("devtools", dependencies=TRUE)
library(devtools)
install_github("gbm-developers/gbm") #개발자 버전 gbm 패키지 설치
library(gbm) #패키지 로드
Error ② 다음과 같은 Error in plot.window(...)가 발생될 때
> (best_iter = gbm.perf(data_gbm, method="cv"))
Error in plot.window(...) : 유한한 값들만이 'ylim'에 사용될 수 있습니다
- 원인 : Overfitting(과적합) - 트레이닝셋 학습을 너무 과하게 시켜 발생되는 문제
- 해결 방법 : n.trees = 수를 줄인다.
Error ③ 범주형으로 바꿨음에도 다음과 같은 Error가 발생될 때
Error in gbm.fit(x, y, offset = offset, distribution = distribution, w = w, :
Bernoulli requires the response to be in {0,1}
- 원인 : 모름...
- 해결 방법 : int형으로 바꾸어보니 됨..
- 소스코드
training$class <- as.integer(ifelse(training$class == 0, 0, 1))
너무 잦은 error가 발생되어 많은 방법을 시도해보았으며, 그 중 가장 많이 발생된 오류의 해결방법입니다.
혹시 다른 오류가 발생된다면 댓글 남겨주세요~
'Data Science > Data Science in R' 카테고리의 다른 글
[Data Science] 회귀 분석의 RMSE 기본 개념 (0) 2018.12.17 [Data Science] spambase 데이터 분류 분석 - 스펨 메일 예측 문제 (0) 2018.12.17 [Data Science] Wiscinsin Breast Cancer(위스콘신 유방암) 데이터② 분류 분석 (0) 2018.12.16 [Data Science] Wiscinsin Breast Cancer(위스콘신 유방암) 데이터① 분류 분석 (0) 2018.12.16 [Data Science] Adult 데이터로 알아보는 분류분석 모형 개념 (1) 2018.12.15