-
[ISL] 9장 - 연습문제 (R 실습)Data Science/Data Science in R 2019. 12. 19. 07:18
※ 9장의 연습문제 중 7번만 진행하였습니다.
문제 원본 : http://faculty.marshall.usc.edu/gareth-james/ISL/ISLR%20Seventh%20Printing.pdf
문제
7. Auto Data set 기반으로 Support Vector Approaches를 적용하시오.
7(a). binary variable을 생성하시오.(1은 gas mileage above the median, 0dms gas mileage below the median)
7(b). SVC를 cost 변수에 적용시키시오.
7(c). SVM으로 (b)를 반복하시오.해답
7(a)
library(ISLR)
gas.med = median(Auto$mpg)
new.var = ifelse(Auto$mpg > gas.med, 1, 0)
Auto$mpglevel = as.factor(new.var)7(b)
#install.packages("e1071")
library(e1071)
set.seed(1)
tune.out = tune(svm, mpglevel ~ ., data = Auto, kernel = "linear",
ranges = list(cost = c(0.01, 0.1, 1, 5, 10, 100)))
summary(tune.out)- Best Parameters는 cost가 1일 때로써, error값이 0.01로 제일 낮다.
7(c)
set.seed(1)
tune.out = tune(svm, mpglevel ~ ., data = Auto, kernel = "polynomial",
ranges = list(cost = c(0.1,1, 5, 10), degree = c(2, 3, 4)))
summary(tune.out)- 가장 낮은 CV error rate는 cost=10, degree=2 일 때 얻게 된다.(error 값 = 0.5130)
set.seed(1)
tune.out = tune(svm, mpglevel ~ ., data = Auto, kernel = "radial",
ranges = list(cost = c(0.1,1, 5, 10), gamma = c(0.01, 0.1, 1, 5, 10, 100)))
summary(tune.out)- radial basis kernel은 cost=10, gamma=0.1 일 때 best이다.
'Data Science > Data Science in R' 카테고리의 다른 글
[ISL] 10장 - Clustering (R 실습) (0) 2019.12.19 [ISL] 8장 - 연습문제 (R 실습) (0) 2019.12.19 [ISL] 8장 - Tree, Bagging, Random Forest, Boosting의 이해 (R 실습) (0) 2019.12.19 [ISL] 7장 - 연습문제 (R 실습) (0) 2019.12.19 [ISL] 7장 - 비선형모델(Local regression, Smoothing splines, GAM) 이해하기(R 실습) (0) 2019.12.19