Data Science
-
[ISL] 10장 - Clustering (R 실습)Data Science/Data Science in R 2019. 12. 19. 07:33
※ 10장의 연습문제 중 9번만 진행하였습니다. 문제 원본 : http://faculty.marshall.usc.edu/gareth-james/ISL/ISLR%20Seventh%20Printing.pdf 문제 9. USArrests data set을 활용하여 hierarchical clustering과 K-means Clustering 을 적합시키시오. 9(a). complete linkage와 유클리드 거리를 활용하여 군집화 시키시오. 9(b). 덴드로그램을 가장 높은 곳에서 자르면 세 개의 클러스터가 만들어진다. 어느 상태가 어느 클러스트에 속하는지 설명하시오. 9(c). 표준 편차 1을 갖도록 변수를 스케일링 한 후 complete linkage 및 유클리드 거리를 사용하여 상태를 계층적으로 군집화..
-
[ISL] 9장 - 연습문제 (R 실습)Data Science/Data Science in R 2019. 12. 19. 07:18
※ 9장의 연습문제 중 7번만 진행하였습니다. 문제 원본 : http://faculty.marshall.usc.edu/gareth-james/ISL/ISLR%20Seventh%20Printing.pdf 문제 7. Auto Data set 기반으로 Support Vector Approaches를 적용하시오. 7(a). binary variable을 생성하시오.(1은 gas mileage above the median, 0dms gas mileage below the median) 7(b). SVC를 cost 변수에 적용시키시오. 7(c). SVM으로 (b)를 반복하시오. 해답 7(a) library(ISLR) gas.med = median(Auto$mpg) new.var = ifelse(Auto$mpg >..
-
[ISL] 8장 - 연습문제 (R 실습)Data Science/Data Science in R 2019. 12. 19. 06:55
※ 8장의 연습문제 중 9번, 10번만 진행하였습니다. 문제 원본 : http://faculty.marshall.usc.edu/gareth-james/ISL/ISLR%20Seventh%20Printing.pdf 문제 ========================================================================== 9. ISLR 패키지 내 OJ 데이터를 적합시켜 아래의 내용을 해결하시오. 9(a). 800개의 관측치를 가진 training set과 나머지는 test set으로 나누시오. 9(b). training set에 tree를 적합시키시오( Putchase는 반응변수, 나머지는 예측변수 ) 9(d). (b)의 Tree를 그리시오. 9(e). (b)의 모델을 test..
-
[ISL] 7장 - 연습문제 (R 실습)Data Science/Data Science in R 2019. 12. 19. 01:57
※ 1장의 연습문제 중 6번, 9번, 10번만 진행하였습니다. 문제 원본 : http://faculty.marshall.usc.edu/gareth-james/ISL/ISLR%20Seventh%20Printing.pdf * 위 교재 279페이지 문제 ========================================================================== 6(a). Wage의 age를 사용하여 Polynimial Regression을 적합시키시오. 단, CV를 활용하여 적절한 차수를 구하고 ANOVA를 통해 해당 차수가 적절한지 보이시오 6(b). Wage의 age를 사용하여 Step Function을 적합시키시오. 또한 Cut의 개수는 CV를 활용하여 선택하시오. =======..