-
[ISL] 10장 - Clustering (R 실습)Data Science/Data Science in R 2019. 12. 19. 07:33
※ 10장의 연습문제 중 9번만 진행하였습니다.
문제 원본 : http://faculty.marshall.usc.edu/gareth-james/ISL/ISLR%20Seventh%20Printing.pdf
문제
9. USArrests data set을 활용하여 hierarchical clustering과 K-means Clustering 을 적합시키시오.
9(a). complete linkage와 유클리드 거리를 활용하여 군집화 시키시오.
9(b). 덴드로그램을 가장 높은 곳에서 자르면 세 개의 클러스터가 만들어진다. 어느 상태가 어느 클러스트에 속하는지 설명하시오.
9(c). 표준 편차 1을 갖도록 변수를 스케일링 한 후 complete linkage 및 유클리드 거리를 사용하여 상태를 계층적으로 군집화하시오.
9(d). K-means clustering을 적합시키시오(k=3일 때)해답
9(a)
set.seed(2)
hc.complete = hclust(dist(USArrests), method="complete")
plot(hc.complete)9(b)
cutree(hc.complete, 3)
table(cutree(hc.complete, 3))
## 1 2 3
## 16 14 209(c)
dsc = scale(USArrests)
hc.s.complete = hclust(dist(dsc), method="complete")
plot(hc.s.complete)- 왼쪽으로 쏠려있던 것들이 균형이 이뤄진 모습을 볼 수 있음
9(d)
km.out = kmeans(dist(USArrests), 3, nstart=20)
km.out$cluster
table(km.out$cluster)
# 1 2 3
# 20 16 14'Data Science > Data Science in R' 카테고리의 다른 글
[ISL] 9장 - 연습문제 (R 실습) (0) 2019.12.19 [ISL] 8장 - 연습문제 (R 실습) (0) 2019.12.19 [ISL] 8장 - Tree, Bagging, Random Forest, Boosting의 이해 (R 실습) (0) 2019.12.19 [ISL] 7장 - 연습문제 (R 실습) (0) 2019.12.19 [ISL] 7장 - 비선형모델(Local regression, Smoothing splines, GAM) 이해하기(R 실습) (0) 2019.12.19