-
ADsP 16회 복원문제과외 - ADsP/복원 문제 2019. 1. 6. 15:52
1과목
1번) 글로벌기업의 빅데이터 활용사례 중 잘못 연결된 것?
-->페이스북 (상)
2번) 빅데이터의 위기 요인과 통제방안을 서로 잘못 연결한 것?
--> 책임원칙회손, 데이터오용(하)
3번) 데이터에 대한 설명이 잘못된 것?
--> 개별 데이터 자체로 의미가 중요하다.(하)
4번) 데이터 사이언스와 통게학이 다른 점?
--> 기존 통계학에 데이터마이닝을 접목한 학문(중)
5번) 빅데이터 활용의 3요소?
-->데이터, 기술, 인력(하)
6번) 일차원 분석의 사례로 적절한 것?
--> 에너지 (상)
7번) 사회기반구조로써의 데이터베이스?
-->NEIS(중)
8번)빅데이터에 대한 설명이 잘못된 것?
-->표본조사의 중요성이 대두된다. (하)
단1) 기존 금융회사의 중앙집중형 서버에 거래 기록을 보관하는 방식에서 거래에 참여하는 모든 사용자에게 거래 내역을 보내주며 거래 때마다 이를 대조하는 데이터 위조 방지 기술?
-->블록체인(상)
단2) 수치로 명확하게 표현되는 데이터
-->정량적데이터(하)
2과목
9번) 분석과제 발굴에 대해 잘못 설명한 것?
-->분석 대상이 명확하면 상향식 접근방식이 적절하다. (하)
10번) 분석과제 우선 순위 결정 요소가 아닌 것?
--> 데이터 필요 우선 (하)
11번) 분석 거버넌스 체계가 아닌 것은?
--> 과제 예산 및 비용집행 (상)
12번) 경쟁자 확대 관점의 분석기회 발굴 영역이 아닌 것?
--> 경쟁채널(하)
13번) 분석 ROI에서 비즈니스 효과?
-->value(하)
14번) 빅데이터 분석 방법론의 피드백이 반복해서 발생하는 단계?
--> 데이터 준비, 데이터 분석(중)
15번) 거버넌스 체계에 대한 설명?
-->데이터 관리 체계(중)
16번) 분석 우선순위 평가 기준에 대해 잘못 설명한 것?
-->시급성은 전략적 중요도와 데이터 수집비용으로 평가한다. (중)
단3) CRISP-DM에서 잡음, 이상치, 결측치 식별 및 제거와 데이터셋을 선택하는 단계?
-->데이터 준비(상)
단4) 데이터 분석 기획에서 데이터 분석가에게 요구되는 기술?
-->소프트스킬(하)
3과목
17번) 근로자 임금과 교육수준 관련 그래프 해석이 부적절한 것?
-->각 막대의 높이가 임금수준이다. (하)
18번) 상자그림에 대한 설명이 부적절한 것?
--> 수염은 이상치를 제외하고 데이터의 하위 상위 25% 범위이다.(하)
19번) Hitters 데이터의 상관관계표를 잘못 설명한 것?
--> 상관계수가 통계적으로 유의하다. (중)
20번) lasso 회귀모형에 대해 잘 못 설명한 것?
--> Lasso는 L1 penalty를 사용한다.(상)
21번) default 데이터의 모자이크 플랏에 대한 설명이 잘못된 것?
-->학생인 고객이 많다.(하)
22번) Hitters 데이터에서 train set과 test set 에 대한 설명이 잘못된 것?
--> test set 결과과 일반적으로 train set 결과보다 좋다.(중)
23번) default 데이터의 로지스틱 회귀분석 결과에서 유의수준 0.05.에서 설명이 잘못 된 것?
-->income과 default는 통계적으로 유의하다.(하)
24번) 의사결정나무모형에 대한 설명이 잘못된 것?
-->의사결정나무는 상향식 의사결정의 흐름을 따른다.(중)
25번) nci.data의 계층적 군집분석에 대한 설명이 잘못된 것?
-->최단 연결법은 평균연결법에 비해 계산 연산시간이 빠르다.(상)
26번) 결측값 처리 방법에 대한 설명이 잘못된 것?
-->다중대치법은 추정량의 과소추정이나 계산의 난해성 문제를 보완하는 방법이다.(상)
27번)시간의 흐름에 따라 관측한 데이터는?
-->시계열 자료.(하)
28번)시계열의 요소분해법 중 분해 요소에 대한 설명이 잘못된 것?
-->순환요인은 명백한 경제적이나 자연적인 이유가 없이 알려지지 않은 주기를 갖고 변화하는 자료이다.(하)
29번)연관성 분석에 대한 설명이 잘못된 것?
-->시차 연관분석은 원인과 결과의 형태로 해석이 가능하다.(상)
30번)통계적 추론에 대한 설명이 잘못된 것?
-->비모수적 추론은 모집단에 대한 분포를 가정하지 않지만, 분포의 특성을 결정하는 모수를 추론하는 방법은 아니다.(중)
31번)원천 데이터를 기반으로 감춰진 지식 등을 발견하고 의사결정 등에 유용한 정보로 활용하고자 하는 작업은?
-->데이터 마이닝은 대용량 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용한다.(하)
32번)R의 데이터 구조 중 벡터에 대한 설명이 맞는 것은?
-->R에서 벡터는 하나 또는 그 이상의 스칼라 원소들을 갖는 집합이다.(하)
33번)R에서 연속변수의 최대, 최소, 중앙값 등과 범주변수의 범주 빈도를 출력해주는 함수는?
-->R에서 summary함수는 요약통계를 나타내주는 함수이다.(하)
34번)앙상블 기법이 아닌 것은?
-->시그모이드는 인공신경망의 활성화 함수의 하나이다.(하)
35번)사과-->딸기에 대한 향상도는?
-->0.3/(0.7 × 0.45)(하)
36번)군집화 방법중 DBSCAN 기법 등 군집탐색에 가장 효과적인 방법은?
-->DBSCAN(Density-based spatial clustering of applications with noise) 기법은 밀도 기반 군집의 하나이다.(상)
37번)세분화하는 기능이 있는 데이터 마이닝 분석 방법은?
-->집단을 세분화하는 기능은 분류분석이다.(하)
38번)붓스트랩을 사용하고 전체 관측치 중 훈련용 자료로 사용되는 비율은?
-->붓스트랩 복원 추출방법으로 훈련용 자료로 사용되는 비율은 63.2%이다.(상)
39번)kmeans 군집의 단점을 보완하기 위해 평균 대신 사용하는 것은?
-->중앙값 (하)
40번)k-means 군집의 장점은?
-->k-means 군집은 계층적 군집보다 많은 양의 자료를 다룰 수 있다.(중)
단5) 로지스틱 회귀모형에서 단위가 증가할 때마다 성공의 ()이/가 몇 배 증가 하는가?
-->오즈(odds), 승산비 (중)
단6) 주성분분석에서 3차원으로 축소할 경우 잃게 되는 정보량은?
-->1 – 0.7966195=0.2033805 ==> 20.3% (하)
단7) 베이즈 정리를 활용한 분류방법 알고리즘은?
-->나이브 베이지안 분류(Naive Bayesian classification) (상)
단8) 오분류표의 F1 값은?
-->F1=2*(재현율*정확도)/(재현율+정확도) = 2*(0.15*0.3)/(0.15+0.3) = 0.2 (상)
단9) 시점에 상관없이 시계열의 특성이 일정하다는 용어는?
--> 정상 시계열(하)
단10) 군집분석의 품질 평가 지표로 응집도와 분리도를 계산하는 지표는?
--> 실루엣(shilouette) (상)
'과외 - ADsP > 복원 문제' 카테고리의 다른 글
ADsP 21회 복원 문제 (1) 2019.08.26 ADsP 20회 복원 문제 (1) 2019.08.26 ADsP 19회 복원 문제 (0) 2019.01.06 ADsP 18회 복원문제 (1) 2019.01.06 ADsP 17회 복원 문제 (0) 2019.01.06