ADsP 16회 복원문제

과외 - ADsP/복원 문제 2019. 1. 6. 15:52

1과목

1번) 글로벌기업의 빅데이터 활용사례 중 잘못 연결된 것?

-->페이스북 (상)

2번) 빅데이터의 위기 요인과 통제방안을 서로 잘못 연결한 것?

--> 책임원칙회손, 데이터오용(하)

3번) 데이터에 대한 설명이 잘못된 것?

--> 개별 데이터 자체로 의미가 중요하다.(하)

4번) 데이터 사이언스와 통게학이 다른 점?

--> 기존 통계학에 데이터마이닝을 접목한 학문(중)

5번) 빅데이터 활용의 3요소?

-->데이터, 기술, 인력(하)

6번) 일차원 분석의 사례로 적절한 것?

--> 에너지 (상)

7번) 사회기반구조로써의 데이터베이스?

-->NEIS(중)

8번)빅데이터에 대한 설명이 잘못된 것?

-->표본조사의 중요성이 대두된다. (하)

단1) 기존 금융회사의 중앙집중형 서버에 거래 기록을 보관하는 방식에서 거래에 참여하는 모든 사용자에게 거래 내역을 보내주며 거래 때마다 이를 대조하는 데이터 위조 방지 기술?

-->블록체인(상)

단2) 수치로 명확하게 표현되는 데이터

-->정량적데이터(하)

2과목

9번) 분석과제 발굴에 대해 잘못 설명한 것?

-->분석 대상이 명확하면 상향식 접근방식이 적절하다. (하)

10번) 분석과제 우선 순위 결정 요소가 아닌 것?

--> 데이터 필요 우선 (하)

11번) 분석 거버넌스 체계가 아닌 것은?

--> 과제 예산 및 비용집행 (상)

12번) 경쟁자 확대 관점의 분석기회 발굴 영역이 아닌 것?

--> 경쟁채널(하)

13번) 분석 ROI에서 비즈니스 효과?

-->value(하)

14번) 빅데이터 분석 방법론의 피드백이 반복해서 발생하는 단계?

--> 데이터 준비, 데이터 분석(중)

15번) 거버넌스 체계에 대한 설명?

-->데이터 관리 체계(중)

16번) 분석 우선순위 평가 기준에 대해 잘못 설명한 것?

-->시급성은 전략적 중요도와 데이터 수집비용으로 평가한다. (중)

단3) CRISP-DM에서 잡음, 이상치, 결측치 식별 및 제거와 데이터셋을 선택하는 단계?

-->데이터 준비(상)

단4) 데이터 분석 기획에서 데이터 분석가에게 요구되는 기술?

-->소프트스킬(하)

3과목

17번) 근로자 임금과 교육수준 관련 그래프 해석이 부적절한 것?

-->각 막대의 높이가 임금수준이다. (하)

18번) 상자그림에 대한 설명이 부적절한 것?

--> 수염은 이상치를 제외하고 데이터의 하위 상위 25% 범위이다.(하)

19번) Hitters 데이터의 상관관계표를 잘못 설명한 것?

--> 상관계수가 통계적으로 유의하다. (중)

20번) lasso 회귀모형에 대해 잘 못 설명한 것?

--> Lasso는 L1 penalty를 사용한다.(상)

21번) default 데이터의 모자이크 플랏에 대한 설명이 잘못된 것?

-->학생인 고객이 많다.(하)

22번) Hitters 데이터에서 train set과 test set 에 대한 설명이 잘못된 것?

--> test set 결과과 일반적으로 train set 결과보다 좋다.(중)

23번) default 데이터의 로지스틱 회귀분석 결과에서 유의수준 0.05.에서 설명이 잘못 된 것?

-->income과 default는 통계적으로 유의하다.(하)

24번) 의사결정나무모형에 대한 설명이 잘못된 것?

-->의사결정나무는 상향식 의사결정의 흐름을 따른다.(중)

25번) nci.data의 계층적 군집분석에 대한 설명이 잘못된 것?

-->최단 연결법은 평균연결법에 비해 계산 연산시간이 빠르다.(상)

26번) 결측값 처리 방법에 대한 설명이 잘못된 것?

-->다중대치법은 추정량의 과소추정이나 계산의 난해성 문제를 보완하는 방법이다.(상)

27번)시간의 흐름에 따라 관측한 데이터는?

-->시계열 자료.(하)

28번)시계열의 요소분해법 중 분해 요소에 대한 설명이 잘못된 것?

-->순환요인은 명백한 경제적이나 자연적인 이유가 없이 알려지지 않은 주기를 갖고 변화하는 자료이다.(하)

29번)연관성 분석에 대한 설명이 잘못된 것?

-->시차 연관분석은 원인과 결과의 형태로 해석이 가능하다.(상)

30번)통계적 추론에 대한 설명이 잘못된 것?

-->비모수적 추론은 모집단에 대한 분포를 가정하지 않지만, 분포의 특성을 결정하는 모수를 추론하는 방법은 아니다.(중)

31번)원천 데이터를 기반으로 감춰진 지식 등을 발견하고 의사결정 등에 유용한 정보로 활용하고자 하는 작업은?

-->데이터 마이닝은 대용량 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용한다.(하)

32번)R의 데이터 구조 중 벡터에 대한 설명이 맞는 것은?

-->R에서 벡터는 하나 또는 그 이상의 스칼라 원소들을 갖는 집합이다.(하)

33번)R에서 연속변수의 최대, 최소, 중앙값 등과 범주변수의 범주 빈도를 출력해주는 함수는?

-->R에서 summary함수는 요약통계를 나타내주는 함수이다.(하)

34번)앙상블 기법이 아닌 것은?

-->시그모이드는 인공신경망의 활성화 함수의 하나이다.(하)

35번)사과-->딸기에 대한 향상도는?

-->0.3/(0.7 × 0.45)(하)

36번)군집화 방법중 DBSCAN 기법 등 군집탐색에 가장 효과적인 방법은?

-->DBSCAN(Density-based spatial clustering of applications with noise) 기법은 밀도 기반 군집의 하나이다.(상)

37번)세분화하는 기능이 있는 데이터 마이닝 분석 방법은?

-->집단을 세분화하는 기능은 분류분석이다.(하)

38번)붓스트랩을 사용하고 전체 관측치 중 훈련용 자료로 사용되는 비율은?

-->붓스트랩 복원 추출방법으로 훈련용 자료로 사용되는 비율은 63.2%이다.(상)

39번)kmeans 군집의 단점을 보완하기 위해 평균 대신 사용하는 것은?

-->중앙값 (하)

40번)k-means 군집의 장점은?

-->k-means 군집은 계층적 군집보다 많은 양의 자료를 다룰 수 있다.(중)

단5) 로지스틱 회귀모형에서 단위가 증가할 때마다 성공의 ()이/가 몇 배 증가 하는가?

-->오즈(odds), 승산비 (중)

단6) 주성분분석에서 3차원으로 축소할 경우 잃게 되는 정보량은?

-->1 – 0.7966195=0.2033805 ==> 20.3% (하)

단7) 베이즈 정리를 활용한 분류방법 알고리즘은?

-->나이브 베이지안 분류(Naive Bayesian classification) (상)

단8) 오분류표의 F1 값은?

-->F1=2*(재현율*정확도)/(재현율+정확도) = 2*(0.15*0.3)/(0.15+0.3) = 0.2 (상)

단9) 시점에 상관없이 시계열의 특성이 일정하다는 용어는?

--> 정상 시계열(하)

단10) 군집분석의 품질 평가 지표로 응집도와 분리도를 계산하는 지표는?

--> 실루엣(shilouette) (상)

저작자표시

'과외 - ADsP > 복원 문제' 카테고리의 다른 글

ADsP 21회 복원 문제 (1)	2019.08.26
ADsP 20회 복원 문제 (1)	2019.08.26
ADsP 19회 복원 문제 (0)	2019.01.06
ADsP 18회 복원문제 (1)	2019.01.06
ADsP 17회 복원 문제 (0)	2019.01.06

ABOUT ME

KUKLIFE KUKLIFE

'과외 - ADsP > 복원 문제' 카테고리의 다른 글

티스토리툴바

ABOUT ME

'과외 - ADsP > 복원 문제' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바