국가공인 데이터분석 전문가

덤프버전 :


컴퓨터 분야 자격 제도

[ 펼치기 · 접기 ]
국가기술자격
기술사
정보관리기술사
컴퓨터시스템응용기술사
정보통신기술사

기사
정보처리기사
정보보안기사
전자계산기조직응용기사
전자계산기기사
빅데이터분석기사
로봇소프트웨어개발기사
임베디드기사
정보통신기사
산업기사
정보처리산업기사
정보보안산업기사
사무자동화산업기사
컴퓨터응용가공산업기사
전자계산기제어산업기사
정보통신산업기사
기능사
정보처리기능사
정보기기운용기능사
전자계산기기능사
컴퓨터응용선반기능사
컴퓨터응용밀링기능사
전자캐드기능사
컴퓨터그래픽스운용기능사
웹디자인기능사
전자출판기능사
서비스분야
국가기술자격

전자상거래관리사
전자상거래운용사
컴퓨터활용능력
(1급/2급)
멀티미디어콘텐츠
제작전문가

(산업기사급)
게임국가기술자격
(기획/그래픽/프로그래밍)
(기사급)

전산회계운용사
한글속기
워드프로세서
사회조사분석사
국가공인
민간자격
전산세무회계
ERP정보관리사
AT 자격시험
IT+정보활용능력인증
네트워크관리사1)
PC정비사
리눅스마스터
SQLD
SQLP
RFID GL/SL
e-Test
ITQ
GTQ/GTQi2)
DIAT
PC활용능력평가
PC Master(정비사)
IEQ
데이터아키텍처
데이터분석
SW테스트전문가3)
국가등록
민간자격
SW코딩자격
AIFB
문서실무사
COS Pro
한글플러스
엑셀플러스
파워포인트플러스
CAS활용능력
디지털영상편집
수사속기
코딩능력마스터
파이썬마스터
국제자격
ICDL
MOS
OCJP
OCP
SCEA
CC

(Cisco Certificated)

CISA
CISSP
PMP
ACE Test
※ 부분공인민간자격은 공인민간자격에만 기재하고 따로 주석을 첨부함.
1) 네트워크관리사는 2급만 국가공인자격임. (1급은 등록민간자격)
2) GTQ 및 GTQi는 1급/2급만 국가공인자격임. (GTQ/GTQi 3급 및 GTQid는 등록민간자격)
3) SW테스트전문가는 일반등급만 국가공인자격임. (고급은 등록민간자격)





시험진행
한국데이터산업진흥원
시험구성
ADsP: 필기
ADP: 필기+실기
시험일정
연4회 정기시험
(접수: 2·4·8·10월)
응시자격
ADsP: 없음
ADP: 유관분야 학위 또는 실무경력
or ADsP 취득자
접수기간
통상 5~7일
첫째날 10:00 ~ 마감일 18:00
접수방법
인터넷접수(KData)
결과발표
일정표 공지일에 의거

1. 개요
2. 과목
3. ADsP
3.1. 필기시험
4. ADP
4.1. 필기시험
4.2. 실기시험
5. 둘러보기



1. 개요[편집]


데이터분석 전문가 자격검정 시험. 빅데이터 시대가 도래하고 데이터 분석가의 필요성이 증가함에 따라 데이터 분석 전문가 자격에 대한 기업의 수요를 반영하여 2014년부터 실시한 시험으로 과학기술정보통신부가 주무부처이고 한국데이터산업진흥원이 시행한다.

공식 명칭인 '국가공인 데이터분석 전문가'를 영어로 쓴 'Advanced Data Analytics Professional'를 줄여서 ADP라고 부른다. 이보다 낮은 단계인 '국가공인 데이터분석 준전문가'는 semi가 추가되며 ADsP(Advanced Data Analytics Semi-Professional)로 줄여 부른다. ADP는 데이터과학 분야의 유일한 국가공인 자격증이며 2020년 시점에서는 데이터 분석업계에서 가장 권위있는 자격증이라고 볼 수 있다.

데이터분석 전문가란 '조직 내부에서부터 기업외부까지의 데이터를 분석하기 위해 컴퓨터 공학, 데이터 공학, 통계학, 경영학적인 지식과 기술을 기반으로 데이터 기반의 정책/제도, 기획, 처리, 분석, 시각화, 운영관리 업무를 수행하고 데이터를 수집, 저장, 분석, 표현하는 체계를 만드는 지식과 기술을 활용하여 프로세스 혁신, 마케팅 전략 등의 과학적인 의사결정을 이끌어내는 직무를 수행하는 사람' 을 말한다.

ADP 공식 수험서인 《데이터 분석 전문가 가이드》가 있으나,[1] 기출문제를 제공하지 않는다. 그래서 교재의 기출문제는 대부분 수험생의 기억으로 만들어진 복원 문제라고 볼 수 있고, 일정 부분은 문제가 반복 출제되는 경향이 있어서 어떻게 보면 문제의 출제 범위가 어느 정도 한정되어 있다고 볼 수 있다. 따라서 이 시험을 공부하려면 먼저 기출문제를 중점으로 공부하자.

ADP 필기와 ADsP 시험에서 출제되는 언어는 R이지만 ADP 실기시험 때에는 R과 Python 둘 중에 하나를 골라서 사용하게 된다. Python 같은 경우는 설치된 package가 미리 공고되며, R 같은 경우도 거의 대부분의 패키지가 미리 설치된다. 참고로 R의 경우 윈도우에 설치된 리눅스 가상환경에 R Studio Server가 설치되며 윈도우의 크롬으로 해당 서버에 접속하여 실행하는 방식을 사용한다. 실기 시험을 준비하기 위해서는 공식 수험서만으로 부족하므로 다른 방법을 통해서 언어와 데이터 분석 기법을 익히는 것이 필요하다.

ADsP는 데이터 분석 및 기획의 이론지식 보유 여부를 측정하며 데이터 관련 업무 경력이 없는 응시자들의 ADP 응시자격 확보용으로 많이 활용된다. 다루는 지식의 깊이는 대충 데이터분석 분야에서 ADP 취득자들의 업무를 보조적으로 지원할 수 있으며 분석결과가 낯설게 보이지 않을 만큼 이해하는 수준에 그친다.


2. 과목[편집]


과목명
ADP
ADsP
데이터 이해
O
O
데이터 처리기술 이해
O
X
데이터 분석 기획
O
O
데이터 분석
O
O
데이터 시각화
O
X

ADP는 5과목 모두 포함이며, ADsP는 1·3·4과목만 출제된다.

또한 ADP는 필기와 실기로 나뉘어져 있는 데 반해, ADsP는 필기만 치르면 된다.


3. ADsP[편집]


시험방식
PBT
시험과목
데이터 이해
데이터 분석 기획
데이터 분석
문항수
총 50문항
문제유형
객관식 40문항, 주관식(단답형) 10문항
준비물
신분증
수험표[2]
필기구(흑색펜·컴퓨터용 사인펜)
제한시간
90분
중도퇴실
조건부 가능
(30분 경과 후)
합격조건
60점 이상
응시료
50,000원
필기 1회만 응시하면 취득할 수 있는 자격이다. 객관식과 주관식 단답형을 모두 합쳐서 60점 미만일 경우에는 불합격하며, 모든 문항의 배점은 각각 2점이므로 20문제를 초과하여 틀리면 안 된다.

사회조사분석사 2급(이하 사조사)과는 여러 면에서 비교할 수 있다. 사조사가 시장조사 및 설문조사 기획에 특화된 자격증이라면, ADsP의 경우는 (빅)데이터를 해석해서 경영에 활용될 수 있는 새로운 의미를 도출하는 쪽에 특화되어 있다. 사조사의 커리큘럼이 순수사회과학분야의 통계적 방법연구방법론 커리큘럼과 거의 일치하는 반면, ADsP는 공식 수험서에서도 언급하듯이 경영정보학+통계학+프로그래밍이 각각 맛보기 수준의 난이도로 섞여있는 커리큘럼에 가깝다.

통계학 문제의 경우, 다루는 깊이 자체는 사조사보다 ADsP가 훨씬 더 깊게 파고들어간다. 회귀분석만 하더라도 사조사에서는 다중회귀분석까지 소개하고 끝나는 반면 ADsP에서는 능형회귀분석(ridge regression)이나 랏소회귀분석(Lasso regression) 같은 고차원적인 내용까지 물어본다. 실험을 강조하는 사조사에서는 분산분석을 중시하지만 모델링을 강조하는 ADsP에서는 분산분석에 큰 관심을 보이지 않는 것도 차이점. 범위를 보면 사조사 2급 수준의 통계지식은 당연히 알 거라고 전제하듯이 가볍게 짚고 넘어가고, 사조사에서는 다루지 않는 로짓분석이나 시계열 분석, 주성분 분석까지도 포괄한다. 그렇기 때문에 흔히 ADsP가 사조사 2급보다 어렵다는 이야기가 많고, 실제로도 어느 정도 사실이다.

그러나 ADsP가 더 쉬운 면들도 있다. 우선 사조사 2급 필기시험과는 달리 ADsP는 순수수학적 문제해결력을 묻는 '수학문제' 들이 출제되지 않는다. 수포자들에게는 다행스러운 소식. 또한 주관식이라 해 봐야 ADsP는 단답형 10문항만으로 구성되는데, 사조사 2급에서는 서술형 10~11문항이 무려 실기시험의 70점을 차지하고 들어가기 때문에 채점기준의 압박이 매우 크다. 기껏 정성들여 답안지를 꽉 채웠는데 채점결과는 반타작이 나오는 상황이 사조사 2급에서는 일상적으로 벌어지지만 ADsP는 그런 걸로 수험생들의 기가 죽는 일이 없다. 무엇보다도 사조사 2급처럼 세 번씩이나 시험을 보러 가야 하고 심지어 마지막 한 번은 접수전쟁을 치르면서 지방으로 원정까지 내려가야 하는 개고생 없이, 그냥 적당한 거리에 있는 학교에서 달랑 50문제 한번 풀고 돌아오면 시험결과가 나온다. 이런 편의성만큼은 ADsP 쪽이 압도적이다.

프로그래밍적인 부분은 정말 기초 중의 기초만 물어보고, 그 이상은 아예 기대하지도 않으니 너무 부담가질 필요는 없다. 특히 SPSS 같은 접근성 낮고 비싼 프로그램이 아니라 R을 물어보기 때문에 수험생들이 개인적으로 R Studio를 다운받아서 연습하기도 편하고, 셀프 채점을 하기도 쉽다. 물론 SQL에 대한 대강의 배경지식도 있어야 하지만 이것도 많이는 필요없다.

답안 작성에 OMR 카드를 활용하므로 컴퓨터용 사인펜이 필수이며, 현장에서 출석자를 호명하면서 확인하고 수험번호도 친절하게 알려주므로 수험표는 지참하지 않아도 된다. 수정테이프도 굳이 챙길 필요가 없으며, 답안을 고치고자 한다면 OMR 카드를 교체하기만 하면 된다. 그러나 주관식 단답형의 답안을 작성하기 위한 흑색 볼펜은 따로 챙겨야 한다. 기타 유색 사인펜은 사용 금지.

수험생들의 가장 정석적인 대비전략은 역시 기출문제. 기초개념을 독학한 후 기출문제만 거의 외우다시피 풀어도 시험장에서 낯익게 보이는 문제들을 많이 만날 수 있다. 특히 통계분석 문제들에서 기출변형이 상대적으로 크지 않은 편. 데이터 세트도 항상 거기서 거기이다 보니, R에서 기본적으로 제공하는 유명한 데이터 파일들은 친숙하게 느껴질 정도이다. 대표적으로 붓꽃이나 대학생들의 대출현황, 특히 닭모이(…) 등등.

문과이과 중 어느 한쪽으로 나누기 힘든 자격시험이다.

34회 이후로는 이전 기출문제에서 잘 묻지 않던 내용들이 여러 차례 등장했다. ADsp보다 좀 더 어려운 시험인 빅데이터분석기사와 유사한 문제가 등장한다는 의견도 있는 것으로 보아, 전체적으로 이전보다 난도가 높아진 것으로 보인다.

그러나 37회에서는 이런 시도를 과하게 했는지, 4문제나 정답처리 되는 일이 발생했다.#


3.1. 필기시험[편집]



전반부에서 후반부로 진도가 나아가면서 경영정보학프로그래밍통계학 순서로 학문적인 분위기가 바뀐다. 첫 단원에서 데이터과학의 영역을 분석 영역(통계학), IT 영역(프로그래밍), 비즈니스컨설팅 영역(경영정보학)으로 나눈 것에 대응된다고 할 수 있다.

맨 처음 단원인 '데이터 이해'는 언뜻 본격적인 공부거리를 소개하기 전에 워밍업하라는 느낌으로 마련된 것 같지만, 실제로는 가장 기출변형이 많고 낯선 문제들이 자주 튀어나와서 수험생들의 점수하락을 견인(?)하는 단원이다. 세계 굴지의 기업들이 데이터산업에 어떻게 뛰어들고 있고 어떤 발전과 논쟁이 있어 왔는지 배경지식이 풍부하다면 좀 더 수월하게 문제를 풀 수 있다. 공식 수험서에서도 이 단원은 유독 IT업계 신문사의 칼럼처럼 보이는 서술방식이 특징으로, 여기서 출제포인트가 무엇이고 문제가 어떻게 나온다는 건지 짐작하기가 쉽지 않다. 상식으로 읽기에는 재밌을지 몰라도 자격증을 목표로 공부하기 썩 좋은 대상들은 아니다.

'데이터 이해'의 중반부에서는 ERP나 BI 같은 약어들과 슬로건들이 사방에서 튀어나온다. 자신의 전공학과가 경영학이라면, 특히 그중에서도 경영정보학에 관심이 있다면 이 쪽으로는 굳이 더 공부할 것도 없을 만큼 학문적으로 겹쳐진다. 그래서 도서관에 꽂혀있는 《경영정보시스템》 같은 경영학 전공서들을 한두 권 빌려다가 읽는 것도 단원의 이해에 도움이 된다. 뿐만 아니라 채용시장에서도 DW나 DM 같은 것을 만들고 이해할 수 있는 IT 인재들은 수요가 굉장히 많다.

다음으로 '데이터 분석 기획'은 좀 더 경영학적이면서도 실무적인 부분으로 들어가는데, 실무에 대한 경험이 없다면 이걸 통째로 외워버려야 한다는 고충이 있다. 초반에 등장하는 KDD나 CRISP-DM, 빅데이터 DB 분석방법론의 경우 진짜로 디테일한 사항까지도 출제되기 때문. 여기서는 분석이라는 활동을 함에 있어서 결정해야 하는 여러 이슈들을 순서대로 다루고 있다. 분석을 어떻게 할 것인지, 분석할 대상은 어떻게 선정할 것인지, 분석 결과는 어떻게 평가할 것인지 같은 이슈들이 대표적이다. 또한 ADsP는 단 한 번의 분석례에 그치지 않고 그 분석을 제도화하는 것에 대해서도 물어본다. 즉 분석의 중장기적 마스터플랜을 세우는 방법, 여러 분석과제들 사이의 우선순위를 정하는 방법, 장기적으로 조직 내에서 데이터분석의 문화가 자리잡게 만드는 법, 분석데이터를 관리하는 방법, 분석조직을 수립하고 운영하는 방법 등이 여기에 포함된다. 굉장히 자세한 부분까지 나오는 데다가 쓰이는 단어가 다 비슷하기 때문에 정확한 암기가 필요하다. 다만 양은 그다지 많지 않은 편.

셋째 과목인 '데이터 분석'의 경우, 전반부에서는 R의 사용방법과 기본적인 문법, 함수, 패키지를 소개하는데 너무 깊이까지는 알 필요가 없고 가르치지도 않는다. 그래도 R 패키지 중에서 reshape, sqldf, plyr 같은 것들은 꽤나 자주 출제되는 편. 반복구문이나 조건문을 보고 결과가 어떻게 나올지를 예측할 수 있는지, 그리고 결측값을 처리하는 등의 기초적인 핸들링은 가능한지 정도를 물어본 후 곧바로 통계분석으로 넘어간다.

'데이터 분석'의 후반부에 해당하는 통계분석 파트는 많은 수험생들에게 심리적인 장벽 같은 느낌을 주지만, 의외로 기출변형이 드물고 문제의 난이도 자체도 쉽게 출제되는 편이기 때문에 한번 익숙해지면 안정적으로 점수확보가 가능한 파트이기도 하다. 사조사와 겹치는 기초통계학적인 내용을 가볍게 다룬 후 좀 더 복잡한 난이도의 분석을 소개하는데, 주성분 분석은 꼭 1문제 정도씩은 쉬운 난이도로 출제되곤 하며 시계열 분석도 단골로 나오고 있다. 이후 데이터 마이닝이 소개되는데 분류분석(특히 의사결정나무)과 군집분석은 정말 각잡고 명확하게 익힐 필요가 있다.[3] 여기에 더해 인공신경망과 연관분석, 앙상블분석을 정리하면 된다. 통계학에 대해 조금이라도 아는 사람과 아예 모르는 사람 간에 차이가 큰 과목이다. 통계학을 조금이라도 했으면 앞부분의 기초 통계는 다시 안 읽어봐도 되거나 까먹은 부분만 읽으면 정도로 쉽게 나오기 때문에 뒤쪽의 고급 통계 분석만 공부해주면 되기 때문이다. 가끔 조건부확률, 혼동행렬(정확도, 특이도 등), 군집 연속형 거리개념(유클리드, 맨해튼 거리 등), 연관성 분석 간단한 계산 문제가 출제되는데 숫자나온다고 겁먹지 말고 꼭 맞히자. 개념만 알면 쉽게 풀리는 간단한 산수 문제이고 명확하게 답이 딱 떨어지기 때문에 정답을 판별하기 쉽기 때문이다. R로 도출된 회귀분석이나 상관분석 해석 문제도 방법만 알면 바로 정답이 눈에 보일 정도로 쉽게 출제되므로 이 문제도 꼭 맞힐 것.

이 단원에서도 전공서가 좋은 참고서가 된다. Tan, Steinbach, Karpatne, & Kumar(2019)의 《Introduction to Data Mining》 은 체계적이면서도 이해하기 쉽게 쓰인 전공서인데, 국내에도 번역서가 들어와 있기는 하지만 차마 추천하기 민망할 정도로 번역의 상태가 엉망이다. 영어가 된다면 차라리 원서를 보는 편이 더 나을 수도 있다. 가끔이지만 ADsP인데도 변별력 때문인지 꽤나 심도있는 데이터 마이닝 관련 문제가 출제되기도 하는데, 공식 수험서만으로는 풀 수 없겠지만 별도의 전공서로 함께 공부했던 수험생은 그것까지도 풀 수 있다.


4. ADP[편집]


ADsP는 응시자격이 없는 반면 ADP는 응시자격이 존재하는데 다음과 같다.

  • 박사 학위를 취득한 자
  • 석사 학위 취득 후 해당 분야 실무경력 1년 이상
  • 학사 학위 취득 후 해당 분야 실무경력 3년 이상
  • 전문대학 졸업 후 해당 분야의 실무경력 6년 이상
  • 고등학교 졸업 후 해당 분야의 실무경력 9년 이상
  • ADsP를 합격한 자

ADsP는 시험기준점을 넘으면 합격이지만, ADP는 기준점을 넘어도 증빙서류를 제출해야한다. 이유는 응시자격이 되는지 안되는지 확인하기 위해서. 따라서 ADP를 대비하려는 사람들은 위의 응시자격을 증명할 수 있는 서류도 준비하자. ADP 응시자 대부분은 ADsP를 붙은 경우가 많아서 ADsP합격증을 증빙서류로 제출한다.

응시현황 및 합격자수
연도
ADP 필기 응시자수(추정)[4]
ADP 실기 응시자수
ADP 최종 합격자수
ADP 누적 합격자수
최종합격률(실기)[5]
2014
264
248
8
8
3.23%
2015
584
137
7
15
5.11%
2016
1,078
259
6
21
2.32%
2017
1,543
368
14
35
3.8%
2018
2,696
501
18
53
3.59%
2019
4,590
1,267
35
88
2.76%
2020
7,089
1,664
32
120
1.92%
2021
12,340
2,436
66
186
2.71%
2022
-
2,737
69
255
2.52%

2022년도 ADsP의 합격률은 63%이지만 ADP의 최종합격률은 3% 미만으로 매우 낮으며 점점 더 낮아지고 있다. 이는 실기시험의 넓은 출제 범위(통계학, 데이터 공학, 시각화, 자연어처리 등)와 4시간에 달하는 시간 안에 코딩으로 정해진 문제를 풀어야 하는 등 높은 난이도에 기인한다. 시행 9년이 지났지만 2022년 말 기준 ADP 자격 보유자(누적합격자)수는 255명에 불과하다.


4.1. 필기시험[편집]


총 80문제(객관식), 1문제(서술형)으로 구성되며, 총 배점은 객관식 각각 1점, 서술형 20점이다. 합격 기준점은 100점 만점에 70점이고, 시험시간은 180분. 응시료는 2020년 기준 필기 80,000원이다.

각 과목의 과락은 40점 미만이다. 4과목은 40문항인 데 반해, 1,2,3,5과목은 10문항만 출제된다.


4.2. 실기시험[편집]


ADP 필기시험 합격자에 한하여 합격 후 2년간 응시할 수 있는 자격이 부여된다. 실기는 240분이며, 데이터분석 실무를 평가한다. 100점 만점에 75점이상 획득시 합격이고, 응시료는 70,000원이다.

R 또는 Python을 이용해서 실제 데이터를 다루게 된다.

보통 3개의 대문제(데이터 셋)각각 데이터 전처리, 모델링, 시각화 등을 포함한 2~4개의 소문제가 주어지며, 제한된 240분 내에 풀기 위해서는 기본적으로 정형데이터, 비정형데이터 모두 능숙하게 다룰 수 있는 상태에서 통계학, 머신러닝, 자연어처리 등 전 영역에서 상당한 수준의 지식과 코딩 숙련성이 있어야 합격선을 넘길수 있다.

ADP의 합격률이 낮은 실질적인 이유가 실기시험의 난이도가 높기 때문이다.


5. 둘러보기[편집]


🏬 사회과학 조사·연구 방법론 둘러보기

[ 펼치기 · 접기 ]
📝 서론
사회과학 · 과학적 방법 · 사회조사 · 연구 · 가설 · 이론(이론적 조망) · 연구윤리
🔍 조사방법론 I
변인 · 정의 · 상관관계와 인과관계 · 실험(실험설계 · 통제 · 통제집단과 실험집단) · 사례연구
자료 · 자료수집(면접법 · 초점집단면접법 · 질문지법 · 관찰법) · 코딩
📈 조사방법론 II
표본조사 · 지표 · 측정 · 신뢰도와 타당도 · 지수 · 척도
📊 사회통계
통계적 방법 · 기술통계학 · 확률 및 분포 · 추론통계학 · SPSS · 분석기법(분산분석 · 회귀분석)
👔 공인 자격증
사회조사분석사 · 빅데이터분석기사 · 국가공인 데이터분석 전문가
📂 메타 문서
연구방법론 관련 정보
상기 문서들은 한국통계진흥원 및 한국산업인력공단의 출제범위에 의거하여 엄격히 망라되어 있으며, 동 기관의 과목별 구분·명명에 의거하여 조사방법론은 2파트로 구분됨



파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-11-14 09:06:05에 나무위키 국가공인 데이터분석 전문가 문서에서 가져왔습니다.

[1] 가격은 50,000원이고 거의 1,000페이지에 달할 정도로 두껍다. 그것도 실기 수험서는 별도다. 시중의 교재는 이보다 훨씬 가볍고 저렴하므로 두꺼운 책에 부담이 있다면 시중의 교재를 구입하는 것도 나쁘지 않다.[2] 공식적으로 수험표는 출력하지 않아도 된다고 안내하고 있다.[3] 꼭 자격증이 아니더라도, 이런 고급 분석방법론을 이해하지 못하면 이제는 시사뉴스 논쟁에도 참여하기 어려운 세상이 되고 있다. 예컨대 이 논쟁의 경우에도 군집분석을 모르면 제대로 쟁점을 따라가기도 힘들지만, 사실 여기서 말하는 k-means 클러스터링은 군집분석에서 그냥 기초 중의 기초에 속한다.[4] 해당년도 ADsP합격자수기반 추정 매우 부정확[5] https://www.pqi.or.kr/indexMain.do 사이트에 공개된 정보