본문 바로가기

[학과 내비게이션] 경기지표·여론조사 등 방대한 정보 분석…데이터 과학자 키운다 ‘통계학과’

중앙일보 2016.12.14 00:01 Week& 4면 지면보기
조형준 고려대 통계학과 교수(가운데)가 통계학과 과목인 ‘데이터마이닝’ 수업의 팀 프로젝트를 준비중인 학생들을 지도하고 있다. 데이터마이닝 수업은 경제·금융 등 실제 데이터를 분석하는 팀 과제가 많다.

조형준 고려대 통계학과 교수(가운데)가 통계학과 과목인 ‘데이터마이닝’ 수업의 팀 프로젝트를 준비중인 학생들을 지도하고 있다. 데이터마이닝 수업은 경제·금융 등 실제 데이터를 분석하는 팀 과제가 많다.

"수천㎞ 떨어진 아프리카의 시골 동네 초등학교 입학생 수와 우리나라 국내총생산(GDP) 사이에 상관관계가 있을까요?” 아리송한 이 질문에 통계학자들은 ‘그렇다’고 답한다.

박유성 고려대 통계학과 교수는 “일반인의 시각으로는 막연하게 ‘그렇겠지’ 정도로 끝나겠지만 통계학자는 방대한 데이터 속에서 두 현상 사이 상관관계를 찾고 논리적이고 분석적으로 증명해낸다”고 말했다.

광부가 돌 속에서 보석을 찾아내듯 통계학자는 수많은 데이터의 흐름을 읽고 그 안에서 가치있는 정보를 가공해낸다. 데이터 전문가를 양성하는 통계학과에서는 실제 무엇을 배우는지, 졸업 후 진로는 어떤지 알아봤다.
 
데이터 과학자, 미래 유망 직업으로 부상

통계학의 적용 범위는 무궁무진하다. 박 교수는 “정보가 생성·유통되고, 데이터를 분석해야 하는 모든 곳에서 통계 전문가를 필요로 한다”고 말했다. 경제학에서는 국내총생산(GDP)·환율·경제성장율 등 경기지표 분석, 경영학은 재무제표 분석부터 시장조사와 경영전략 수립, 사회학·심리학에서는 설문·인식 조사 등 다양한 조사·연구에 통계학을 활용하고 있다.

공학·의학에서도 각종 실험 데이터 분석을 위해 통계학이 필수다. 이재헌 중앙대 응용통계학과장은 “컴퓨터 하드웨어와 정보처리기술이 발전하면서 각 학문 분야의 실험·연구에서 다루는 데이터의 양도 방대해졌다. 최근엔 연구 초기부터 통계학자와 협업해 실험·연구를 공동으로 이끄는 협동연구가 활발하다”고 전했다.

통계학은 산업 현장에서도 적극 활용된다. 세계의 주식시장을 분석하고 투자전략을 세워야 하는 증권사, 불량품을 줄이는 품질관리가 중요한 제조업, 고객 성향에 따른 맞춤형 금융상품이 필요한 은행·보험, 여론조사를 진행하는 리서치 회사, 소비자·시청자의 취향을 분석해야 하는 유통·문화·방송산업도 통계학을 필요로 한다.

기업의 기획·인사·경영부서도 통계학적 지식을 요구한다. 고객정보 등 기업이 보유한 데이터는 통계 전문가의 손을 거쳐 가치있는 정보로 거듭난다. 기업의 마케팅 전략도 통계의 도움을 받는다. 기업의 데이터 분석팀은 수백만 건 이상의 고객정보를 나이·소득·가족구성·직업·결혼유무 등 다양한 변수로 분석하면서 새 상품을 기획한다.

정보통신과 인공지능 기술의 발전은 통계학의 적용 범위를 한층 넓히고 있다. 대용량 데이터를 효율적으로 처리하는 통계학적 지식은 사물인터넷(IoT), 자율주행자동차, 알파고와 같은 인공지능(AI), 로봇 등 제4차 산업혁명을 가능케하는 핵심 기술 중 하나다. 문자·사진·동영상 등 수억, 수십억 건에 달하는 방대한 정보를 분석하는 빅데이터 기술은 미래 성장 동력의 핵심으로 자리 잡았다.

김동호 세종대 수학통계학부장은 “이처럼 IT와 각종 산업이 융합되면서 통계 전문가에 대한 수요가 한층 늘고 있다”며 “통계학자와 데이터 과학자가 제4차 산업혁명 시대에 각광받는 유망 직업으로 부상했다”고 지적했다. 2014년 비즈니스 인맥소셜네트워크인 링크드인(LinkedIn)이 3억3000만명의 회원 프로파일을 분석한 결과 통계 분석기술을 갖춘 인력이 채용 ‘일순위’로 꼽혔다. 미국 취업정보 전문업체 커리어캐스트도 ‘2015년 최고의 직업 톱10’에서 통계학자를 4위, 데이터 과학자를 6위에 꼽았다.
 
수학 기초 쌓고 데이터 분석 능력 길러
통계학은 수학적인 감각과 수리적인 분석력을 요구한다. 때문에 통계학과 저학년 때는 확률·행렬·미적분 등 통계수학을 집중적으로 배운다. 중앙대 응용통계학과 4학년 이동녘(24)씨는 “통계 분석은 결과 정리가 A4 한 페이지라면, 어떤 통계기법을 통해 결과를 도출했는지 그 과정을 논리적이고 명쾌하고 증명하는 게 9장에 이를 정도로 변수와 결과 사이의 상관관계 분석이 중요하다”고 말했다. 이를 위해서는 확률·미적분 등 수학 기초 개념을 탄탄하게 쌓아야 한다.

학교에 따라 수학의 비중은 조금씩 다르다. 통계학과는 대학에 따라 개설된 단과대가 다르다. 서울대·이화여대·세종대 등은 통계학과가 자연과학대에, 연세대·고려대·중앙대 등은 상경계열에 속해있다. 자연과학대에 속한 통계학과는 통계기법을 익히면서 엄밀한 수학적 증명을 강조한다. 상경계열에 속한 통계학과는 경영·경제 데이터를 가공하는 실습에 더 무게를 두는 편이다. 세종대 수학통계학부 4학년 박민수(25)씨는 “이과계열 통계학과는 기초적인 통계수학뿐 아니라 선형대수학·해석학·조합론까지 수학 수업 비중이 높은게 특징”이라며 “수학을 좋아하지 않으면 적응하기 힘들다”고 전했다.

2학년부터는 회귀분석·다변량분석·시계열분석·범주형자료분석 과목을 통해 본격적인 통계기법을 익힌다. SAS·SPSS·R프로그램과 같은 통계 프로그램을 배우고 이를 활용해 데이터를 분석하는 실습이 많다. 아울러 통계프로그램 운영에 필요한 기초 코딩능력도 기른다. 통계프로그래밍·전산통계실습과 같은 과목을 통해 데이터의 종류와 변수의 갯수에 따라 달라지는 코드를 짜는 능력을 기른다. 코드는 프로그램 안에서 작동하는 일종의 계산식이다. 코드를 짜 데이터를 원하는 방식으로 조합하고, 계산하고, 결과를 도출한다.

실습에선 ‘조간신문 헤드라인에 등장한 키워드가 주식 시장에 미치는 영향’ ‘야구선수의 기록이 경기 승패에 끼치는 영향’ ‘출연진에 따른 드라마 시청률 예측’ 등 경제는 물론 문화·스포츠 등 다양한 분야에 통계를 적용한다. 기업 재무제표를 토대로 기업의 파산 가능성을 예측하거나, 경기지표를 통해 부동산 가격의 변동폭을 가늠하기도 한다. 보험통계학에선 날씨·사고율·소득·가족구성 등 다양한 변수에 따라 달라지는 보험상품의 보험료를 계산하고, 생명과학데이터분석·생물통계학 수업에선 각종 생명데이터의 성격을 이해하고 이 분야의 실험방법을 공부한다.

고려대 통계학과 4학년 박상균(25)씨는 “통계학과에서는 경제·경영·금융·생명 데이터를 가지고 시뮬레이션을 해보는 팀 프로젝트 과제가 많다”며 “데이터의 성격에 맞게 다양한 통계기법을 써보면서 예측값을 정교하게 다듬는다”고 했다. 이재헌 중앙대 학과장은 “통계학은 거의 모든 학문 분야와 융합할 정도로 응용의 폭이 넓다”며 “졸업 후 진출하는 분야에 빠르게 적응할 수 있도록 학부에서 다양한 데이터를 다뤄볼 기회를 주고 있다”고 소개했다.

통계학 수업의 꽃은 3학년 이후 접하는 ‘데이터마이닝’이다. 데이터와 채굴(mining)의 합성어인 데이터마이닝은 많은 데이터 가운데 숨겨진 유용한 상관관계를 찾고 활용가능한 정보를 추출·가공하는 과정이다. 지금까지 배운 통계학적 지식을 총동원해 가설을 세우고 변수를 조정해 결과를 도출해낸다. ‘소비자 물가지수와 특정 주식의 관계 파악하기’‘실업률 동향에 대한 분석과 예측’‘국내 산업부문 에너지 소비량의 예측 및 대안’ 등 다양한 과제가 나온다. 데이터마이닝 수업을 듣고 있는 고려대 통계학과 3학년 조우란(21)씨는 “4만5000명의 은행 고객 데이터를 통해 집단별로 적금상품 가입률을 분석하고 있다. 고객 특성별로 어떤 금융상품을 홍보해야 하는지 최적화된 마케팅 방법을 찾는 게 목표”라고 설명했다.
 

2017학년도 대입 정시 배치표로 본 통계학과
※중앙대는 2016학년도는 경제경영대학으로 선발. 2017학년도부터 응용통계학과 따로 선발. 서울대는 수시모집으로만 선발하고 이화여대는 자연과학대, 성균관대는 사회과학계열로 선발해 정시 기준 통계학과 순위 산출할 수 없음.
※덕성·성신·숙명여대는 수능 4개 영역 중 3개 영역만 반영.
 

이중전공 활발, 인턴십·전문가 특강도 많아
통계학이라고 하면 숫자를 조합해 기계적으로 결과값을 도출한다고 생각하기 쉽다. 하지만 통계학과 교수들은 “통계 기법도 중요하지만 수많은 데이터 속에서 옥석을 가려내고 유의미한 정보를 찾는 분석력·추론력·판단력이 무엇보다 중요하다”고 입을 모았다.

박유성 고려대 교수는 미국 월마트의 ‘기저귀와 맥주 패키지 상품’ 사례를 예로 들었다. 이 회사의 데이터분석팀은 육아에 관심을 갖는 젊은 아빠들이 늘고 있는 사회 현상에 주목했다. 분석의 흐름은 ‘기저귀→아빠→맥주’로 이어졌다. 기저귀와 맥주를 세트로 묶어 판매하자 상품 매출이 5배까지 뛰었다.

이처럼 통계 분석은 수많은 데이터 속에서 특징을 잡아내고, 결과를 예측하는 게 목표다. 박 교수는 “통계 전문가가 어떤 변수에 중점을 두고 분석하느냐에 따라 결과가 크게 달라진다”며 “시회 현상마다 다른 데이터의 특성을 이해하려면 경제·경영·사회·문화·과학까지 다방면의 기초 지식을 쌓는 것이 필요하다”고 강조했다.

이런 학문적인 특성 때문에 통계학과 학생 중엔 부전공, 이중전공을 선택하는 이들이 많다. 인문·사회 분야는 경제·경영·금융·사회학·심리학을, 이공계 학과로는 컴퓨터공학을 복수전공한다. 고려대 통계학과는 아예 이중전공을 의무화했다. 중앙대 응용통계학과에 입학해 심리학을 부전공하고 있는 3학년 윤서현(23)씨는 “통계학에서 설문·인식 조사 방법론을 자세하게 배운 덕에 사회조사가 많은 심리학을 공부하는데 큰 도움이 됐다”며 “주변에 복수전공을 하는 친구들이 많다”고 말했다. 김동호 세종대 학부장은 “학부 과정에서 통계학과 함께 다른 학문 분야를 공부해두면 해당 분야 자료를 전문적으로 분석할 수 있는 통계 전문가로 경쟁력을 더 키울 수 있다”고 귀띔했다.

인턴십도 활발하다. 고려대는 매년 여름방학 두 달 동안 국내 금융업계와 리서치·컨설팅 회사, 인터넷진흥원·한국거래소 등에 20여 명을 파견한다. 국제통계기구(ISI)와 미국·호주 등 해외 통계연구소에도 4~6명이 간다. 박 교수는 “인턴십 기관에서 부담하는 월급이 적을 경우에는 학교에서 장학금을 보태 월 100만원은 받을 수 있도록 지원하고 있다”고 밝혔다.

중앙대와 세종대는 금융·보험·리서치 회사에서 활동하고 있는 현업 전문가의 특강이 자주 열린다. 이재헌 중앙대 학과장은 “한 달에 한 번 꼴로 빅데이터 전문가 특강을 열어 학부생들이 현장을 이해하고 졸업 후 다양한 분야로 진출할 수 있도록 돕는다”고 말했다.
 
졸업 후 진로
금융업 가장 많이 진출, IT업계도 선호
구글도 통계학자 많이 채용하는 추세

통계학과는 경제·경영·사회학·심리학·공학·의학까지 통계 분석이 필요한 다양한 학문과 융합한다. 그만큼 졸업 후 진출 폭도 넓다. 중앙대 응용통계학과의 이재헌 학과장은 “특히 기업에서는 각종 경영 계획을 결정할 때 정확한 매출·영업이익 등 숫자에 기반해 의사결정을 한다. 때문에 각종 데이터를 자유자재로 다루고 수학적인 분석에 익숙한 통계학과 출신을 선호한다”고 말했다. 박유성 고려대 통계학과 교수는 “기획·경영·마케팅·인사 등 다양한 업무에서 통계학과 출신이 활동하고 있다. 취업률이 좋다보니 대학원 진학률은 다른 학과에 비해 낮은 편”이라고 밝혔다.

졸업 후 가장 많이 진출하는 분야는 은행·증권·카드·보험사 등 금융업이다. 박 교수는 “졸업생의 약 40% 정도가 금융업에 취업한다”고 전했다. 고려대 통계학과를 졸업한 뒤 재보험사의 자동차보험팀에서 근무하는 최수진(31)씨는 “금융업에 진출하는 통계학과 졸업생은 대개 경제·경영을 복수전공하는 경우가 많다”며 “금융업계에서 통계학과 출신은 문·이과 성향을 두루 갖춘 융합형 인재로 통한다”고 말했다.

투자사로 진출하면 기업가치와 시장 동향을 분석하는 애널리스트가 되고, 카드사에 취업하면 고객정보를 분석하고 맞춤형 마케팅 전략을 수립하는 CRM 업무를 담당한다. 소득·경기변동·사고율 등을 고려해 보험율을 계산하는 보험업계에도 통계학과 출신이 많다. 박 교수는 “애널리스트·데이터분석팀에서 경력을 쌓고 고객의 위탁자산을 주식·채권 등 금융상품에 투자해 수익을 올리는 펀드 매니저, 금융상품 매매를 중개하는 트레이더로 전향하는 사례도 많다”고 설명했다. 그는 “실시간으로 정보가 반영되고 주가가 변동되는 주식시장에서 핵심은 시간이다”며 “최근엔 수천만 건의 데이터에서 재빨리 흐름을 읽고 필요한 정보를 골라 고객에 전달하는 빅데이터 처리 능력을 갖춘 인재가 각광받고 있다”고 소개했다.

각종 여론조사를 수행하는 리서치 회사, 경영컨설팅회사에도 통계학과 출신이 많다. 김동호 세종대 수학통계학부장은 “학부 재학 중엔 리서치 회사 인턴십을 많이 한다. 인턴십을 통해 능력을 인정받고 곧바로 취업하는 경우도 많다”고 전했다.

법조계에서도 통계학적 지식의 활용폭이 넓어지고 있다. 고려대에서 유통법 관련 박사 과정을 수료한 홍현석(37)씨는 “미국 유명배우인 OJ심슨이 살인죄로 기소된 사건에서 조건부확률 기법을 활용한 통계학적 분석이 판결에 활용된 사례가 유명하다”며 “한국도 판례분석 등에 통계학적 분석을 활용하는 경우가 늘고 있다”고 소개했다. 한때 홈쇼핑 PD로 일했던 그는 “시청자와 소비자의 취향을 분석하는 유통·방송산업에서도 통계학이 많이 활용된다. 통계학과 유통·문화·미디어 전공을 함께 공부하면 졸업 후 진출 분야를 넓히는데 도움이 된다”고 조언했다.

불량품을 줄여야 하는 기업 품질관리 부서도 통계 전문가를 선호한다. 중앙대 응용통계학과와 동대학원 석·박사를 거쳐 삼성전기 수석연구원으로 근무하는 정윤준(43)씨는 “제조업에서 자동화가 빠르게 진전되면서 생산효율성 제고와 불량률 관리 등을 담당할 통계 인력에 대한 수요도 늘고 있다. 통계학과 산업공학·컴퓨터공학을 함께 배우면 좋다”고 충고했다. 빅데이터·인공지능·스마트의료기술 등 IT업계로의 진출도 활발하다. 박 교수는 “자율주행자동차를 개발 중인 구글이 최근 통계학자를 많이 채용했다. 빅데이터 처리 기술이 각광 받으면서 통계학과 출신의 IT업계 진출은 한층 늘어날 것”이라고 전망했다.

글=정현진 기자 Jeong.hyeonjin@joongang.co.kr 사진=우상조 기자 woo.sangjo@joongang.co.kr
공유하기
광고 닫기