본문 바로가기

[전공 따라잡기] 통계학과

인문·자연 아우르는 4차 산업혁명의 근간,  데이터 문해력 중요한 통계학과

 

숫자부터 문자, 음성, 이미지, 영상까지 우리는 수많은 데이터로 이루어진 세상에서 살고 있다. 데이터를 과학적으로 분석해 필요한 정보를 얻어내고 문제 해결 방법을 찾는 학문이 통계학이다. 통계학은 고차원의 수학 개념을 활용해야 하는 어려운 학문으로 느껴지지만, 실제로는 우리 일상에서 쉽게 접할 수 있는 친근한 분야이다. 아침에 일어나 가장 먼저 확인하는 일기예보의 강수 확률, 미세먼지 농도부터 코로나19 확진자 수, 주가와 환율의 변동, 대통령 선거를 앞둔 후보자들의 지지율 등 통계학은 우리 삶의 필수 도구다. 4차 산업혁명과 더불어 머신러닝·딥러닝·빅데이터가 각광받는 시대, 그 중심에 서 있는 통계학을 만나보자.

 


취재 이지영 리포터 easygoing@naeil.com
도움말 정환 교수(고려대학교 통계학과 학과장)

 


통계학과
인문 계열에도 있고 자연 계열에도 있는 융합 학문, 통계학과

 


‘통계’ 하면 복잡한 계산이 떠오르고 정통 자연 계열 전공처럼 느껴질 수 있지만, 통계학과는 대학에 따라 인문 계열에 소속돼 있기도 하고 자연 계열에 속해 있기도 하다. 이는 국내에 통계학이 도입된 배경과 관계있다. 1960년대 국가 경제 발전을 시작할 시기, 정확한 통계에 의한 정책 수립을 위해 고려대 정경대에 최초로 통계학과가 개설됐다. 그 후 성균관대, 연세대, 중앙대에도 인문 계열 통계학과가 신설됐고 동국대에서 처음으로 자연 계열 통계학과를 설립했다.


통계학은 수학적 방법을 이용해 자료를 분석하고 인문·사회적으로 통계적 의미를 파악하는 학문이다. 그야말로 계열 간의 융합을 제대로 보여준다. 소속 단과대는 다르지만 교과 과정상 큰 차이는 없다.
공통 과목은 미적분학, 선형대수, 행렬이론, 통계학입문, 확률론, 수리통계학, 회귀분석 등이다.

 

이론통계학 분야에서는 통계적 실험을 계획하고 표본을 추출하는 방법과 주어진 집단의 미지의 값을 추정하고 설정된 가설을 검정하는 방법을 배운다. 응용통계학 분야에서는 다양한 현상의 이해에 필요한 통계자료를 분석하는 기법을 익히고, 전산통계학에서는 SAS, SPSS, R 등의 통계 패키지를 사용해 통계자료를 분석하는 방법을 다룬다.

 

인문계 학생도 수학 관련 전공 과목을 배우는 데 무리는 없다고 한다. 고려대 통계학과 정환 교수는 “자연 계열은 수리적 이론을 중심으로 하는 대학들이 많고, 인문 계열은 이론과 응용의 조화에 주안점을 둔다. 미적분을 많이 다루지 않았던 학생들을 위해 통계수학을 가장 먼저 배운 후 응용 과목으로 들어갈 수 있도록 교육과정을 편성했다. 처음 통계학을 접할 땐 어렵게 느껴질 수도 있지만, 과정만 잘 따라가면 실력을 쌓을 수 있게 배려했다”고 말한다.


통계학은 경제학, 사회학, 심리학 등 사회과학부터 자연과학, 공학, 의학까지 광범위한 연구 분야와 접목될 수 있는 특징이 있다. 통계학은 응용 분야에 따라 생물통계·경제통계·심리통계·공업통계·환경통계·사회통계 등으로 나뉜다. 인문계 소속인 건국대, 연세대, 중앙대 응용통계학과는 현실 속의 경제·경영 활동에 필요한 통계적 방법론을 주로 다룬다. 인문 계열 통계학과와 응용통계학과는 실
제 활용의 측면에 방점을 두므로, 복수전공이나 이중전공을 적극 활용하는 학생들이 많다.

 

정 교수는 “통계학과 학생들은 경제·경영·심리는 물론 컴퓨터과학·바이오 등 다양한 제2전공을 많이 한다. 정량적 분석이 필요한 학문은 통계를 많이 활용하므로 학생들이 여러 분야에 지적 호기심을 갖게 된다”고 설명한다.

 


4차 산업혁명의 블루오션을 지향하며

 

정치, 경제, 사회, 과학 모든 분야에서 축적된 엄청난 양의 데이터로 인해 정량적 자료 분석에 대한 수요가 높아지면서 통계학이 더욱 주목받고 있다. 수리통계학 이론을 바탕으로 빅데이터를 분석하고 흐름을 통찰력 있게 파악, 미래를 예측할 수 있는 통계 전공자의 역할은 커질 수밖에 없다.

 

정 교수는 “통계학은 빅데이터나 비정형 데이터 분석에 사용되는 방법론을 다룬다. 사실 4차 산업혁명으로 현재 주목받는 연구들이 전통적인 통계학 연구 분야와 큰 차이가 있는 건 아니다. AI의 한 분야인 머신러닝이나 딥러닝은 데이터를 군집 분석하거나 분류 분석하
는 건데, 자료 분석 알고리즘 자체를 4차 산업혁명에선 중요하게 생각한다는 의미일 뿐이다.

 

통계학은 알고리즘 자체뿐만 아니라 한걸음 더 나아가 분석 이후의 통계적 검정까지 수행한다. 통계학과는 빅데이터와 AI의 큰 흐름에서 분석 능력과 의사소통 능력을 가진 인재를 배출하고 있다”고 강조한다.

 

 

취업 걱정 No! 대학원 진학 비중 높아

 

통계학과 졸업생은 대부분 전공을 살려 취업하고 자신의 전문적 지식을 활용할 수 있다. 은행, 증권, 보험회사 등 금융기관에 진출 가능하고 기업의 마케팅이나 광고 부서, 여론 조사기관에 취업할 수 있다.

 

전공 관련 자격증으로는 보험 계리사, 리스크 관리사, 재무 분석사, 사회조사 분석사, 정보처리기사 등이 있다. 통계학과 대학원에 진학하는 비율도 높은 편이다.

 

정 교수는 “대다수 기업에서 통계학 전공자를 선호한다. 학생만 원한다면 취업은 사실 문제가 없다고 봐도 된다. 그런데 학업을 이어
나가고자 대학원에 진학하는 비율이 높아 고려대의 경우 석사 과정 경쟁률이 5:1 이상이다”라고 전한다.

 

 

수학과 컴퓨터에 관심 많고 인문학적 소양 갖추면 금상첨화

 

통계학을 배우기 위해서는 수학에 대한 흥미가 가장 기본이 되어야 하며 컴퓨터 활용 능력도 갖추면 좋다. 정 교수는 “수학 역량은 물론, 사회 다방면에 관심을 갖고 사회 현상의 정량적 연구에 흥미가 있으면 된다. 통계학은 주어진 데이터를 정확히 분석하는 것도 중요하지만, 분석 결과에서 유의미한 요소를 뽑아내는 통찰력도 매우 중요하다. 자료를 객관화시켜 볼 수 있는 통찰력을 가지려면 인문·사회적 소양도 필요하다”고 조언한다.

 


MINI INterview 
“인문계 학생 위한 <통계수학> 수강 후 전공 수업에 자신감이 생겼어요”

서유리
고려대 통계학과 1학년



Q. 통계학과를 선택하게 된 계기는?

외고를 졸업했지만, 고등학교 때 가장 좋아하는 과목이 수학이었다. 고려대 통계학과는 정시로 입학했는데, 지원 당시 수학을 많이 활용할 수 있는 전공을 인문 계열에서 찾는 과정에서 통계학과를 선택하게 됐다.

 

 

Q. 전공 수업에 대한 느낌은?

통계학에 대해 아는 것이라고는 고작 고등학교 시절 <확률과 통계>에서 배운 평균이나 분산 같은 아주 기본적인 개념들이었다. 수학을 많이 쓰는 어려운 학문일 거라는 막연하고 단순한 생각뿐이었다. 1학기 전공 수업을 수강하면서 통계학이 실생활과 밀접한 학문이고, 수학을 많이 활용하지만 수학이 전부인 학문은 아니라는 것을 알게 되었다.


Q. 가장 흥미로웠던 수업은?

통계학의 기초적인 개념들을 배우는 <기초통계학> 수업이 가장 인상 깊었다. 1학년 전공 과목이라 깊은 내용을 배우지는 못했지만, 통계학의 전반적 내용을 접하며 남은 대학 생활 동안 공부하게 될 내용들을 미리 확인할 수 있어서 의미 있었다.


Q. 인문계 학생으로서 수학 수업이 어렵진 않은지?

고려대 통계학과는 1학년 1학기에 <통계수학> 수강을 권장하고 있다. <통계수학>은 가장 기본적인 미적분의 여러 내용을 다루는 과목으로, 고등학교에서 미적분을 배 우지 않았지만 이 과목을 통해 충분한 연습을 할 수 있었다. 한 학기 동안 수학을 다 지고 가므로 인문계 출신이어도 학교 수업에 잘 적응할 수 있다.


Q. 아직 1학년이지만 앞으로 통계학에서 연구하고 싶은 분야는?

빅데이터 관련 뉴스를 많이 접해서인지, 나도 현재로선 빅데이터 공부를 해보고 싶다는 생각이 어렴풋이 있다. 하지만 아직은 1학년이라 첫걸음을 내디딘 상황이므로, 앞으로 여러 강의를 듣고 열심히 공부하면서 어떤 공부를 하고 싶은지 찾아보려 한다.

 

 

Q. 통계학과에 지원하려는 고등학생 후배들에게 하고 싶은 말은?

수학에 흥미가 있고 데이터를 수집, 분석하는 데 관심이 있는 학생들에게 추천한다. 현재 사회, 과학, 문화, 경제 등 여러 분야에서 통계학에 대한 수요가 높아지고 있다. 정말 다양한 분야로 진출할 수 있는 실용성 있는 전공이므로, 아직 진로를 정하지 못한 학생들에게도 수학에 대한 거부감만 없다면 강력하게 추천해주고 싶다.

 

 


MINI INterview 
“머신러닝과 빅데이터 분석 위한 효율적 통계 분석 기법을 개발하고 싶어요”

권이태
서울대 통계학과 1학년

 

 

Q. 통계학과를 지원한 동기는?

원래는 통계학보다 생물학에 더 관심이 많았다. 고등학생 때 생물학 탐구 활동으로 히스톤탈아세틸화효소 억제제가 분열효모 전사체에 미치는 영향을 분석했는데, 이를 위해선 수천 개에 달하는 각 유전자들의 발현량이 약품 처리 전후 어떻게 변하는지 확인해야 했다. 이를 판별하기 위해 사용한 도구가 바로 통계학이었다.

 

유전자와 같이 많은 개수의 정보를 다룰 경우는 R과 같은 다양한 프로그래밍 도구들을 이용해야 하며, 데이터의 길이와 차원이 증가할수록 더 좋은 성능의 컴퓨터가 필요하다. 당시 통계학적 지식이 많이 부족해 만족스러운 분석 결과를 얻지 못했다. 그 후 생물학적 데이터로 유의미한 결과를 얻어내는 생물통계학에 관심을 가졌고, 통계학과에서 연구방법론적 지식을 얻고 싶어 지원했다.


Q. 가장 좋았던 전공 수업은?

서울대 통계학과는 1학년 1학기 때 권장하는 전공 수업이 없다. 1학년 때는 보통 물리학, 화학 등 과학 교과 교양 수업 위주로 수강하고 2학기부터 <전산통계 및 실험> 과목에서 R이라는 프로그래밍 언어를 이용한 통계처리 기법을 익힌다.

 

통계학과가 자연 계열에 있는 만큼, 단순한 자료 분석을 넘어 수학적 증명을 통해 왜 그렇게 분석해야 하는지 심도 있게 다룬다. 이를 위해 1학년 때 미적분학 과목에서 기초적인 다변수 미적분학을 공부하고, 2학년 때 해석학과 선형대수학 등을 배우며 수리통계학과 확률론을 위한 기반을 쌓는다.


이번 학기에 수강한 <해석개론 및 연습 1> 과목이 가장 기억에 남는다. 그동안 배웠던 계산 위주의 수학에서 벗어나 엄밀함 위에 극한, 미분, 적분을 쌓아내는데, 처음 접하다 보니 어렵기도 했지만 반대로 많은 흥미를 느꼈다. 특히 교수님들이 직접 편찬하신 교재를 사용했는데, 기초적인 위상 개념도 소개하고 있어 더욱 재미있게 이해할 수 있었다.



Q. 앞으로 통계학에서 연구하고 싶은 분야는?

통계학은 컴퓨터과학과 매우 밀접하지만, 우리가 일반적으로 사용하는 컴퓨터로는 유전자 발현량과 같은 많은 데이터를 이용한 작업을 수행하지 못한다. 머신러닝과 데이터 분석 과정에서 일반적인 하드웨어가 감당할 수 없을 정도의 계산량 부하가 쏟아지기 때문이다.

 

반대로 알고리즘의 계산량을 줄이고, 수많은 데이터 중 쓸모 있는 데이터만 골라내는 방식을 개발할 경우, 필요한 컴퓨터의 사양을 낮출 뿐만 아니라 처리 속도 역시 증가시킬 수 있다. 통계학을 이용해 머신러닝과 빅데이터 분석에 쓰일 수 있는 효율적인 통계 분석 기법을 개발하고, 궁극적으로는 일반인도 쉽게 사용할 수 있는 통계 분석 프로그램을 만들고 싶다.


Q. 통계학과를 희망하는 고등학생 후배들에게 조언한다면?

수학 실력은 통계학과를 지원하는 데 도움이 되지만 걸림돌이 되지는 않는다. 오히려 통계학과가 원하는 인재는 수학을 잘하는 학생이 아닌 ‘데이터 문해력’ 이 좋은 학생 같다. 문(文)해력이 주어진 글을 얼마나 비판적으로 읽어 요점을 파악하는지를 평가하는 척도라면, 데이터 문해력은 주어진 데이터와 그래프의 함의를 올바르게 파악하는 척도라고 볼 수 있다.

 

주어진 데이터가 제대로 얻어진 것인지, 그리고 그 결과는 올바르게 표시되었는지 판단할 수 있는 능력이 바로 데이터 문해력이다. 더불어 독서의 중요성을 강조하고 싶다. 독서는 지식을 쌓아줄 뿐만 아니라 데이터 문해력도 키워준다.