[생각] 실무에 통계학 이론을 어떻게 접목시킬까?

스탯's avatar
Dec 28, 2023
[생각] 실무에 통계학 이론을 어떻게 접목시킬까?
필자는 대학교 전공이 통계학과다. 대학교 4학년 동안 대단한 교수님들 밑에서 어려운 수학, 통계학 이론들을 배웠고 학과 사람들에 뒤쳐지지 않기 위해서 수업 시간에 배운 것들을 열심히 공부하며 시험을 쳐왔다.
 
다행히 성적도 만족스럽게 받았고 취업을 하든 대학원을 가든 스펙이 완벽한 것은 아니지만 6개월에서 1년 정도 준비하면 취업에는 문제가 없는 상황을 4학년 때 맞이했다. 그랬기 때문에 나는 인생 진로를 어떻게 해야 할지 진지하게 고민하는 시간을 가졌었다.

통계학은 메인이 될 수 없어?

필자는 원래부터 나만의 전공 지식과 활용 능력을 활용하여 시장에서 돈을 많이 받을 수 있는 전문가가 되고 싶었다. 그래서 바로 취업을 한다면 진입장벽이 낮은 분야에 갈 수 밖에 없다는 생각을 하게 됐다. 내가 만약 열심히 공부해서 취업을 했다 치더라도 나랑 똑같은 시험 준비를 해서 나랑 비슷하거나 성적이 높은 사람이 들어와서 나랑 똑같이 경쟁을 한다면 나는 회사와 시장의 선택을 받을 수밖에 없는 사람이 될 수 있을까? 나의 결론은 No였다.
 
선배들을 포함한 주변의 많은 사람들은 나에게 이렇게 얘기한다.
🤔
야 공무원이랑 대기업도 충분히 빡센 경쟁률을 뚫고 들어가는 거야. 그게 경쟁력이 안 된다고? 열심히 해보지도 않고 미리 그런 생각을 왜 해?
 
물론 이런 이야기를 하는 사람들 중에는 나를 진심으로 걱정하는 사람들이 있다. 하지만 나와 생각하는 결이 다르다고 느껴서 받아들이지 않았다. 왜냐하면 나는
차에 치이면 심하게 다치는 것을 머릿 속으로 이해하고 안 하고 싶지 그걸 직접 치여봐서 다치고 싶지 않기 때문이다.
 
나는 남들과 혹은 내가 똑같은 노력을 하더라도 더 많은 보상을 받길 원했다. 나의 적성에 맞으면 더욱 금상첨화고. 그렇기 때문에 데이터 사이언스와 인공지능이 떠오르는 지금 시기에 나는 통계학을 100% 활용해야 한다고 생각했다.
 
😮‍💨
내가 취업을 준비하면서 느낀 건 통계학은 메인이 될 수 없어. 통계학이요? 회사에서 코드 작성하면 그런 거 몰라도 되요.
하지만 학부 때 알고 지내던 선배들이 이러한 이야기를 하시는 걸 듣고는 앞선 사례에서는 통계학을 살려서 직업에서 일하고 계신 선배들이 별로 없다는 것을 알게 됐다(물론 금융공기업 통계직렬 제외)

아무런 가이드가 없는 통계학 전공 살리기

통계학을 살려 데이터 사이언스와 인공지능 분야에서 나만의 전문 능력을 쌓기로 했지만 사실상 나에게 주어진 정보는 0이었다. 왜냐? 이 글을 읽고 있는 사람들 중에서 영어 포함 100개의 인터넷 포스팅을 읽었을 때 글의 신뢰성과 글에 담긴 내용을 어떻게 받아들일지 자신만의 주관이 명확한 사람이 있는지 묻고 싶다. 나는 없었다.
 
가끔씩 실무에서 분석하기 위한 책을 읽으면 틀린 내용을 당당하게 써놓은 것을 볼 수 있다. 주변 사람들이 그런 책을 읽고 있으면 나는 “이게 말이 돼?”라고 물어보면서 내가 알고 있는 지식이 잘못된 것인지 다시 떠올려보고 실제 전문 서적들의 내용과 해당 책 내용을 비교해본다.
 
🔥
물론 모든 책이 그런 것은 아니기 때문에 모든 사람들을 까는 자세는 잘못된 태도라고 생각한다.
 
중요한 것은 인터넷에 양질의 정보와 좋은 컨텐츠가 많이 쌓여있더라도 그 내용이 맞는지 틀린지 어떻게 받아들일지는 좋은 스승 혹은 업계에 있는 인맥(친구 포함)이 없으면 학습하기 힘든 상황이 된다. 그런 부분을 해결하기 위해서는 정말 많은 노력과 시간과 비용을 들여야 하는 것을 대학교 졸업 시기에서 3년이 지난 지금 결론을 내릴 수 있었다.
 

그렇다면 우리는 어떻게 통계학을 살려야 할까? 공모전?!

필자는 원하는 대학원에서 필요한 교육을 받아 취업이 힘든 시기에 20년도부터 꿈에 그리던 데이터 사이언티스트가 됐다. 비결은 운이 정말 좋았다. 주변에서 내가 고생한 것을 본 사람들은 그렇게 열심히 노력해왔으니까 운을 잡을 수 있었다고 말해준다. 정말 고마운 이야기지만 그 운이 오지 않았다면 나는 데이터 사이언티스트가 되지 못하고 데이터 분석가나 BA 직군으로 갔을 가능성이 높다. 물론 그게 나쁜 것은 아니지만 통계학을 살려 깊은 분석을 하고 싶은 나에게는 그게 좀 아쉬운 부분이었다.
 
지금 대학교 4학년 때부터 학과 후배들 데리고 했던 실제 분석 경험들은 나나 후배들이나 모두에게 좋은 경험이 되어 나 빼고 다 대기업에 들어갔다ㅋㅋㅋㅋ
😆
지금 대학교 4학년 때부터 학과 후배들 데리고 했던 실제 분석 경험들은 나나 후배들이나 모두에게 좋은 경험이 되어 나 빼고 다 대기업에 들어갔다ㅋㅋㅋㅋ
 
물론 방향성이 조금 달라진 것은 있겠지만 데이콘의 분석 경진 대회에 한, 두 번씩 참가해보면서 실제로 내가 내놓은 분석이 사회에 어떤 도움이 될까? 라는 의문과 고민을 해보는 것도 좋은 경험이었다. 특히 LightGBM이랑 XGBoost with CART 등의 Tree 기반의 Boosting 모형을 써서 좋은 결과를 얻었는데 그래서 이게 무엇을 의미하는 것인지 모르겠어서 답답했던 마음이 나의 공부 동력에 가장 큰 도움이 되었다.
물론 지금까지는 통계학(베이지안 포함), 머신러닝, 딥러닝, 강화학습, 토픽모델링, GNN 등의 기본 틀과 개념들을 공부했기 때문에 실제로 필요한 분야가 있다면 내가 배운 틀을 바탕으로 빠르게 학습해서 현업에 적용할 생각이기는 하다.
 
하지만 지금까지도 데이터가 고정되어 있는 논문을 제외한 현업 서비스에 부스팅이 사용된다는 것은 제대로 본 적도 없으며 오히려 캐글 때문에 부스팅이 유명해져서 남발되고 있다는 글을 본 기억이 가장 인상깊었다.
 
그래서 공모전을 열심히 한다고 해서 극복할 수 있는 사례는 아닌 것 같다. 물론 대학교, 대학원 수업을 열심히 들으면서 좋은 저널에 논문을 게재하거나 경진대회에서 좋은 성적을 잘 받는 사례들도 있다. 그것은 물론 취업에도 도움이 된다. 그런데 그 뒤로는? 산업계에 나와서 월급 받고 일하는 사람이 됐으면 내가 한 분석과 모델링이 실제로 세상에 도움이 되어야 하고 그러려면 현실의 다양한 제약을 고려하여 이익을 만들 수 있는 나만의 인사이트가 필요하다. 그건 어떻게 해결할 것인가?

실전 경험의 부재?!

이런 부분에서 통계학과가 많이 힘들다는 생각이 들었다. 대학교 다니던 시절에 과에서 복수전공으로 가장 인기가 많았던 학과는 컴공이었다. IT 부흥기도 있었지만 내가 배운 것을 바로 코드로 구현하며 이것저것 실험하고 신기해할 수 있었던 경험도 분명 좋은 쪽으로 작용했을 것이다.
그에 비하면 통계학은 책 속의 지식과 계산 방법을 배우고 외워서 시험을 치더라도 논문을 제외하고는 통계학이 현실에서 활용되는 사례를 보기도 힘들고 직접 주체적인 분석을 내놓기는 힘든 상황이다. 수업 시간에는 이론을 열심히 배우지만 이걸 현실에 접목한 사례와 직접 적용할 수 있는 사례는 많이 적다. 그런 상황이 생기더라도 실전에서 우리가 배운 것을 어떻게 활용해야 할지 모르는경험이 없기 때문에 실전에 바로 투입되면 실전 지식을 배운 학문에 비하면 어려운 상황이기도 하다.
여기서는 학교 외 기관의 도움을 받을 수만 있다면 최고일 것이다. 예를 들어 캐글이나 데이콘, UCI처럼 데이터를 제공해주고 직접 모델링을 해 볼 수 있는 기회가 생긴다면 그것만큼 뇌에 깊숙이 자리 잡힐 교육이 따로 없을 것이다.
 
더 업그레이드 하기 위해서는 구체적으로 도움이 되는 분석 결과를 내기 위해서 대학교, 대학원에서 배웠던 이론, 지식들을 현실 문제에 연결하여 구상할 수 있다면, 자신의 생각과 장점을 내뿜을 수 있는 포트폴리오가 될 것이다.
이게 아무나 할 수 있는 것은 아니다. 많은 사람들이 공감하기 힘들 수 있지만 필자는 분석 역량 또한 농구 선수나 축구 선수의 역량과 비슷하다고 생각한다. 비록 몸을 쓰지는 않지만 스포츠 선수들이 많은 연습을 통해서 스킬들을 몸에 익히고 실전 경험을 쌓아가면서 스킬들을 실전 상황에서 능숙하게 사용하듯이, 분석 능력도 이론 공부(스킬 연습)를 열심히 해서 머리에 내재화하고 현실의 데이터들을 많이 보면서 실전에서 적절한 분석 방법들을 적용해야 할 필요성이 있는 것이다. (생각해보니까 요즘 농구선수, 축구선수들은 스킬은 물론이요 복잡한 전술을 이해하고 실전에서 이행할 수 있도록 뇌지컬까지 뛰어난 것 같다👍)
 
그래서 필자는 통계학의 이론이 현실에서 적용된 사례, 현실의 서비스들 중에서 섞여있는 통계학, 데이터 사이언스 사례들을 많이 찾아보고 이에 대해서 뜻이 맞는 사람들과 많은 이야기를 나눠봐야 한다고 생각한다. 거기다 내가 직접 찾아보거나 정리한 내용의 인사이트를 잃어버리지 않고 핵심만 짚어서 학습할 수 있다?! 이건 100퍼 그 사람만의 오리지널리티가 될 것이다.
 
학부 3학년 과목에서 수리통계학, 다변량 분석, 회귀분석, 전산통계(computational statistic)등 전문적인 지식들을 배우지만 시험이 끝나거나 강의가 끝나면 나에게 남는 지식이나 능력은 별로 없다. 왜일까? 배운 것을 직접 활용하여 돈을 벌어보거나 이야기로 승화시킬 만큼 실제 사례에 접목시켜 분석할 기회가 별로 없기 때문이다.
 
결국 학교에서 시장 수요에 맞춰 데이터 분석 수업같은 학부 수업을 제시하는 것은 힘든 상황이다. 시장의 상황을 알며 그에 따른 전공 지식들을 정리하여 전달할 수 있는 교육기관이나 과정이 있다면 그건 학생들에게 엄청난 오리지널리티를 제공할 것이다. 왜냐하면 대학교, 대학원 수준의 통계학 이론 이해력과 현장에서 필요로 하는 활용 능력을 가지고 있는 사람은 극히 드물기 때문이다.

대안은?

대학원, 동아리, 학원 모두 상관 없다. 좋은 스승(멘토)이 있는 곳을 알고 거기서 그 분에게 배울 수 있으면 바로 배우는 것을 추천한다.
그 외에는 솔직히 잘 모르겠다.
🤔
열심히 공부해서 다 해결된다?
 
필자는 열심히 농구하면 NBA 데뷔할 수 있다, 라는 말과 동일한 이야기라고 생각하는 사람이라 좋은 스승님 혹은 좋은 학습 과정을 경험할 수 있는 곳에서 배우는 것이 최고라는 생각한다.
 
전에 썼던 토스 글을 다시 본 적이 있는데 그 때 다시 한 번 느꼈던 것은 회사 또한 투자사한테 투자만 받고 끝나는 것이 아닌 성공을 위한 전세계 비즈니스의 각종 노하우를 배우는 것이 필요하다, 였다. 자본과 인재들이 모여있는 회사도 멘토가 필요한데 취업 시장에서 통계학이라는 학문을 활용하고 싶은 사람은 더욱 좋은 스승님(멘토)가 필요하다고 생각한다. 이것은 학계에서 연구할 대학원생에게도 마찬가지일 것이다.
 
필자가 하는 이야기가 모두에게 맞는 것은 아니겠지만 가능하다면 좋은 멘토를 찾아서 자신의 성장을 이끌어내고 취업 시장에서 인정받는 것뿐만 아니라 회사와 시장에게 중장기적으로 인정받을 수 있는 실력과 노하우를 겸비하였으면 좋겠다. 그래야 한국의 데이터 사이언스 업계가 축소되지 않고 계속 클 수 있을 테니까.
Share article

스탯블로그 - 데이터 사이언스