SK채용 공식블로그

'machine learning'에 해당되는 글 1건

  1. 2016.12.15 인기만점 신입 사원이 될 수 있는 법? 빅데이터를 잡아라!

인기만점 신입 사원이 될 수 있는 법? 빅데이터를 잡아라!

혹시 신입 채용공고에서 ‘분석력’ 혹은 ‘분석적 사고’라는 단어를 본 적이 있는가? 최근 직군을 막론하고 영업, 영업 관리, 마케팅, 전략 기획 직무 등 다양한 직무에서 분석적 사고/분석력을 요구하고 있는 추세다. 한데 기업이 말하는 분석적 사고/분석력은 어떤 것을 말하는 것일까? 그리고 그 분석력은 어떻게 기를 수 있는 것일까? 이를 알기 위해  SK㈜ C&C Data서비스 개발팀 배기주 과장님을 만나 보았다. 그는 분석력이 필요한 이유를 최근 온/오프라인 마케팅에서도 활용도가 크게 늘고 있는 빅데이터 분석과 함께 이야기해 주었다,

 

 

 SK Careers Editor 이관형

 


분석력 혹은 분석적 사고를 갖춘 자?!
채용공고의 ‘분석적 사고를 갖춘 자’라는 문구를 보며, 내가 분석력이 있는 건지 의심이 들곤 했다. 하지만 기업이 원하는 분석력이 무엇인지에 대해 알고 가면 두렵지 않지 않을까, 라는 생각을 하게 됐다. 
 

 


통찰력과 데이터를 활용할 수 있는 능력! ‘난 그런 어려운 능력은 없는데’라고 벌써부터 포기하지 말 것. 말은 어려워 보이지만 사실 학교 수업의 과제, 팀 프로젝트, 공모전, 대회 등 우리는 일상의 다양한 경로로부터 분석력을 조금씩 길러왔으니 말이다. 이번 기사에서는 데이터 분석의 기본인 엑셀(Excel)과 대량의 데이터로부터 가치를 추출하고 분석하는 기술인 빅데이터에 대해 알아보기로 하겠다!

 

 


빅데이터 = 정보시대의 원유
빅데이터란 말 그대로 해석한다면 어마하게 많은 양의 데이터를 의미한다. 그리고 정형화된 데이터뿐만 아니라 비정형 데이터를 모두 포함하는 개념이다. 21세기 기업에 가장 중요한 자산은 데이터이다. 그리고 이를 관리하고 이 속에서 가치를 끌어올리지 못한다면 이 시대의 경쟁에서 살아남을 수 없다는 판단이 나올 정도로 데이터 관리의 중요성 역시 못지않게 대두되고 있다.

빅데이터를 흔히들 ‘원유’에 빗대어 표현하곤 한다. 원유를 가공하여 굉장히 다양한 상품을 만들 수 있다는 점에서 그렇다.  빅데이터 역시 원유처럼 굉장히 다양한 해결책을 가져다 줄 수 있다는 것을 의미한다.
 

 


<SK Careers Journal 홈페이지의 워드 클라우드>


빅데이터의 주된 특징은 크기, 다양성, 속도를 나타내는 3V(Volume, Variety, velocity)이다. 물리적 크기와 여러 가지 경우의 수를 나타내는 다양성 그리고 일련의 과정과 실시간 데이터 처리가 가능한 속도는 빅데이터 분석을 해야 하는 이유이다.

 

그럼 빅데이터로 가치를 만들어나가고 계신 SK㈜ C&C Data서비스 개발팀 배기주 과장님은 어떤 일을 하고 계신 걸까?

 

Q. 배기주 과장님~ 업무를 하시며 주로 어떤 분석 업무를 하고 계시나요?
다양한 이해관계자와 행복을 나누기 위해 많은 고민과 생각을 담아 분석을 진행하고 있습니다. SK그룹은 데이터를 생산하고 소비하는 측면에 있어서 Top Class이죠. SK㈜ C&C에서 저는 SK 주요 관계사들의 데이터를 거의 다 만져본 것 같습니다.


다양한 데이터는 곧 다양한 industry를 의미합니다. 통신, 제조, 에너지, 금융 등 industry 별로 생산되는 데이터는 그 성격과 의미가 완전히 다릅니다. 통신은 주로 사람에 의한 데이터라면, 에너지는 공장 기계에 의한 것입니다. 이처럼 데이터 성격이 다르니 분석도 당연히 industry에 맞게 진행되어야 합니다. 그런 점에서 산업별 데이터를 구별하고 처리하여 목적에 맞는 분석을 해나가고 있습니다.


최근 분석 도구는 정말 다양해지고 있습니다. 저희는 주로 R 기반으로 진행하고 있습니다만 개인적으로는 Phython과 Tensorflow를 병행하여 사용하고 있습니다. 앞에서 industry에 맞게 분석을 진행하다고 말씀 드렸는데, 그 측면에서 도구의 성능을 보고 선택하곤 합니다.

 

 분석 주제

Q. 그럼 업무에 있어서 빅데이터 분석은 어떻게 쓰이는 것인가요?
분석은 ‘분석 주제’라는 목적을 기반으로 진행됩니다. 김 대리님, 데이터 가지고 한번 봐볼래요? 라고 말하는 상사가 있다면 재취업을 심각하게 고민해 봐야 합니다(웃음)(진지). 데이터라는 재료로 무엇을 만들 것인지 목적을 정하지 않았으니, 그 배는 어디로 갈지 모릅니다.


예를 들어, 디자인팀이 2016 FW 여성 등산복을 개발하고자 합니다. 옷 자체가 무겁지 않고 고도에 따른 추위에 견디기 위해 거위털 충전제로 채울까 합니다. 주력 색깔은 계절성 보다 패션 트랜드를 고려하여 흰색으로 정했습니다.


가벼운 무게, 효율 좋은 충전제, 주력 색깔을 찾기 위해 디자인팀은 여러 경우의 수를 분석하고 고려하여 답을 찾아냈을 겁니다. 효율 좋은 충전제를 어떤 관점에서 찾고 평가할 것인지, 신소재를 고려할 것인지 등 말입니다. 분석 목적은 위 등산복처럼 다양합니다.

 

하지만 어느 정도 정형화되어 있습니다. 매출 향상이라는 기대효과로 등산복을 새롭게 개발하기 때문입니다. 이와 같은 것을 ‘분석의 기대효과’라고 말합니다.

 

디자인이 아닌 다른 직무의 분석은 다를 것이다라는 표현은 틀리지 않습니다. 마케터와 공장 엔지니어의 분석은 당연히 다릅니다. 데이터가 다르기 때문에 분석 기법 달라야 하고 결과도 달라집니다. 마케터는 고객 데이터와 상품의 전략을 위한 분석을 하고 엔지니어는 공장의 효율성을 높이기 위해 고민하기 때문에 분석 방향이 달라지는 것이죠. 하지만 궁극적인 분석의 기대효과는 직무 별로 다르지 않을 수 있음을 생각해 보셨으면 합니다.

 

 크기

Q. 기존의 엑셀 분석과 빅데이터 분석이 어떻게 다른가요?
엑셀을 필드에서 사용하지 않는 것은 데이터 크기가 너무 커졌기 때문입니다. 가끔 ‘엑셀을 너무 가볍게 보지 않나’라는 생각이 들곤 합니다. 엑셀로도 상관관계 분석, 회귀분석, distance 등 다양한 분석이 가능합니다. 문제는 많은 양의 데이터를 다룰 경우이죠. 제가 가장 크게 만져본 데이터는 7년치 데이터였습니다. 당연히 데이터는 여러 개의 파일로 나뉘어져 있었습니다. 엑셀파일 한 개를 더블클릭 한 순간, 전 다음 일을 할 수가 없었습니다. (데이터 수가 너무 많아 렉이 걸리기 때문이죠. T.T)

 


더불어 R, Phython 의 분석 도구에서 지원하는 다양한 알고리즘 때문입니다. Machine Learning 중에서도 어떤 알고리즘을 어떻게 튜닝 하느냐에 따라 결과는 정말 달라집니다. 이런 부분은 엑셀로는 불가능한 부분이지요. 그래서 엑셀은 분석 결과를 저장하는 수준으로 활용하고 있습니다.


 

Q. 과장님께서 생각하시는 현업에 있어서 어떤 분석적 사고와 분석력이 요구되는지 말씀해주세요.
“데이터와 대화”를 위한 약간의 분석 테크닉과 풍부한 데이터 접근법을 요구 드립니다. 그저 손 빠른 분석 코딩 테크닉을 절대 바라지 않습니다. 통계학적 지식으로 무장만한 두뇌를 희망하지 않습니다. 고객의 눈높이에서 데이터를 바라보고 접근할 수 있는 자세, 즉 “분석 로직 설계 능력”이 필요합니다. 설명 가능한 로직은 고객을 이해시키고 설득시키기 쉬운, 즉 잘 설계된 탄탄한 것입니다. 잘 설계된 로직 안에 어떤 알고리즘을 사용하였느냐는 부가적인 내용일 뿐입니다.

'통계쟁이'라는 단어를 들어보셨을 겁니다. 쟁이는 사람 또는 집단을 낮춰 부르는 단어이지요. 통계쟁이는 통계라는 그들만의 리그에서 활동하고 울타리를 넘지 못했기 때문입니다. 데이터 분석은 그들만의 리그에서 쿵짝하면 안됩니다. 분석은 분석 목적에 따라 상대방의 언어로 데이터와 대화하고 분석 결과를 설명하며, 최종적으로 의미 있는 결과로 상대방을 설득해야 합니다. 그러려면 분석 로직 설계 능력은 무엇보다 중요합니다. (*데이터 분석을 전문적으로 다루는 현직자의 의견입니다.)


이상 SK㈜ C&C Data서비스 개발팀의 배기주 과장님의 설명이었다. 그렇다면 빅데이터 분석을 어떻게 배워서 사용해 볼 수 있을까?

 

빅데이터 학습 방법


1. 빅데이터 커뮤니티 활동
ⅰ) Bic데이터(http://www.bicdata.com/): 빅데이터와 관련된 이슈와 자료가 있음.
ⅱ) MYSAS (http://www.mysas.co.kr/): SAS를 이용하는 이용자를 위한 커뮤니티.

 

2. 관련 책을 이용한 학습
ⅰ) 빅데이터 경영을 바꾸다 (함유근, 채승병 저, 삼성경제연구소): 빅데이터의 기본적 개념과 경영에 빅데이터가 어떻게 활용되는지에 대한 내용을 다룸.
ⅱ) 빅데이터 활용서 1,2(김경태, 안정국, 김동현 저): R을 이용한 데이터 분석 방법에 대한 내용을 다룸.

 

3. 컨퍼런스 및 교육 참가
ⅰ) Mindscale (http://mindscale.kr/): 기초부터 배울 수 있는 인터넷 강의 사이트
ⅱ) 신한카드 ‘SAM’: 매 방학 시즌마다 진행

 4. 빅데이터 분석 대회 참여
ⅰ) SAS 분석 챔피언쉽(http://www.sas-analytics.co.kr/index.asp)
ⅱ) 관광 빅데이터 분석대회(http://www.tourbigdata.co.kr/)

 

5. 자격증 취득
ⅰ) 데이터분석준전문가(ADsP), 데이터분석전문가(ADP)
ⅱ) 경영 빅데이터 분석사
빅데이터와 관련된 정보는 위와 같은 경로들을 통해서 접해볼 수 있다. 처음 접하는 경우 어렵다고 느낄 것이다. 대체적으로 일반적인 사무적인 업무는 빅데이터 분석이 없어도 수행이 가능하다. 하지만 마케팅과 영업 직무의 경우 기업의 소비자를 향한 분석이 중요하기 때문에 빅데이터를 이용한다면 수십 만 명의 고객 중 숨은 패턴과 미세한 변화를 알아차릴 수 있을 것이다. 또한, 고객의 소리에 빠르게 반응하고 업무 효율 역시 높이는 것이 빅데이터가 인기인 이유일 것이다.

뿌리 깊은 나무

배기주 과장님께서는 말씀하셨다. “빠르게 변화하는 빅데이터 leader가 되기 위해 근본에 집중해 주셨으면 합니다. Tensorflow 설치는 이렇게 한다, Spark는 이렇게 코딩하면 된다, Machine Learning은 이렇게 training 시키면 된다. 이런 내용은 몇 달 후엔 중요하지 않은 부분입니다. 관심 있는 기술, 분석 분야의 근본을 이해하고 활용할 수 있는 힘을 키우셨으면 합니다. 뿌리 깊은 나무는 흔들리지 않습니다.” 기술적인 부분이 부족하다고 빅데이터를 무서워하지 말았으면 한다. 결국은 기술 자체를 얼마나 잘 활용하는지에 달려있는 것이기 때문이다. 마지막으로, 분석에 대한 전문적인 기술만이 기업이 요구하는 분석력이 아닌 것임을 기억하길 바란다.

 

 

저작자 표시
신고
Posted by SK Careers Journal skcareers

댓글을 달아 주세요