‘오픈시프트로 데이터 분석 라이프사이클 구축하기’…레드햇 포럼 서울 2018(하)

11월 6일 서울 코엑스 인터컨티넨탈 호텔에서 레드햇 포럼 서울 2018이 열렸습니다. 지난달 IT업계에 큰 이슈가 있었는데요. 분야 역대 최고 인수액을 기록한 IBM의 레드햇 인수합병 뉴스였습니다.(IBM, 레드햇 38.8조원에 인수…미국 기술분야 역대 3번째 빅딜 – 2018.10.29 개기자의 큐레이션)

IBM의 레드햇 인수 후 열린 레드햇 포럼에 개발하는 기자, 개기자가 다녀왔습니다.

지난 ‘디지털 트랜스포메이션은 레드햇처럼…레드햇 포럼 서울 2018(상)’, ‘‘레드햇의 자부심, IBM 인수 후에도 독립 경영한다’…레드햇 포럼 서울 2018(중)’ 기사와 이어지는 시리즈 기사입니다. 이번 기사에서는 레드햇 포럼 서울 2018 오후 세션 참관기를 소개합니다.

레드햇 포럼 서울 2018은 2개 트랙으로 진행됐습니다. 개기자는 ‘데이터 사이언티스트를 위한 빅데이터 분석 컨테이너 구축’ 그리고 ‘Trident를 통한 쿠버네티스/오픈시프트 데이터관리’ 총 2개 세션을 듣고 왔습니다.

데이터 사이언티스트를 위한 빅데이터 분석 컨테이너 구축 – 김도은 굿모닝아이텍 이사

▲김도은 이사. / 오세용 기자

소프트웨어 전문지 마이크로소프트웨어 395호는 데이터 사이언스 특집으로 준비하고 있습니다. 데이터 사이언티스트가 되기 위해 필요한 기술이나, 실제 데이터 사이언티스트의 이야기 등 다양한 원고를 모으고 있는데요. 마침 김도은 이사의 세션이 개기자의 레이더망에 잡혔습니다.

김 이사의 스피치는 각자 업무 환경이 다른 분석가들이 겪는 문제에 대한 해법을 제시했습니다. 기업 내 분석가가 많아져 각기 다른 환경에 빠르게 적용하기가 어려워지는 것인데요. 자원은 제한적이고, 운영의 효율성도 필요하니 풀기 쉬운 문제는 아니었습니다. 김 이사는 이를 오픈시프트로 풀었습니다.

▲레드햇 오픈시프트. / 레드햇 제공

컨테이너 기반 PaaS 플랫폼인 오픈시프트는 각기 다른 데이터분석가의 환경을 효율적으로 운영하기에 좋은 플랫폼이 됐습니다. 김 이사는 오픈시프트 외 해당 시스템 구성도를 설명했습니다.

▲시스템 구성도. / 레드햇 제공

이어서 데이터 분석 라이프사이클을 소개했는데요. 하이브(HIVE)에서 데이터를 적재하고, R스튜디오로 데이터를 가공, 주피터 노트북(Jupyter Notebook)과 텐서플로(TensorFlow)로 분석을 합니다. 이렇게 만들어진 데이터 분석 모델을 깃(git)에 올려 각 데이터 분석가들이 사용하게 합니다.

▲데이터 분석 라이프사이클. / 레드햇 제공

이어서 도커(Docker) 컨테이너에 대한 상세 소개를 했는데요. 도커는 지난 마이크로소프트웨어 394호 클라우드 혹은 도전(CLOUD or DARE)에 자세히 소개 돼 있으니 참고하시면 좋습니다.

Trident를 통한 쿠버네티스/오픈시프트 데이터관리 – 김진학 넷앱(NetApp) 부장

▲김진학 넷앱 부장. / 오세용 기자

김진학 부장은 데이터 관리에 대한 스피치를 하기 전 간단한 사례를 들었는데요. 테슬라의 충전소 사례였는데 적절한 사례를 잘 설명한 것 같습니다.

▲테슬라 일론 머스크 트위터. / 오세용 기자

테슬라 전기차 사용자가 트위터에 일론 머스크를 태그하며 ‘이미 충전된 차량이 계속해서 충전하고 있다’는 불만사항을 보고합니다. 이에 테슬라는 즉시 조치하겠다 말했고, 1주일 뒤 전 세계 슈퍼차지 서비스에서 업데이트가 됐습니다. 완충 뒤 계속해서 충전하고 있으면 해당 차량에 페널티가 부과되는 업데이트였는데요. 김 부장은 이렇게 즉시 조치가 가능했던 이유로 테슬라의 아키텍처에 관해 이야기 했습니다.

이후 도커와 컨테이너에 관해 설명했는데요. 역시 관련된 상세 내용이 지난 마이크로소프트웨어 394호 클라우드 혹은 도전(CLOUD or DARE)에 자세히 소개 돼 있으니 참고하시면 좋습니다.