it leader
article thumbnail

 

 

비즈니스 데이터 과학 - 한빛미디어

안녕하세요 Pixui입니다.

오늘 리뷰할 책은 비즈니스 데이터 과학 이라는 책입니다. 빅데이터라는 말이 생겨나고, 실제로 기업들이 빅데이터를 이용하여 서비스에서 유의미한 데이터들을 추출하는 등 이러한 움직임이 생겨난 것이 벌써 3~4년도 더된 일입니다. 최근은 어떤가요? 빅데이터라는 기술이 활발하게 사용되고 있는것인걸까요? 포털사이트에서 빅데이터라고 검색해보면 활발한 활용이 이루어 지고 있다는 것을 알 수 있습니다. 부동산, 증권, 교통, 보건, 보안, 범죄 수사 등등 다양한 분야에서 빅데이터를 활용한 데이터 분석이 이루어 지고 있음을 알 수 있습니다. 그렇다면 우리는 어떻게 해야 하는 것일까요? 하늘에 뜬구름 잡는 듯한 이 분야에 대해 나와는 상관이 없는 것이다. 이렇게 단정 지을 것인가. 반대로 생소한 분야지만 알아두면 최소한 도움은 되겠지라는 심정으로 개념에 대해 알아 놓자. 어떤 것이 좋은 선택일지는 단정지을 수는 없지만, 팩트는 데이터 분석가에 대한 수요는 많지만, 도전하는 사람은 적고 이 분야는 앞으로 그들만의 리그(?) 쉽게 말해 기술 기득권층이 될 수 밖에 없는 분야가 될거라는 사실입니다. 이런 빅데이터 분석에 대해 이야기하고 있는 비즈니스 데이터 과학 리뷰를 시작해보겠습니다.

 

1. 데이터 과학

    빅데이터는 어떠한 데이터의 덩어리에서 패턴을 발견하는 것이고, 인과적인 결론을 도출하는 것이 통계적 추론이라고 합니다.
그래서 빅데이터에서는 통계용어가 더러 등장하기도 합니다. 기술통계, 상관 분석, 회귀분석, 분산 분석, 주성분 분석 등 여러 현상들을 가지고 예측을 검정하는 확률 및 통계적 기법이며 이런 기법들을 통해 객관적인 의사 결정을 수행하기 위하여 사용됩니다.  용어들을 주저리 주저리 설명해봤자 관련업계에 종사하는 분들이 아니고서야 이해하기는 어려울 것 같습니다만, 어떠한 현상을 파악하기 위해서 존재하는 데이터들 속에서 일련의 규칙성을 찾아과는 과정이며, 그 규칙을 통해 앞으로의 일을 예측하는데 객관적인 근거로 사용되어지는 기술이라고 보면 될것 같습니다. 이 책에서는 실제 저자가 시카고 대학교에서 계량경제학 및 통계학 교수로 재직하면서 데이터 과학 커리큘럼을 개발한 경험이 담겨 있고 더하여 머신러닝 알고리즘까지 친절하게 설명하고 있습니다. 그러니 통계분석에 머신러닝까지 배울수 있는 1석 2조의 책(?) 이라고 볼 수 있겠습니다.

 

2. 장점

    이 책은 다양한 데이터 모델링 방법에 대해서 소개하고 있습니다.  회기 모델링, 정규화 등등 데이터를 모델링하는 방법을 소개하고 있습니다. 또한 패턴을 알아내거나 어떤 미래의 값을 예측을 하기 위한 분석방법에 대해서 소개하고 있습니다. 물론 이책을 정독한다고 하더라도 

실제 서비스에서 어떤 데이터에서 유의미한 값을 추출해 내기란 여간 어려운일이 아니겠지만, 대략적으로의 개념을 파악하기에는 수박 겉햝기 식이라도 도움이 되리라 생각이 됩니다. 

 

이 책을 읽으면서 이해되는 부분도 있었지만, 앞부분에 수학식과 통계관련 용어들이 많이 등장하여, 조금 당황스러웠습니다. 학창시절 이과임에도 수학을 즐기지 못하여 이과를 선택했던것을 후회하던 옛기억이 떠오를만큼, 책을 읽으면서 썩 기분이 좋지 않았습니다. 뒤부분으로 가면서 아는 용어들이 좀 등장하여 그제서야 나쁜기분이 풀리기는 하였습니다. 빅데이터가 통계와의 연관성이 있음을 다시금 깨닿게 되었고 역시 데이터 사이언티스트의 길은 멀고도 험하다는 것을 다시금 알게해준 책이 아니었나 싶습니다. 그래도 빅데이터 관련 업에 종사하시거나 또는 데이터 사이언티스트를 꿈꾸는 분이 계시다면 정독하시는 것을 추천드립니다.  다음에도 알찬 리뷰로 돌아오겠습니다. 

 

 

 

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

profile

it leader

@dev__pixui

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!