Book - 빅데이터를 지탱하는 기술 리뷰
데이터 엔지니어나 개발자가 읽으면 좋은 책으로 많이 추천되는 데이터 중심 어플리케이션 설계는 난이도가 높은 책이다. 그래서 많은 분들이 해당 책을 읽기전에 읽으면 좋은 책으로 빅데이터를 지탱하는 기술을 함꼐 꼽는다.
그래서 이번에 데이터 중심 어플리케이션 설계을 읽기전에 정리 할겸 빅데이터를 지탱하는 기술에 대해 리뷰하려고 한다.
이런 분들이 읽으시면 좋아요
데이터 엔지니어 취준생부터 주니어 개발자분들까지 읽으면 좋을 것 같다. 특히나 분산처리 시스템이나 효율적으로 데이터 처리를 하는 것에 관심이 있는 분들이라면 더더욱 추천한다.
그러나 이미 현업에서 하둡, 스파크, RDB에 대해 사용중이고 왜 사용하고, 어떤 상황에서 쓰여야는지나, 워크 플로우를 이미 사용하고 있다면 굳이 책을 사서 읽을 필요까지는 없어 보인다.
책에서는 무슨 내용을 다룰까
크게 보면 아래와 같은 내용을 다룬다.
- 데이터 레이크, 데이터 웨어하우스, 데이터 마트에 대한 개념과 목적
- 열 지향 데이터베이스와 행 지향 데이터베이스에 대한 효율성
- 빅데이터 데이터 파이프라인 구축에 대한 흐름
- Hadoop과 Spark를 이용한 데이터 수집과 분산처리 시스템
- 스트림 처리와 배치 처리에 대한 효율성
책을 읽고 느꼈던 점
책을 통해 역사의 흐름과 함께 ‘왜 이런 기술이 나왔고, 이렇게 발전해서 이런 흐름을 가진다’ 라는 것을 알게 되어서 자연스럽게 개념에 대해 알게 된다.
책이 자연스럽게 훌훌 읽히는걸보니, 정말 잘 작성된 책이 아닌가 싶다.