1. Embulk 설치 - Embulk란?
빅데이터 분석에 있어서, 아키텍처적으로 중요한 모듈중의 하나는 여러 서버로부터 생성되는 데이터를 어떻게 모을것인가이다.이를 편하게 해주는 Embulk라는 좋은 솔루션이 있다. Embulk 소개 Embulk는 Sqoop과 거의 같은 기능을 하는 솔루션으로 여러 데이터 소스로 읽어와서 부어주는 기능을 하는 솔루션이다. Embulk 특징1. 플러그인 형태로 여러 데이터 소스를 이용할 수 있다. (BigQuery, Oracle, MySQL, PostgreSQL, CSV, JSON…)2. 병렬로 로딩이 가능하다.3. 스키마를 예측해서 해당 스키마가 없으면 알아서 만들어 준다. 테스트 환경 이 글에서는 Google Cloud Platform의 (이하 GCP) VM과 Cloud SQL을 이용하여 테스트를 진행한다. ..