Pentaho를 이용한 ETL 기본과정
|
교육개요 | 사용자의 의사 결정에 도움을 주기 위하여 기간시스템의 데이터베이스에 축적된 데이터와 외부데이터 등을 공통의 형식으로 변환해서 관리하는 데이터베이스 구축할 때 데이터의 추출, 변환, 저장, 조회 등의 ETL작업이 필요합니다. Kettle이라는 오픈소스를 제품화한 Pentaho사에서 제공하는 ETL툴인 Pentaho Data Integration은 GUI 작업 환경을 제공하는 Spoon, 작성된 작업을 Console에서 실행할 수 있는 Kitchen과 Pan, 원격 및 분산 실행을 위한 서버인 Carte 로 구성되어 있습니다. 작업에 대한 정보를 담은 메타데이터를 파일 또는 데이터베이스에 저장할 수 있고, 작업정보가 저장될 테이블들을 자동으로 생성해주고, 저장소 간의 import, export 기능도 제공하여 프로그래밍 언어에 익숙하지 않은 업무전문가 등과 공동 작업을 원할히 할 수 있습니다. 본과정을 통해 ETL 개념과 제품의 아키텍쳐를 이해하고 ETL개발에 사용되는 기본 객체에 대한 설명과 최종적으로 작업을 실행하고 그 결과를 모니터링할 수 있습니다. 이론: 40%, 사례: 20%, 실습: 40% ETL분야 최고의 기술력을 가진 실무자 직강 |
---|---|
수료조건 | 출석률 80%이상 |
교육목표 | ETL의 전반적인 이해 Pentaho 제품 아키텍쳐, 제품 구성요소의 이해 Pentaho 제품 설치 및 기본 사용법의 이해 Soure/Target 정의 및 변환/매핑의 이해 작업의 구성 및 실행 및 실행 결과의 모니터링 |
교육대상 | 데이터 추출/분석/집계를 원하는 현업 실무자 개발자 DBA 모델러 |
ETL 기본개념/구성요소 | 1. 개념 정의 1.1 ETL 이란 1.2 제품 아키텍쳐 1.3 제품 구성요소 1.3.1 Spoon 1.3.2 Kitch & Pan 1.3.3 Carte [데모] ETL 구현 데모 |
---|---|
ETL 활용 | 2. 기본과정 2. 기본과정 2.1 제품 설치 및 구성요소 확인 [실습] 제품 설치 및 구성요소 확인 2.2 소스/타켓 정의 2.2.1 DB 2.2.2 Flat 파일 2.3 변환/매핑의 이해 2.3.1 기본매핑 (1:1) 2.3.2 조인매핑 (n:n) 2.3.3 정렬/합계 매핑 (n:1) [실습] 매핑작업 2.4 실행 2.4.1 단위작업 실행 2.4.2 배치작업 구성 및 실행 2.4.3 실행결과 모니터링 [실습] 실행 및 모니터링 |