홍보 / 광고

  • 빅데이터 입문자를 위한 아파치 스파크(Apache Spark) 프로그래밍_빅데이터학원/스파크학원
선수학습 : 자바
교육기간 : 2018년01월19일(금) ~ 2018년01월20일(토) 10:00~18:00, 2일 총 14시간
강의장소 : 탑크리에듀교육센터 [A강의장]
교육문의 : 02-851-4790
수강료 : 420,000원 

강의 : 김상우 교수
서울대학교 전기컴퓨터공학부 졸업(학사)
서울대학교 전기컴퓨터공학부 졸업(석사)

[주요경력]
- Apache Spark 세미나 (스파크 사용자 모임)
- 데이터 분석 Scala 세미나 (스파크 사용자 모임)
- Apache Spark 강의 (코난테크놀로지)
- Apache Spark, Zeppelin (강의 네이버)
- 데이터 분석 강의 (T Dev Forum)
- 오픈소스 활용 강의 (미래부 공개 SW포럼)
- Spark on EMR 강의 (AWS Summit)
- 딥러닝을 위한 빅데이터 기술 (T Academy)
- Apache Spark 핵심개념 및 실습(대덕인재개발원)

[대외활동]
- 한국 스파크 사용자 모임 공동설립자, 운영진 전임강사
- Apache Software Foundation Comitter, PMC Member

교육개요최근에는 R, Python등으로 데이터 분석을 많이 하지만 이러한 한대의 컴퓨터로 데이터를 처리하기 때문에 처리 용량과 속도에 한계가 있습니다. 아파치 스파크 (Apache Spark)는 빠른 속도와 적극적인 메모리 활용, 간편한 인터페이스로 큰 인기를 얻고 있으며 머신러닝, 그래프 알고리즘, 실시간 스트리밍 처리등의 확장 프로젝트들을 제공하고 있습니다. 

본 과정에서는 스파크의 등장까지의 배경과 스파크의 핵심 개념에 대해 알아보고, 머신러닝, 스트리밍 등의 실습을 통해 단기간에 스파크에 대한 이해를 높이고 시스템에 바로 적용해 보는 것을 목표로 하고 있습니다.수료조건출석률 80%이상교육목표- 아파치 스파크의 등장까지의 배경 
- 스파크의 핵심 개념을 이해
- Scala 프로그래밍 언어를 학습 
- 스파크 RDD 인터페이스를 이해, 실습
- 스파크 SQL의 이해, 실습
- 스파크 MLlib의 이해, 실습
- Mllib과 스파크 ML을 이용한 머신 러닝 애플리케이션 개발 방법의 이해, 실습
- 스파크 스트리밍을 이용한 고속 데이터 스트림 처리 방법의 이해, 실습교육대상- 빅데이터에 관심 있는 자
- 아파치 스파크의 도입을 원하는 자
- 아파치 스파크에 관심있는 개발자, 데이터분석가, DB전문가


커리큘럼

빅데이터 스파크 프로그래밍 1일차Apache Spark이 나타나기까지
Spark 핵심개념
Scala 프로그래밍
- 기본문법
- 함수형 프로그래밍
RDD 프로그래밍
- 데이터 로드, 저장
- RDD Transformations
- RDD Actions
- 캐싱
Spark Core 실습
빅데이터 스파크 프로그래밍 2일차Spark SQL 
- Dataframe API 
- Spark SQL과 Zeppelin을 활용한 데이터 분석 
Spark Streaming
- Spark Streaming 개념 
- 스트리밍 분석 앱 만들기 – 트위터 분석
MLlib (머신러닝)
- MLlib Overview
- 예제 및 실습
0  COMMENTS