[Hadoop and Spark on Google Cloud with Spark Programming]
Course Description:
หลักสูตรนี้เป็นหลักสูตรระดับ Introduction ที่แนะนำหลักการที่ถูกต้องทางด้าน Machine Learning และเหมาะสมกับการนำไปใช้ในสภาพแวดล้อมจริงทางธุรกิจ โดยเฉพาะอย่างยิ่งเมื่อข้อมูลมีขนาดใหญ่ หลากหลาย Formats (Big Data) ผู้เรียนจะได้เรียนรู้กระบวนการทางด้าน Data Science ตามมาตรฐานของ CRISP-DM (Cross Industry Standard Process for Data Mining) บน Big Data Platform ผ่านการบรรยายและลงมือปฏิบัติจริงใน Real World Cases ที่หลากหลาย
การทำ Machine Learning ของหลักสูตรนี้ เป็นการเขียนโปรแกรมด้วยภาษา Python ร่วมกับการใช้ Apache Spark MLlib และ ML Pipeline บน Public Cloud จึงทำให้สามารถทำ Model Training ได้รวดเร็วและมีประสิทธิภาพดีกว่าวิธีการปกติ ผู้เรียนจะสามารถพัฒนา Code เพื่อทำ Exploration Data Analysis, Data Preparation, Transformation, Model Training และ Evaluation ตลอดจนการทำ Model Deployment ผ่าน REST API และการเขียน UI เพื่อให้ได้ system จริงๆ สำหรับการทำ Prediction พร้อมเข้าสู่ Production ต่อไปได้
ระยะเวลาอบรม : 3 วัน (9:00 - 16:30)
เครื่องมือที่ใช้ในการเรียน : ZOOM
Fee: 4,500 Baht exclude
กำหนดการอบรม
- Batch#11: 27 - 29 January 2021
- Batch#12: 10 - 12 May 2021
- Batch#13: 22 - 24 September 2021
วิทยากร:
คุณเอกอนันต์ ทองแท้
- Big Data Consultant at IMC Institute
- Former Manager of Architecture and Prototype at EGA
- Guest Lecturer in Many University, Courses of Data Mining and Information Security
- Former Director of Relations Network at Student Loan Fund
รศ.ดร.ธนชาติ นุ่มนนท์ ผู้อำนวยการสถาบัน ไอเอ็มซี
- Ex-Director, Software Park Thailand
- Certified Sun Java Instructor
- Lead Instructor for Mini Master of Java Technology KMITL
- Instructor for many universities and public organizations
ผู้ที่เหมาะเข้าอบรม
This course is designed for individual, who are interested in the development of a predictive system. Moreover, it is a fundamental course for an individual who plans to become a Data Scientist that would be succeeded in the Big Data era.
Prerequisite
- Strong interested in Machine Learning/Data Science, Basic knowledge of computer programming and statistics.
- Familiarity with Hadoop and knowledge of Python (recommended not mandatory).
Benefits
- Understand Data Science, several Machine Learning Techniques, and Big Data Technologies for Data Science
- Gain experiences of Spark MLlib and ML Pipeline and other tools on the cloud.
- Being able to utilize and apply the Data Science standard processes to Big Data problems.
- Obtain knowledge of implementing Predictive Analytics with real-world cases, such as Prediction of Loan Payment and/or other real-world cases.
- Getting an experience of making a predictive system.
Course Outline
Day 1:
- Introduction to Data Science and Methodology.
- Introduction to Machine Learning.
- Classification
- Clustering
- Recommendation
- Introduction to Big Data and Hadoop Ecosystem for Data Science Process.
- Hands-on: Jupyter for Data Science.
Day 2
- Understanding of CRISP-DM (Data Science Standard Process)
- Exploratory Data Analysis, such as Histogram, Correlation Analysis, etc.
- Data Cleansing, Normalization/Standardization, and other preparation.
- Data Transformation, such as Discretization, etc.
- Basic Programming using Spark SQL.
- Basic Programming using Spark MLlib and ML pipeline.
- Hands-on: Python and Spark for Classification.
- Hands-on: Python and Spark for Clustering.
Day 3
- Data Science with Jupyter on Google Dataproc/ Google Datalab.
- Hands-on: Prediction of Loan Payment / Other real-world cases
- Model Deployment with GUI and REST APIs
For more information, contact our course coordinator on:
Ms.Kwanhathai Thavornpong / Ms.Pakawan Udomphan/ Mr.Boonyarat Kalayanapradit
Mobile: 088-192-7975
Tel: 02-233-4732
E-mail: kwanhathai@imcinstitute.com / pakawan@imcinstitute.com / contact@imcinstitute.com/ boonyarat@imcinstitute.com