Data Science
Trainer
Nasrul Alawy
Fullstack Engineer at Digitelnusa
Kurikulum
Hari 1: Pengenalan ke Data Science dan Python
- Kompetensi:
- Memahami ruang lingkup dan aplikasi data science.
- Dasar pemrograman Python untuk data science.
- Materi:
- Pengenalan ke Data Science: Definisi, ruang lingkup, dan pentingnya.
- Pengenalan ke Python: Sintaks dasar, tipe data, dan operasi.
- Kegiatan Pembelajaran:
- Presentasi tentang pengenalan data science.
- Instalasi dan setup Python dan lingkungan pengembangan (IDE).
- Latihan dasar pemrograman Python.
- Indikator Pencapaian Kompetensi:
- Peserta dapat menjelaskan apa itu data science dan aplikasinya.
- Peserta mampu menulis kode Python dasar.
- Penilaian:
- Kuis pemahaman tentang data science.
- Tugas praktik pemrograman Python.
- Alokasi Waktu:
- 8 Jam
- Sumber Belajar:
- Slide presentasi.
- Dokumentasi Python.
- Platform pembelajaran online seperti Coursera atau edX.
Hari 2: Pengolahan dan Analisis Data dengan Pandas dan Numpy
- Kompetensi:
- Mengolah data menggunakan Pandas.
- Melakukan operasi matematika dan ilmiah dengan Numpy.
- Materi:
- Pengenalan ke Pandas: Dataframe dan series.
- Pengenalan ke Numpy: Array dan operasi vektor.
- Kegiatan Pembelajaran:
- Latihan pengolahan data dengan Pandas.
- Latihan operasi Numpy pada dataset.
- Indikator Pencapaian Kompetensi:
- Peserta mampu mengolah dataset dengan Pandas.
- Peserta dapat melakukan operasi matematika dasar dengan Numpy.
- Penilaian:
- Proyek mini pengolahan data.
- Latihan soal Numpy.
- Alokasi Waktu:
- 8 Jam
- Sumber Belajar:
- Dokumentasi Pandas dan Numpy.
- Tutorial online.
Hari 3: Visualisasi Data dengan Matplotlib dan Seaborn
- Kompetensi:
- Membuat visualisasi data yang informatif dan menarik.
- Materi:
- Dasar Matplotlib: Plot, bar chart, pie chart.
- Pengenalan Seaborn: Heatmaps, pairplots.
- Kegiatan Pembelajaran:
- Latihan membuat berbagai jenis visualisasi dengan Matplotlib.
- Eksplorasi data dengan visualisasi Seaborn.
- Indikator Pencapaian Kompetensi:
- Peserta mampu membuat visualisasi dasar dengan Matplotlib.
- Peserta dapat menggunakan Seaborn untuk visualisasi data lanjutan.
- Penilaian:
- Tugas pembuatan dashboard visualisasi data.
- Alokasi Waktu:
- 8 Jam
- Sumber Belajar:
- Dokumentasi Matplotlib dan Seaborn.
- Buku referensi visualisasi data.
Hari 4: Machine Learning Dasar dengan Scikit-Learn
- Kompetensi:
- Memahami konsep dasar machine learning.
- Menerapkan model machine learning dasar.
- Materi:
- Pengenalan machine learning: Supervised vs unsupervised learning.
- Regresi linear dan logistic regression.
- Klasifikasi dengan K-Nearest Neighbors dan decision trees.
- Kegiatan Pembelajaran:
- Latihan membangun model regresi dan klasifikasi.
- Evaluasi model menggunakan metrik kinerja.
- Indikator Pencapaian Kompetensi:
- Peserta mampu membangun dan mengevaluasi model regresi dan klasifikasi dasar.
- Penilaian:
- Proyek kecil penerapan model machine learning pada dataset nyata.
- Alokasi Waktu:
- 8 Jam
- Sumber Belajar:
- Dokumentasi Scikit-Learn.
- Kursus online tentang pengantar machine learning.
Hari 5: Proyek Akhir dan Review
- Kompetensi:
- Mengaplikasikan konsep dan teknik data science dalam proyek nyata.
- Kerjasama tim dalam mengerjakan proyek.
- Materi:
- Pengembangan proyek data science dari awal hingga akhir.
- Kegiatan Pembelajaran:
- Pembagian tim dan brainstorming ide proyek.
- Pengerjaan proyek.
- Presentasi hasil proyek.
- Indikator Pencapaian Kompetensi:
- Peserta dapat mengimplementasikan pipeline data science secara lengkap.
- Peserta mampu bekerja dalam tim dan mempresentasikan hasil kerja.
- Penilaian:
- Evaluasi proyek akhir berdasarkan kreativitas, kelengkapan, dan presentasi.
- Alokasi Waktu:
- 8 Jam
- Sumber Belajar:
- Studi kasus industri.
- Bimbingan dari mentor.