2
Most read
3
Most read
4
Most read
Machine Learning dengan R
Muhammad Rifqi Ma’arif, M.Eng
Matakuliah Ilmu Data Industrial
Program Studi Teknik Industri
Fakultas Teknik & Teknologi Informasi
Universitas Jenderal Achmad Yani Yogyakarta
2020
Pengantar Machine Learning
• Machine learning adalah cabang dari artificial intelligence.
Kecerdasan buatan memiliki pengertian yang sangat luas
tapi secara umum dapat dipahami sebagai komputer
dengan kecerdasan layaknya manusia.
• Sedangkan machine learning memiliki arti lebih spesifik
yaitu menggunakan metode statistika untuk membuat
komputer dapat mempelajari pola pada data tanpa perlu
diprogram secara eksplisit.
• Machine learning dibagi menjadi beberapa kategori.
Tepatnya ada empat kategori besar, yaitu supervised
learning, unsupervised learning, semi-supervised learning,
dan reinforcement learning.
Supervised Learning - Klasifikasi
• Klasifikasi adalah teknik untuk menentukan kelas
atau kategori berdasarkan atribut yang diberikan.
• Klasifikasi yang menghasilkan dua kategori disebut binary
classification,
• Klasifikasi yang menghasilkan 3 kategori atau lebih disebut
multiclass classification atau klasifikasi banyak kelas.
• Teknik-teknik Klasifikasi
• Decision Tree
• Random Forest
• Support Vector Machine
• Artificial Neural Network
Decision Tree
• Decision tree atau pohon keputusan adalah
salah satu algoritma supervised learning yang
dapat dipakai untuk masalah klasifikasi dan
regresi.
• Decision tree merupakan algoritma yang powerful alias
mampu dipakai dalam masalah yang kompleks.
• Decision tree juga merupakan komponen pembangun
utama algoritma Random Forest, yang merupakan
salah satu algoritma paling powerful saat ini.
• Decision tree memprediksi sebuah
kelas (klasifikasi) atau nilai (regresi)
berdasarkan aturan-aturan yang
dibentuk setelah mempelajari data.
Decision Tree dengan R
• Dataset (Iris Dataset)
• Dataset iris merupakan salah satu
dataset populer untuk belajar
bagaimana ML dipakai dalam klasifikasi.
Dataset ini berisi 150 sampel dari 3
spesies bunga iris.
• Pada dataset Iris terdapat 4 kolom
atribut yaitu panjang sepal, lebar sepal,
panjang petal, dan lebar petal.
• Untuk label terdapat 3 kelas atau
kategori atau jenis yang terdapat pada
dataset yaitu Setosa, Versicolor dan
Virginica. Kelas adalah.
Decision Tree
dengan R
Supervised Learning - Regresi
• Regresi adalah salah satu teknik machine learning yang
mirip dengan klasifikasi. Bedanya pada klasifikasi, sebuah
model machine learning memprediksi sebuah kelas,
sedangkan model regresi memprediksi bilangan kontinu.
Bilangan kontinu adalah bilangan numerik.
• Regresi linier adalah salah satu metode supervised yang
masuk dalam golongan regression, sesuai namanya.
• Contoh paling terkenal dari regresi linier adalah
memperkirakan harga rumah berdasarkan fitur
yang terdapat pada rumah seperti luas rumah,
jumlah kamar tidur, lokasi dan sebagainya.
• Regresi linier cocok dipakai ketika terdapat
hubungan linear pada data.
Regresi Linear
dengan R
Unsupervised Learning - Klastering
• Klaster (cluster) adalah sebuah grup yang memiliki kemiripan tertentu.
• Pengklasteran adalah sebuah metode machine learning unsupervised
untuk mengelompokkan objek-objek yang memiliki kemiripan, ke dalam
sebuah klaster.
• Karena termasuk kategori unsupervised, maka dataset yang digunakan
model clustering tidak memiliki label.
• Data yang memiliki kemiripan akan dikelompokkan, lalu setiap data pada
kelompok yang sama akan diberikan label yang sama.
• Contoh kasus untuk teknik clustering adalah customer segmentation.
• Dari data ribuan pengunjung sebuah website ecommerce, model akan
belajar sendiri untuk mengelompokkan pengunjung. Bisa berdasarkan
waktu kunjungan, lama kunjungan, penggunaan fitur search, jumlah klik,
dan sebagainya.
• Model unsupervised learning akan menentukan segmen market dan
mengelompokkan pengunjung ke dalam segmen market yang berbeda.
K-Means Clustering
• Pengklasteran K-Means adalah sebuah
metode yang dikembangkan oleh Stuart
Lloyd dari Bell Labs pada tahun 1957. Lloyd
menggunakan metode ini untuk mengubah
sinyal analog menjadi sinyal digital.
• Hal yang paling pertama K-Means lakukan
adalah memilih sebuah sampel secara acak
untuk dijadikan centroid. Centroid adalah
sebuah sampel pada data yang menjadi
pusat dari sebuah klaster. Selanjutnya
Centroid akan diupdate secara iterative
untuk mendapatkan klaster terbaik.
Perhatikan ilustrasi disamping
K-Means Clustering dengan R
K-Means Clustering dengan R

More Related Content

PPTX
Machine learning
PDF
Materi Seminar Parenting Mendidik Anak di Era Digital Oleh Namin AB Ibnu Solihin
PPT
Memory & I/O interfacing
PPT
Reading Predicting
PDF
ISO 27001:2022 What has changed.pdf
PPTX
literasi digital disekolah.pptx
PPTX
Manajemen file
PPTX
Smart City Water Distribution
Machine learning
Materi Seminar Parenting Mendidik Anak di Era Digital Oleh Namin AB Ibnu Solihin
Memory & I/O interfacing
Reading Predicting
ISO 27001:2022 What has changed.pdf
literasi digital disekolah.pptx
Manajemen file
Smart City Water Distribution

What's hot (20)

PDF
Distribusi poisson
PDF
3. metodologi data science dts ta v.1
DOC
ANALISIS REGRESI LINIER BERGANDA
PDF
Machine Learning, Text Mining, dan Text Analytics
PDF
Konsep Data Mining
PDF
VARIABEL RANDOM & DISTRIBUSI PELUANG
DOCX
UML Aplikasi Rental Mobil
PDF
Vektor, Aljabar Linier
PPTX
PPT Regresi Berganda
DOCX
Distribusi t sudent
PDF
Data Management (Data Mining Association Rule)
PPTX
BAB 11 MENGELOLA PENGETAHUAN KEL 5.pptx
PPT
Pertemuan 02 teori dasar himpunan
DOCX
Metode simpleks dua fase
PDF
Statistika "Systematic Random Sampling"
PDF
PDF
Matematika Diskrit - 03 himpunan - 02
PPTX
Metode Middle-square sebagai Random Number Generator
PPTX
Data mining 4 konsep dasar klasifikasi
PPT
Modul 8 - Jaringan Syaraf Tiruan (JST)
Distribusi poisson
3. metodologi data science dts ta v.1
ANALISIS REGRESI LINIER BERGANDA
Machine Learning, Text Mining, dan Text Analytics
Konsep Data Mining
VARIABEL RANDOM & DISTRIBUSI PELUANG
UML Aplikasi Rental Mobil
Vektor, Aljabar Linier
PPT Regresi Berganda
Distribusi t sudent
Data Management (Data Mining Association Rule)
BAB 11 MENGELOLA PENGETAHUAN KEL 5.pptx
Pertemuan 02 teori dasar himpunan
Metode simpleks dua fase
Statistika "Systematic Random Sampling"
Matematika Diskrit - 03 himpunan - 02
Metode Middle-square sebagai Random Number Generator
Data mining 4 konsep dasar klasifikasi
Modul 8 - Jaringan Syaraf Tiruan (JST)
Ad

Similar to Machine Learning dengan R (20)

PPTX
PPTX
Machine Learning .
PPTX
1_Konsep Dasar Deep Lekkkkkkkarning.pptx
PDF
1_Konsep Dasar Deep Learninggggggggg.pdf
PDF
PENGANTAR DATA SCIENCE.pdf
PPTX
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
PPTX
01_PENGANTAR DATA DATA SCIENCE.pptx
PPTX
Data mining 1 pengantar
PPTX
Machine learning dan data mining
PPTX
02. Algoritma Klasifikasi dan Regresi.pptx
PDF
Pertemuan ke 3 Pengantar Machine Learning.pdf
PDF
Klasifikasi pohon keputusan
PDF
Minggu 1 - Pendahuluan dan Well Define Learning System (Compressed).pdf
PPTX
PPT KEL 3 DAI - 007.pptx
PPTX
KELOMPOK III LEARNING (TEKNIK LEARNING, DECISION TREE LEARNING).pptx
PPT
4-pengenalan-supervised-dan-unsupervised-learning.ppt
PPT
4-pengenalan-supervised-dan-unsupervised-learning.ppt
PPT
4 pengenalan-supervised-dan-unsupervised-learning (1)
PPTX
fuzzyShp
PPTX
Pertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptx
Machine Learning .
1_Konsep Dasar Deep Lekkkkkkkarning.pptx
1_Konsep Dasar Deep Learninggggggggg.pdf
PENGANTAR DATA SCIENCE.pdf
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
01_PENGANTAR DATA DATA SCIENCE.pptx
Data mining 1 pengantar
Machine learning dan data mining
02. Algoritma Klasifikasi dan Regresi.pptx
Pertemuan ke 3 Pengantar Machine Learning.pdf
Klasifikasi pohon keputusan
Minggu 1 - Pendahuluan dan Well Define Learning System (Compressed).pdf
PPT KEL 3 DAI - 007.pptx
KELOMPOK III LEARNING (TEKNIK LEARNING, DECISION TREE LEARNING).pptx
4-pengenalan-supervised-dan-unsupervised-learning.ppt
4-pengenalan-supervised-dan-unsupervised-learning.ppt
4 pengenalan-supervised-dan-unsupervised-learning (1)
fuzzyShp
Pertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptx
Ad

More from Muhammad Rifqi (6)

PDF
Market Basket Analisis dengan R
PDF
Visualisasi Data di R dengan ggplot2
PPTX
Data Pribadi di Ruang Siber
PPTX
Pengenalan Social Network ANalysis
PPTX
Social Media Analytics
PDF
Open source stak of big data techs open suse asia
Market Basket Analisis dengan R
Visualisasi Data di R dengan ggplot2
Data Pribadi di Ruang Siber
Pengenalan Social Network ANalysis
Social Media Analytics
Open source stak of big data techs open suse asia

Recently uploaded (20)

PDF
Program Guru Wali_20250819_100224_0000.pdf
PPT
Kuliah Uji Beda Rataan Perlakuan- Least Significant Difference Test
PPTX
603295686-Ppt-Bab-4-Pembangkit-Tenaga-Listrik.pptx
PPTX
diagram untuk sidang proposalzxcvbhjkjhgvcxcghjkjhbvcvbjkjhgfghj.pptx
DOCX
Modul Ajar 2 Bahasa Indonesia K-VIII.docx
PPTX
Presentation pengukuran panjang terbaru lagi
PDF
[7] DATA PROMES KURIKULUM MERDEKA.pdf
PPTX
V1_Sosialisasi PKG Sekolah Dinkes Prov Jatim.pptx
PPTX
KELOMPOK 2_TELAAH JURNAL INFARK MIOKARD.pptx
DOCX
ATP Bahasa Indonesia Kelas 8 (deep learning).docx
PPTX
Presentasi_PSAD_Teknik_Kimia-2022_rev (1).pptx
PPTX
Pertemuan 2_Modernisasi dan Globalisasi.pptx
PPTX
PPT pengukuran besaran fisika ukin 2023
PPTX
BAB-4. IP, Subnet, Gateway, DNS (belum selesai).pptx
PPTX
Mengidentifikasi Bahaya dan Mengendalikan Resiko.pptx
PDF
AI (Artificial Intelligence) adalah kemampuan mesin untuk meniru kecerdasan m...
PPTX
Judol_new materi yang penting jangan yaa
PPTX
PPT Interes Brebes Publikasi Data Statistik.pptx
PPT
Pengantar Bisnis Ekonomi Manajement Palangkaraya
PDF
HUBUNGAN STRUKTUR, ikatan kimia dan aktivitas fisiologis complete.en.id.pdf
Program Guru Wali_20250819_100224_0000.pdf
Kuliah Uji Beda Rataan Perlakuan- Least Significant Difference Test
603295686-Ppt-Bab-4-Pembangkit-Tenaga-Listrik.pptx
diagram untuk sidang proposalzxcvbhjkjhgvcxcghjkjhbvcvbjkjhgfghj.pptx
Modul Ajar 2 Bahasa Indonesia K-VIII.docx
Presentation pengukuran panjang terbaru lagi
[7] DATA PROMES KURIKULUM MERDEKA.pdf
V1_Sosialisasi PKG Sekolah Dinkes Prov Jatim.pptx
KELOMPOK 2_TELAAH JURNAL INFARK MIOKARD.pptx
ATP Bahasa Indonesia Kelas 8 (deep learning).docx
Presentasi_PSAD_Teknik_Kimia-2022_rev (1).pptx
Pertemuan 2_Modernisasi dan Globalisasi.pptx
PPT pengukuran besaran fisika ukin 2023
BAB-4. IP, Subnet, Gateway, DNS (belum selesai).pptx
Mengidentifikasi Bahaya dan Mengendalikan Resiko.pptx
AI (Artificial Intelligence) adalah kemampuan mesin untuk meniru kecerdasan m...
Judol_new materi yang penting jangan yaa
PPT Interes Brebes Publikasi Data Statistik.pptx
Pengantar Bisnis Ekonomi Manajement Palangkaraya
HUBUNGAN STRUKTUR, ikatan kimia dan aktivitas fisiologis complete.en.id.pdf

Machine Learning dengan R

  • 1. Machine Learning dengan R Muhammad Rifqi Ma’arif, M.Eng Matakuliah Ilmu Data Industrial Program Studi Teknik Industri Fakultas Teknik & Teknologi Informasi Universitas Jenderal Achmad Yani Yogyakarta 2020
  • 2. Pengantar Machine Learning • Machine learning adalah cabang dari artificial intelligence. Kecerdasan buatan memiliki pengertian yang sangat luas tapi secara umum dapat dipahami sebagai komputer dengan kecerdasan layaknya manusia. • Sedangkan machine learning memiliki arti lebih spesifik yaitu menggunakan metode statistika untuk membuat komputer dapat mempelajari pola pada data tanpa perlu diprogram secara eksplisit. • Machine learning dibagi menjadi beberapa kategori. Tepatnya ada empat kategori besar, yaitu supervised learning, unsupervised learning, semi-supervised learning, dan reinforcement learning.
  • 3. Supervised Learning - Klasifikasi • Klasifikasi adalah teknik untuk menentukan kelas atau kategori berdasarkan atribut yang diberikan. • Klasifikasi yang menghasilkan dua kategori disebut binary classification, • Klasifikasi yang menghasilkan 3 kategori atau lebih disebut multiclass classification atau klasifikasi banyak kelas. • Teknik-teknik Klasifikasi • Decision Tree • Random Forest • Support Vector Machine • Artificial Neural Network
  • 4. Decision Tree • Decision tree atau pohon keputusan adalah salah satu algoritma supervised learning yang dapat dipakai untuk masalah klasifikasi dan regresi. • Decision tree merupakan algoritma yang powerful alias mampu dipakai dalam masalah yang kompleks. • Decision tree juga merupakan komponen pembangun utama algoritma Random Forest, yang merupakan salah satu algoritma paling powerful saat ini. • Decision tree memprediksi sebuah kelas (klasifikasi) atau nilai (regresi) berdasarkan aturan-aturan yang dibentuk setelah mempelajari data.
  • 5. Decision Tree dengan R • Dataset (Iris Dataset) • Dataset iris merupakan salah satu dataset populer untuk belajar bagaimana ML dipakai dalam klasifikasi. Dataset ini berisi 150 sampel dari 3 spesies bunga iris. • Pada dataset Iris terdapat 4 kolom atribut yaitu panjang sepal, lebar sepal, panjang petal, dan lebar petal. • Untuk label terdapat 3 kelas atau kategori atau jenis yang terdapat pada dataset yaitu Setosa, Versicolor dan Virginica. Kelas adalah.
  • 7. Supervised Learning - Regresi • Regresi adalah salah satu teknik machine learning yang mirip dengan klasifikasi. Bedanya pada klasifikasi, sebuah model machine learning memprediksi sebuah kelas, sedangkan model regresi memprediksi bilangan kontinu. Bilangan kontinu adalah bilangan numerik. • Regresi linier adalah salah satu metode supervised yang masuk dalam golongan regression, sesuai namanya. • Contoh paling terkenal dari regresi linier adalah memperkirakan harga rumah berdasarkan fitur yang terdapat pada rumah seperti luas rumah, jumlah kamar tidur, lokasi dan sebagainya. • Regresi linier cocok dipakai ketika terdapat hubungan linear pada data.
  • 9. Unsupervised Learning - Klastering • Klaster (cluster) adalah sebuah grup yang memiliki kemiripan tertentu. • Pengklasteran adalah sebuah metode machine learning unsupervised untuk mengelompokkan objek-objek yang memiliki kemiripan, ke dalam sebuah klaster. • Karena termasuk kategori unsupervised, maka dataset yang digunakan model clustering tidak memiliki label. • Data yang memiliki kemiripan akan dikelompokkan, lalu setiap data pada kelompok yang sama akan diberikan label yang sama. • Contoh kasus untuk teknik clustering adalah customer segmentation. • Dari data ribuan pengunjung sebuah website ecommerce, model akan belajar sendiri untuk mengelompokkan pengunjung. Bisa berdasarkan waktu kunjungan, lama kunjungan, penggunaan fitur search, jumlah klik, dan sebagainya. • Model unsupervised learning akan menentukan segmen market dan mengelompokkan pengunjung ke dalam segmen market yang berbeda.
  • 10. K-Means Clustering • Pengklasteran K-Means adalah sebuah metode yang dikembangkan oleh Stuart Lloyd dari Bell Labs pada tahun 1957. Lloyd menggunakan metode ini untuk mengubah sinyal analog menjadi sinyal digital. • Hal yang paling pertama K-Means lakukan adalah memilih sebuah sampel secara acak untuk dijadikan centroid. Centroid adalah sebuah sampel pada data yang menjadi pusat dari sebuah klaster. Selanjutnya Centroid akan diupdate secara iterative untuk mendapatkan klaster terbaik. Perhatikan ilustrasi disamping