Klasterisasi Data dengan K-Means pada Aplikasi Rapidminer
Resumen
TLDRVideo ini membahas teknik klasterisasi data menggunakan algoritma k-means. Pembicara menjelaskan perbedaan antara klasifikasi dan klasterisasi, di mana klasifikasi melibatkan pengelompokan data berdasarkan label, sedangkan klasterisasi mengelompokkan data berdasarkan kemiripan tanpa label. Contoh penggunaan klasterisasi dalam pengelompokan mobil berdasarkan kapasitas penumpang dan warna juga diberikan. Pembicara menjelaskan cara menghitung jarak antar data menggunakan rumus Euclidean distance dan bagaimana algoritma k-means bekerja, termasuk cara menentukan pusat cluster dan proses iterasi untuk memperbaiki posisi pusat cluster. Video ini juga menunjukkan implementasi algoritma k-means menggunakan software RapidMiner.
Para llevar
- 📊 Klasterisasi mengelompokkan data tanpa label.
- 🔍 Klasifikasi menggunakan label untuk mengelompokkan data.
- 📏 Jarak antar data dihitung dengan Euclidean distance.
- 🔄 Algoritma k-means mengelompokkan data berdasarkan pusat cluster.
- 📈 Metode elbow digunakan untuk menentukan jumlah cluster yang tepat.
Cronología
- 00:00:00 - 00:05:00
Pengenalan kepada teknik klasterisasi data menggunakan algoritma k-means, berbeza dengan klasifikasi yang melibatkan label. Klasterisasi mengelompokkan data berdasarkan kemiripan tanpa melihat label.
- 00:05:00 - 00:10:00
Perbezaan antara klasifikasi dan klasterisasi dijelaskan dengan contoh pengelompokan mobil berdasarkan pabrikan dan kapasitas penumpang. Klasterisasi tidak melibatkan label, tetapi berdasarkan kemiripan data.
- 00:10:00 - 00:15:00
Kemiripan data diukur menggunakan pengukuran jarak, dengan rumus Euclidean distance. Contoh pengukuran jarak antara data baru dan data yang ada diberikan.
- 00:15:00 - 00:20:00
Contoh pengukuran jarak antara data baru dan data yang ada ditunjukkan, dengan penjelasan tentang bagaimana menghitung jarak menggunakan atribut yang berbeza.
- 00:20:00 - 00:25:00
Manfaat klasterisasi termasuk segmentasi data dan kompresi gambar. Klasterisasi membantu dalam mengelompokkan data secara otomatis tanpa perlu melabeli secara manual.
- 00:25:00 - 00:30:00
Algoritma k-means diperkenalkan sebagai salah satu algoritma klasterisasi yang paling sederhana. K-means mengelompokkan data berdasarkan pusat cluster terdekat.
- 00:30:00 - 00:35:00
Proses kerja k-means melibatkan penentuan jumlah cluster, penempatan pusat cluster secara acak, dan pengelompokan data berdasarkan kedekatan dengan pusat cluster.
- 00:35:00 - 00:44:06
Langkah-langkah dalam algoritma k-means termasuk memperbaiki posisi pusat cluster berdasarkan rata-rata data dalam cluster, dan proses ini berulang hingga pusat cluster tidak berubah.
Mapa mental
Vídeo de preguntas y respuestas
Apa itu klasterisasi?
Klasterisasi adalah teknik pengelompokan data berdasarkan kemiripan tanpa melibatkan label.
Apa perbedaan antara klasifikasi dan klasterisasi?
Klasifikasi mengelompokkan data berdasarkan label, sedangkan klasterisasi mengelompokkan data berdasarkan kemiripan.
Bagaimana cara menghitung jarak antar data?
Jarak antar data dihitung menggunakan rumus Euclidean distance.
Apa itu algoritma k-means?
K-means adalah algoritma klasterisasi yang mengelompokkan data berdasarkan pusat cluster terdekat.
Bagaimana cara menentukan jumlah cluster yang tepat?
Jumlah cluster yang tepat dapat ditentukan menggunakan metode elbow.
Ver más resúmenes de vídeos
Episod 901 My #QuranTime 2.0 Ahad 1 Jun 2025 Surah Ibrahim (14:25-27) Halaman 259
Episod 899 My #QuranTime 2.0 Jumaat 30 Mei 2025 Surah Ibrahim (14:23-24) Halaman 258
Episod 898 My #QuranTime 2.0 Khamis 29 Mei 2025 Surah Ibrahim (14:22) Halaman 258
Episod 897 My #QuranTime 2.0 Rabu 28 Mei 2025 Surah Ibrahim (14:19-21) Halaman 258
Peranan Komunitas dalam Kehidupan Masyarakat
Belajar Dasar Pemrograman Menggunakan C++ Mulai Dari NOL
- 00:00:00halo halo teman-teman semuanya
- 00:00:01Assalamualaikum warahmatullah
- 00:00:03wabarakatuh jumpa lagi di seri
- 00:00:05perkuliahan machine learning Bersama
- 00:00:07saya Muhammad Fahri di video kali ini
- 00:00:10kita akan bahas mengenai teknik
- 00:00:11klasterisasi data menggunakan algoritma
- 00:00:14k-means
- 00:00:16oke di video-video yang lalu kita sudah
- 00:00:19membahas Bagaimana teknik klasifikasi
- 00:00:21data yang menggunakan algoritma mesin
- 00:00:23learning seperti naik Bayes ataupun
- 00:00:26decision Tree nah kali ini kita akan
- 00:00:28membahas satu teknik yang agak berbeda
- 00:00:30yang disebut dengan klastering atau
- 00:00:32klasterisasi
- 00:00:34sebelum kita bahas apa cokelat
- 00:00:36sterilisasi kita cek dulu nih kita lihat
- 00:00:38dulu apa sih bedanya antara klasifikasi
- 00:00:40dengan klasterisasi itu Oke kita tahu ya
- 00:00:45kita udah paham bahwa yang disebut
- 00:00:47direklasifikasi itu adalah
- 00:00:48mengelompokkan data berdasarkan
- 00:00:51labelnya ya berdasarkan kesamaan label
- 00:00:55dari data tersebut misal kita ingin
- 00:00:58mengelompokkan mana Gmail yang spam dan
- 00:01:01email yang bukan spam maka didata set
- 00:01:04yang kita miliki itu pasti ada satu
- 00:01:06kolom yang tugasnya sebagai label ya
- 00:01:09label yah melabeli Mana email yang spam
- 00:01:12Mana email yang bukan spam atau contoh
- 00:01:15lainnya misalkan kita ingin
- 00:01:17mengklasifikasikan data bunga iris ya
- 00:01:20data bunga iris misalnya mana data Airis
- 00:01:24virginica mana data bunga iris
- 00:01:27versicolor kita-kita seterusnya jadi
- 00:01:29adalah Belnya ya dia punya label jadi
- 00:01:33data dikelompokkan berdasarkan label
- 00:01:36yang sama ya jadi artis beginikah
- 00:01:39dikumpulkan berdasarkan labelnya ya
- 00:01:41sesama artis virginica begitu ya atau
- 00:01:44misalnya email yang spam dikumpulkan
- 00:01:46dengan sesama email yang labelnya spam
- 00:01:49akhirnya kemudian
- 00:01:51klasterisasi Apa itu nah sebetulnya ya
- 00:01:55kalau kita lihat ya antara klasifikasi
- 00:01:58dengan keras saat ini sebenarnya ada
- 00:02:01sedikit kemiripan apa kemiripannya yakni
- 00:02:04sama-sama mengelompokkan data ya
- 00:02:07sama-sama mengelompokkan data tapi
- 00:02:09bedanya bedanya disini kalau klasifikasi
- 00:02:12kita kelompokkan datanya berdasarkan
- 00:02:15kesamaan label ya dagang klasterisasi ya
- 00:02:19dia tidak melihat label dan biasanya
- 00:02:21tidak ada labelnya maka klasterisasi
- 00:02:24mengelompokkan data itu berdasarkan
- 00:02:26kemiripan dari data tersebut ya
- 00:02:29kemiripan dari data tersebut nah
- 00:02:32kemiripan ini dilihat dari mana dilihat
- 00:02:34dari nilai nilai atributnya nilai-nilai
- 00:02:36kolom yang ada pada database tersebut
- 00:02:39dihitung kemiripannya makan nanti data
- 00:02:42yang mirip itu dikelompokkan ya Dan
- 00:02:45ingat kita tidak melihat label karena
- 00:02:47klasterisasi tidak melibatkan label
- 00:02:49disini sebagai ilustrasinya ya kita akan
- 00:02:52lihat Bagaimana beda antara klasifikasi
- 00:02:54dengan klasterisasi misalkan Saya punya
- 00:02:58koleksi mobil seperti ini Oh ya saya
- 00:03:01punya koleksi mobil seperti ini di
- 00:03:04sebelah kanan bawah atau kiri bawah itu
- 00:03:07adalah koleksi atau kelompok mobil-mobil
- 00:03:09dari pabrikan Toyota
- 00:03:11jadi bagian atas di kanan atas itu
- 00:03:14adalah koleksi mobil dari pabrikan Honda
- 00:03:17Nah kalau Anda lihat di sini ya
- 00:03:20mobil-mobil ini dikelompokkan
- 00:03:22berdasarkan pabrikannya mana yang Toyota
- 00:03:25mana yang Honda inilah klasifikasi ya
- 00:03:29jadi mobil dikelompokkan berdasarkan
- 00:03:32label misalnya sini label ya labilnya
- 00:03:35adalah pabrikannya Tadi ia ini Toyota
- 00:03:37ataupun Honda ini klasifikasi nah Lalu
- 00:03:41klasterisasi bagaimana ingat tadi kata
- 00:03:43kuncinya klasterisasi itu mengelompokkan
- 00:03:46data berdasarkan
- 00:03:47kemiripannya ya kemiripan datanya jadi
- 00:03:50gini kalau nih kalau ini adalah
- 00:03:53klasifikasi mereka kalau saya
- 00:03:54klasterisasi dia bisa berubah seperti
- 00:03:56ini teman-teman kalau misalkan disini
- 00:03:59saya Hai saya mengelompokkan mobil ini
- 00:04:01kedalam 2 Cluster di sini kita sebut
- 00:04:04dengan istilah Cluster ya Cluster atau
- 00:04:06kelompok yang bawah sistem Cluster 1
- 00:04:10yang atasnya sebut dengan cluster2 Kalau
- 00:04:13Anda lihat di sini ya setiap Cluster itu
- 00:04:17mengandung komposisi atau pabrikan mobil
- 00:04:20yang berbeda-beda ya di Cluster 1 itu
- 00:04:23ada mobil dari Toyota ada juga mobil
- 00:04:25tadi Honda Sama halnya dengan di Cluster
- 00:04:282 ada mobil dari pabrikan Toyota dan
- 00:04:30juga pabrikan Honda Nyalakan Bagaimana
- 00:04:34pengelompokan ini terjadi pengelompokan
- 00:04:35yang terjadi berdasarkan kemiripan
- 00:04:38datanya kemiripan datang lihat Disini di
- 00:04:41Cluster 1 kita bisa lihat di sana semua
- 00:04:44mobil di Cluster 1 itu memiliki atau
- 00:04:47cirinya adalah memiliki kapasitas
- 00:04:51penumpang sebanyak lima orang ya Ada
- 00:04:54sedan Ada apa namanya hacthback gitu ya
- 00:04:58Ada Agya di situ ada lagi itu misalnya
- 00:05:00Toyota Yaris ya dan seterusnya sedangkan
- 00:05:04di klaster kedua kita bisa lihat di situ
- 00:05:06Itu adalah kelompok dimana mobil-mobil
- 00:05:09tersebut memiliki kapasitas penumpang
- 00:05:11sebanyak tujuh orang gitu kan Nah dalam
- 00:05:14hal ini pengelompokan kita lakukan
- 00:05:17berdasarkan kapasitas penumpangnya
- 00:05:19begitu nah contoh lainnya saya bisa
- 00:05:23kelompokkan lagi ya mobil-mobil ini ke
- 00:05:26dalam cluster yang lebih banyak misalkan
- 00:05:28tiga klaster
- 00:05:30dia Cluster makan hati jadi akan beda
- 00:05:32lagi ya mobil yang warnanya cerah
- 00:05:35dikelompokkan di Cluster nomor satu
- 00:05:38mobil yang warnanya gelap dikelompokkan
- 00:05:40di Cluster warna dua mobil yang warna
- 00:05:42putih dikelompokkan di Cluster nomor
- 00:05:44tiga gitu nah ini ini merupakan
- 00:05:48klasterisasi jadi kita tidak melihat
- 00:05:50mana pabrikan Toyota mana pabrikan Honda
- 00:05:53kita ngelihat labelnya yang kita lihat
- 00:05:56adalah kemiripan ya kemiripan dari data
- 00:05:59tersebut cute kemiripannya bisa dari
- 00:06:02bentuknya misalnya atau dari warnanya
- 00:06:05atau lain sebagainya
- 00:06:07Bisakah siapa jam lagi saya buat kelas
- 00:06:10lebih banyak lagi saya buat jadi empat
- 00:06:11klaster maka bisa dia seperti ini ya
- 00:06:14Cluster warna kuning ada di Cluster
- 00:06:16nomor satu ya mobil warna merah di
- 00:06:18Cluster nomor 4 dan seterusnya ini
- 00:06:21namanya klasterisasi atau klastering
- 00:06:24jadi kita enggak lihat label datanya
- 00:06:26yang kita lihat adalah kemiripan datanya
- 00:06:29data yang mirip akan dikelompokkan
- 00:06:31dengan sesama data yang mirip itu
- 00:06:33ini ya prinsip dasar dari klasterisasi
- 00:06:36mudah-mudahan paham ya bedanya antara
- 00:06:38klasterisasi dengan klasifikasi oke
- 00:06:43nah sekarang
- 00:06:45pertanyaannya adalah bagaimana cara kita
- 00:06:48menentukan kemiripan data
- 00:06:51jawabannya adalah dengan menggunakan
- 00:06:54alat ukur yakni melakukan pengukuran
- 00:06:57jarak datang ya melakukan pengukuran
- 00:06:59jarak nah biasanya disini kurang jarak
- 00:07:02data itu dihitung menggunakan persamaan
- 00:07:04yuk Lidya the distance namanya ya
- 00:07:08ilmunya seperti itu d&d ini adalah
- 00:07:11distance nya atau jarak antar datanya it
- 00:07:14didefinisikan sebagai akar pangkat 2
- 00:07:16dari Sigma atau penjumlahan dari itu
- 00:07:19letak simbol Sigma ya simbol Sigma Sigma
- 00:07:23to arti penjumlahan ya the symbolic
- 00:07:26huruf itu ya itu simbol Sigma arti
- 00:07:28penjumlahan apa yang dijumlahkan yang
- 00:07:31dijumlahkan adalah selisih antara exit
- 00:07:34dengan yay jadi X dikurang Yi lalu
- 00:07:37dikuadratkan
- 00:07:38exin apa aksi ini adalah atribut dari
- 00:07:42data yang pertama Yei ini adalah atribut
- 00:07:45dari data yang kedua yang kita akan
- 00:07:47menghitung jarak antar data Artikan ada
- 00:07:50dua data dibandingkan ya ada dua data
- 00:07:52yang hitung jaraknya disini X ini
- 00:07:54atribut dari data pertama Yei atribut
- 00:07:58dari data yang kedua di menyerahkan
- 00:08:00hasil kuadrat menjumlahkan nanti Nah
- 00:08:04kita tahu bahwa yang namanya data itu
- 00:08:06pasti atributnya banyak ya maka di sini
- 00:08:09ya kita tulis itu exit dan Yi ih disitu
- 00:08:13menyatakan indeks dari atributnya
- 00:08:16atribut kesatu kedua ketiga keempat
- 00:08:18kelima dan seterusnya sampai atribut
- 00:08:21yang ke-n ya atribut yang terakhir makan
- 00:08:24disitu ditulis seksi yei yei itu adalah
- 00:08:28nomor indeks atributnya dari satu sampai
- 00:08:30dengan n penting kalian Bagaimana
- 00:08:33ilustrasinya ya Hei
- 00:08:36misal Saya punya data nih data mobil ada
- 00:08:40tiga atribut disitu ada kapasitas
- 00:08:43penumpang kapasitas mesin dan panjang
- 00:08:46mobilnya ya Ada tiga data di sini 3D
- 00:08:49chord ya kemudian saya punya data baru
- 00:08:52nih Ya saya punya data baru tabel warna
- 00:08:55hitam itu ya Nah Saya ingin mengukur
- 00:08:58jarak dari data Nike data yang ada di
- 00:09:01atasnya itu eh maupun jaraknya
- 00:09:03menggunakan YKS tadi maka ya untuk jarak
- 00:09:08pertama ya nih Jangan Tarra data baru
- 00:09:11dengan data yang pertama Ya data yang
- 00:09:13pertama di atas itu kita bisa hitung
- 00:09:15dengan di sama dengan aneh kita sebut
- 00:09:18dengan D1 D1 = akar ya akan dari tujuh
- 00:09:23orang 7 pangkat 2 ditambah 2,4 kurang
- 00:09:251,5 pangkat 2 dan seterusnya
- 00:09:28tahu bagaimana cara mendapatkan rumus
- 00:09:30ini enggak kita bahas oke benar lihat di
- 00:09:34sini ya ingat di sini kita mengukur
- 00:09:37jarak antara data yang baru ya data pada
- 00:09:40tabel yang hitam itu dengan data pertama
- 00:09:42di tabel yang biru yah data pertama di
- 00:09:45tabel yang biru melihat disitu tujuh
- 00:09:48kurang 7 terdapat dari mana dapat dari
- 00:09:52sini ya kapasitas penumpang dari data
- 00:09:55baru itu dikurangi dengan kapasitas
- 00:09:58penumpang dari data yang di atas
- 00:10:00kata-kata pertama yang diatas oke nah
- 00:10:04kemudian berikutnya
- 00:10:052,4 dikurang 1,5 itu adalah kapasitas
- 00:10:10mesin dari data yang baru dikurangi
- 00:10:13dengan kapasitas mesin dari data yang di
- 00:10:15atasnya itu
- 00:10:161,5 ya 2,4 dikurang 1,5 selanjutnya
- 00:10:21dengan cara yang sama iya 4,8 dikurang
- 00:10:244,6 itu adalah panjang mobil dari data
- 00:10:28yang baru tabel yang bawah dikurangi
- 00:10:30dengan panjang mobil dari data yang atas
- 00:10:32data pertama ya tetap bertahan pada
- 00:10:34tabel yang diatas
- 00:10:36maka kita dapat disitu ya D1 = akar
- 00:10:41pangkat 2 dari 767 pangkat 2 ditambah
- 00:10:442,4 kurang 1,5 pangkat 2 ditambah 4,8
- 00:10:48kurang 4,6 angkat dua
- 00:10:51lagi nah dengan cara yang sama kita bisa
- 00:10:55Hitung jarak data baru dengan data kedua
- 00:10:59di tabel yang atas Hai yang ide2 Mama
- 00:11:03nih ya tujuh kurang lima itu adalah
- 00:11:06kapasitas penumpang pada data yang baru
- 00:11:08dikurangi kapasitas penumpang pada data
- 00:11:12kedua di tabel yang atas ya 2,4 kurang
- 00:11:161,2 dapat dari
- 00:11:18kapasitas mesin dari data yang baru
- 00:11:20dikurangi kapasitas mesin ya pada data
- 00:11:24kedua di tabel yang atas
- 00:11:26jenis-jenis sama 4,8 kurang 3,7 ini
- 00:11:30panjang mobilnya dan baru dikurang data
- 00:11:32yang di atasnya
- 00:11:34Ya saya rasa Gampang sekali sehingga
- 00:11:36dengan cara yang sama juga kita dapatkan
- 00:11:38d3nya seperti ini ah D1 D2 D3 ini adalah
- 00:11:43jarak data baru terhadap data yang ada
- 00:11:47di atas tadi yang D1 tuh mati jarak
- 00:11:50datar baru dengan data pertama D2 jarak
- 00:11:53data baru dengan data yang kedua D3
- 00:11:55adalah jarak datar baru dengan data yang
- 00:11:58ketiga minyak itu dengan kalkulator ya
- 00:12:01berhasil seperti
- 00:12:03Nah teman-teman lihat di sini ya kita
- 00:12:07tahu bahwa disini data baru ternyata
- 00:12:09jaraknya sangat kecil atau sangat dekat
- 00:12:12dengan data yang ketiga data baru yang
- 00:12:15kita miliki tabel yang bawah itu
- 00:12:17memiliki jarak yang paling kecil jarak
- 00:12:21yang sangat dekat dengan data yang
- 00:12:22ketiga jaraknya hanya 0,4 12 artinya Apa
- 00:12:28artinya data baru kita memiliki
- 00:12:30kemiripan yang kuat dengan data yang
- 00:12:32ketiga itu sebaliknya kita bisa lihat
- 00:12:35jarak data baru dengan data kedua sangat
- 00:12:38jauh ya jaraknya adalah 2,5 79 jarak
- 00:12:42yang sangat jauh ini ya jadi dari jarak
- 00:12:45ini kita bisa lihat atau data itu dia
- 00:12:48mirip dengan data yang mana
- 00:12:50Nah kalau kita ilustrasikan ke dalam eh
- 00:12:54apa kurva x koma y ya misalkan data
- 00:12:58pertama kita masukkan di sini ya De
- 00:13:00utama tadi punya kapasitas penumpang 77
- 00:13:04orang ya kemudian kapasitas mesinnya
- 00:13:08kalau masalah 1,5 ya panjang mobilnya
- 00:13:11adalah 4,6 ada tetap pertama disitu
- 00:13:13nyata kedua tadi kepasitas mobilnya
- 00:13:16adalah lima penumpang nah disini lihat
- 00:13:19data yang lingkaran itu adalah data
- 00:13:21untuk mobil dengan kapasitas lima
- 00:13:24penumpang yang akan data yang kota itu
- 00:13:26adalah data mobil dengan kapasitas tujuh
- 00:13:29penumpang ya saya bedakan saya bedakan
- 00:13:32karena tadi kan kita punya tiga dimensi
- 00:13:34ya kita punya tiga atribut ya untuk
- 00:13:37atribut panjang mobil dan kapasitas
- 00:13:39mesin kita wakil dengan kurva X dan Y
- 00:13:41yang kan untuk kapasitas penumpangnya
- 00:13:44kita wakilkan dengan bentuk Datanya ada
- 00:13:47yang kota ada yang bulat gitu ya
- 00:13:50kemudian data yang ketiga itu tadi yang
- 00:13:54cc-nya 2,0 ya dan panjangnya 4,9 gitu ya
- 00:13:58penumpangnya
- 00:14:00adalah tujuh orang
- 00:14:01enggan kita Pindad abadi cinta di yang
- 00:14:05hitamnya Allah data baru kita tadi ya
- 00:14:06yang hitam ini adalah data baru kita
- 00:14:09terjadi dengan kapasitas penumpang 47
- 00:14:11orang kemudian panjang mobilnya
- 00:14:14kelongsoran 4,8 ya pakai balapan dengan
- 00:14:16cc-nya 2,4 ya kapasitas mesinnya 2,4
- 00:14:20ini ya ilustrasinya jadi data yang kotak
- 00:14:24itu mewakili data in tujuh penumpang dan
- 00:14:26yang lingkaran itu yang lima penumpang
- 00:14:28ya Nah kalau kita lihat secara kasat
- 00:14:31mata di sini ya terserah visual terlihat
- 00:14:35sekali ya bahwa data baru yakni kotak
- 00:14:38hitam itu itu sangat dekat dengan data
- 00:14:40yang ketiga sangat dekat dengan data
- 00:14:42yang ketiga artinya dia punya kemiripan
- 00:14:44disitu Iya nah ini adalah ilustrasi
- 00:14:47Bagaimana menghitung jarak data
- 00:14:50menghitung kemiripan antar satu data
- 00:14:52dengan data yang lainnya menggunakan
- 00:14:54algoritma atau menggunakan rumus iklim
- 00:14:56Dian distance Oke sekarang kita lihat
- 00:14:59dulu Hai apa sebenarnya manfaat dari
- 00:15:02klasterisasi ini kenapa kita melakukan
- 00:15:06klasterisasi pertama tentu saja untuk
- 00:15:08membantu kita mensegmentasi data
- 00:15:10bayangkan kalau tak punya data yang
- 00:15:13sangat banyak itu Ya kita pasti bingung
- 00:15:16ya bagaimana membagi data ini ia
- 00:15:18mengelompokkan data ini maka telah Reza
- 00:15:20sih bisa kita pakai disitu untuk
- 00:15:21mensegmentasi data kita atau misalkan
- 00:15:24kita punya ecommerce misalnya minyak
- 00:15:26data ecommerce Kemudian kelompokkan
- 00:15:29didata ecommerce gitu misalnya kita mau
- 00:15:31kelompokkan sedang 22 kelompok nih yang
- 00:15:342 Cluster kita pengen lihat nih Mana
- 00:15:37pelanggan yang loyal dan menang
- 00:15:38pelanggan yang ya musiman enggak loyal
- 00:15:40gitu ya bisa dengan menggunakan
- 00:15:42segmentasi atau telah Reza si ini gitu
- 00:15:44jadi dia akan mengelompokkan data secara
- 00:15:47otomatis
- 00:15:47beda kalau kita melabeli data ya
- 00:15:50diklasifikasikan kita harus melabeli
- 00:15:52data melabeli data itu kan harus manual
- 00:15:55ya kalau ini enggak ayah kedua ya karena
- 00:15:59kita bisa cuman segmentasi data maka
- 00:16:02plus Reza sini bisa membantu kita untuk
- 00:16:04melakukan proses labelisasi data untuk
- 00:16:08dipakai diklasifikasi ya bayangkan
- 00:16:10tadinya kalau kita datanya banyak sekali
- 00:16:12jutaan baris kemudian harus diisi
- 00:16:15labelnya misalnya kalau manual kan capek
- 00:16:18maka kita bisa pake bantuan dari
- 00:16:21klasterisasi ya untuk mengelompokkan
- 00:16:24data kemudian dapat dikelompokkan bisa
- 00:16:26kita kasih label bisa kita beri label
- 00:16:28sehingga nanti bisa dipakai untuk
- 00:16:30petugas klasifikasi Oke berikutnya lain
- 00:16:35dengan segmentasi data juga tadi
- 00:16:37klasterisasi atau klastering ini juga
- 00:16:40bisa dipakai untuk kompresi gambar ya
- 00:16:42meng-cover mengkompresi warna dari suatu
- 00:16:46gambar-gambar digital itu ya jadi-jadian
- 00:16:49game yang tadi gambarnya besar ukurannya
- 00:16:51ya Bahkan tadi kita punya gambar
- 00:16:53misalnya ya ada gambar dengan ukuran
- 00:16:55lima MB misalnya kalau warnanya kita
- 00:16:58kompres ya keinginan klasterisasi itu
- 00:17:01mungkin bisa turun dari lima MB mungkin
- 00:17:03hanya di satu MB saja Misalnya seperti
- 00:17:05ini beberapa manfaat dari kelas tadi
- 00:17:07Sasi data
- 00:17:10oke sekarang Nah kita bahas algoritmanya
- 00:17:15nih jadi
- 00:17:17klasterisasi data itu sebenarnya ada
- 00:17:19banyak algoritmanya tetapi yang paling
- 00:17:21sering dipakai dan yang paling simple
- 00:17:23itu adalah algoritma k-means namanya
- 00:17:27k-means selain Kamis itu ada lagi yang
- 00:17:30namanya optics ada dent clue ada db scan
- 00:17:35ada agglomerative banyak ya Jadi ada
- 00:17:38segera ada banyak sekali algoritma
- 00:17:40clustering Plato prestasi
- 00:17:43tapi di video ini kita bahas yang paling
- 00:17:46simpel dulu saja ya nih cammins oke ya
- 00:17:48Nah Apa itu Kamis ya Kamis itu merupakan
- 00:17:52suatu algoritma untuk klasterisasi data
- 00:17:55yang berbasis yang basisnya adalah dari
- 00:17:59ukuran enak data terhadap pusat Cluster
- 00:18:02terdekat jadi di sini ada keyboard ada
- 00:18:05kata kunci pusat Cluster teman-teman ya
- 00:18:08Jadi nanti data ini kita kelompokkan
- 00:18:11berdasarkan pusat-pusat cluster yang
- 00:18:14kita buat ya setiap data dikelompokkan
- 00:18:17terhadap pusat cluster yang paling dekat
- 00:18:19dengan dia Yogya Bagaimana instalasinya
- 00:18:22seperti ini ya
- 00:18:23bisa usai punya data seperti ini data
- 00:18:27dengan dua atribut x&y kemudian
- 00:18:30misalkan Saya punya tiga pusat Cluster
- 00:18:33atau tiga sentroid ya yang tanda plus
- 00:18:36merah itu Ya udah nanti disini setiap
- 00:18:39pusat Cluster ini itu akan membentuk
- 00:18:42satu Cluster berdasarkan data-data yang
- 00:18:45terdekat dengan dia sehingga nanti kalau
- 00:18:48Anda lihat di sini ya jadi tiga pusat
- 00:18:51Cluster ini kita bisa mendapatkan tiga
- 00:18:53buah Cluster atau tiga buah kelompok
- 00:18:55data yang berbeda yakni kelompok yang
- 00:18:58warna biru yang di atas itu Aku anak
- 00:19:00kuning dan juga cluster yang warna hijau
- 00:19:02nah ini setiap data tadi dikelompokkan
- 00:19:06berdasarkan kedekatan dia dengan setiap
- 00:19:09pusat Cluster nya ya atau sentrik nyata
- 00:19:11di ini bagaimana Kamis mengelompokkan
- 00:19:16data gitu ya
- 00:19:17Ada tiga klaster berbeda disitu nah
- 00:19:21sekarang pertanyaannya adalah bagaimana
- 00:19:24kita menentukan posisi dari pusat
- 00:19:27Cluster tadi ya Bagaimana kita tahu
- 00:19:30bahwa pusat cluster yang disitu letaknya
- 00:19:33in pertanyaan yang paling penting yang
- 00:19:34harus dia pertama kali ini
- 00:19:36disini jadi bagaimana menentukan posisi
- 00:19:41dari pusat Cluster itu maka langkah
- 00:19:43pertamanya harus tentukan dulu ya berapa
- 00:19:47jumlah pusat cluster yang ingin kita
- 00:19:49gunakan jadi dik Amin ya di algoritma
- 00:19:52k-means sebelum kita melakukan
- 00:19:55pengelompokan data yang kita harus
- 00:19:57tentukan dulu nih kita pengen bentuk ini
- 00:20:00Ayo kita ke dalam berapa cluster berapa
- 00:20:02kelompok ya nanti kita lihat bagaimana
- 00:20:05cara kerjanya nih bisa oleh misal disini
- 00:20:08Saya
- 00:20:10punya data lagi seperti ini teman-teman
- 00:20:12dan ingat di awal ya Nah cara kerja
- 00:20:15Kamis itu adalah meletakkan pusat
- 00:20:18Cluster awal itu secara acak ya Jadi
- 00:20:21kami situ ya pertama kali meletakkan
- 00:20:24pusat Cluster itu secara acak acak
- 00:20:27Misalkan ya misalkan saya pakai nilai
- 00:20:30kannya sama dengan 2 nah = 2 nih artinya
- 00:20:34saya mau membentuk sebanyak dua klaster
- 00:20:38dari data yang saya punya ini Nah maka
- 00:20:41langkah pertamanya tentukan dulu ya
- 00:20:44tentukan dulu posisi pusat Cluster di
- 00:20:47awal secara acak acak acak ya misalkan
- 00:20:53disitu posisinya ada dua ya karena
- 00:20:55tanya2 tadi nah Makanan Ihya
- 00:20:58setiap bab Cluster ini dia akan
- 00:21:02mengambil kelompok data yang
- 00:21:03masing-masing jadi data yang terdekat
- 00:21:06dengan suatu pusat Cluster di akan masuk
- 00:21:09ke Cluster tersebut Andrea ke situ ya
- 00:21:12yang kuning Itu posisinya dekat dengan
- 00:21:14cluster yang atas yang act yang sebelah
- 00:21:17atas kuning sedangkan yang hijau itu
- 00:21:19data yang hijau itu datanya dekat dengan
- 00:21:23pusat cluster yang bawah money kalian
- 00:21:26ikhlas terbagi dua Gan karena kayaknya
- 00:21:28dua Nah kemudian nanti ya pusat Cluster
- 00:21:32ini posisinya akan diubah Akan
- 00:21:34diperbaiki ya bagaimana memperbaiki
- 00:21:37posisinya yakin dengan cara menghitung
- 00:21:40rata-rata dari setiap data yang ada ya
- 00:21:44menghitung nilai rata-rata dari setiap
- 00:21:46data yang ada di datang hijau bila tak
- 00:21:49ratakan x-nya berapa Y nya berapa
- 00:21:52rata-ratanya yang kuning juga Sama ya
- 00:21:55Esnya berapa rata-ratanya Ia juga berapa
- 00:21:58rata-ratanya
- 00:22:00Hai nanti ya nilai rata-rata tersebut
- 00:22:03lah yang menentukan pusat cluster yang
- 00:22:05barunya posisi ini jadi ya teman-teman
- 00:22:08yang tadinya seperti ini pusat datanya
- 00:22:10atau pusat Cluster nya dia bisa
- 00:22:12berpindah seperti ini
- 00:22:15dia pindah ya karena apa tadi hasil
- 00:22:19perhitungan rata-rata gitu ya jadi
- 00:22:21setiap data di klaster tersebut banyak
- 00:22:26di dengan cara yang sama nih
- 00:22:28terbentuklah Store yang baru yang tadi
- 00:22:31warna hijau selangit yang tadi ada yang
- 00:22:33warna hijau karena pusat cluster yang
- 00:22:36berpindah maka komposisi Cluster juga
- 00:22:38berbeda dengan yang tadi hijau berubah
- 00:22:41jadi masuk ke Cluster kuning yang
- 00:22:43tadinya kuning berubah jadi masuk
- 00:22:44lasernya hijau
- 00:22:46dengan Shade yang sama nanti dihitung
- 00:22:48lagi rata-rata nilai rata-rata dari
- 00:22:51semua data ini x&y berapa terletaknya ke
- 00:22:54nanti akan berubah lagi posisi dan
- 00:22:56perutnya
- 00:22:57berubah lagi Kemudian plaster nya juga
- 00:23:00akan di-update ya data yang tadinya
- 00:23:03hijau akan jadi kuning dan sebaliknya
- 00:23:05juga yang tadinya kuning tadi hijau
- 00:23:08Nah di sini ya proses perpindahan pusat
- 00:23:12Cluster ini akan berhenti ketika
- 00:23:15Perpindahan yang terjadinya perpindahan
- 00:23:18pusat cluster yang terjadi sangat kecil
- 00:23:20ya Atau enggak pindah sama sekali maka
- 00:23:22dia berhenti disitu ini kita mendapatkan
- 00:23:24dua klaster Disini yang kiri itu cluster
- 00:23:27yang besar yang kadang yang kecil itu
- 00:23:29ini kalau kita menggunakan dua Master
- 00:23:34Bagaimana kalau kita menggunakan tiga
- 00:23:36klaster kannya = 3 maka dengan cara yang
- 00:23:39sama pertama kita buat dulu posisi atau
- 00:23:42titik pusat Cluster awalnya secara acak
- 00:23:46dengan seperti itu ya kemudian kita
- 00:23:49kelompokkan dulu nih datanya berdasarkan
- 00:23:52pusat Cluster terdekatnya Jadi sekarang
- 00:23:54ada data yang ada cluster yang ungu
- 00:23:56Cluster Kuningan cluster yang hijau
- 00:24:00kemudian perbaiki ya perbaiki posisi
- 00:24:03Android atau pusat Cluster nya ya
- 00:24:06perbaiki ya pindah ketika dia pindah
- 00:24:09maka apa komposisi cluster yang juga
- 00:24:12berubah yang tadinya kuning berubah jadi
- 00:24:14hijau yang tadinya kuning berubah jadi
- 00:24:16Ungu misalnya atau sebaliknya gitu ya
- 00:24:18kemudian dia akan berpindah Lagi
- 00:24:21perbaiki lagi sehingga posisinya
- 00:24:23sekarang berubah dan seterusnya
- 00:24:25Iya dia berhenti ketika apa ketika di
- 00:24:30pusat Cluster nya sudah tidak berpindah
- 00:24:32lagi ya maka akan membentuk sebanyak
- 00:24:35tiga klaster disini Buster yang ungu
- 00:24:37kuning dan hijau itu ya jadi cara
- 00:24:42kerjanya adalah dengan memindahkan
- 00:24:44posisi pusatfasker itu ya berdasarkan
- 00:24:47rata-rata dari data yang ada di klaster
- 00:24:50tersebut nah ini adalah algoritma
- 00:24:52k-means sangat simpel sebetulnya ya
- 00:24:55sangat simple nah eh Mungkin ada yang
- 00:24:59bertanya Nah tadi Bagaimana mengetahui
- 00:25:02jarak data ya Bagaimana kita tahu bahwa
- 00:25:06data tersebut dekat dengan satu pusat
- 00:25:09Cluster Nah kita Hitung jarak
- 00:25:10menggunakan Zionis terus tadi yang udah
- 00:25:12kita bahas di awal video Intani ya itu
- 00:25:16menggunakan rumus iklim di and distance
- 00:25:20tadi jadi kita tahu nih data ini dekat
- 00:25:23dengan cluster yang mana Data ini dekat
- 00:25:25dengan cluster yang mana jaraknya
- 00:25:27dihitung dengan YKS tadi Nah sekarang
- 00:25:30Mari kita coba mengimplementasikan
- 00:25:32algoritma k-means ini menggunakan
- 00:25:35aplikasi Redmi Note Oke sekarang kita
- 00:25:38akan demokan Iya Bagaimana menggunakan
- 00:25:42algoritma k-means ya menggunakan
- 00:25:44software rapidminer ini Oke Langsung
- 00:25:47saja disini saya bukan lu dataset yang
- 00:25:49saya punya lupa csp
- 00:25:52ini
- 00:25:54nanti dataset ini akan saya share Ya
- 00:25:57akan saya Letakkan Link unduhnya Hai di
- 00:26:00deskripsi di bawah video ini
- 00:26:02teman-temannya anda bisa cek Nanti
- 00:26:03disitu kita backup datanya sini datanya
- 00:26:07adalah ini ya saya Zoom
- 00:26:10kasetnya Nia Facebook live sellers in
- 00:26:14Thailand ini saya ambil dari UC
- 00:26:16seringnya jadiin dekat set publik
- 00:26:18sebenarnya kita pakai ini next langsung
- 00:26:22X lagi saja
- 00:26:23Ah disini teman-teman lihat untuk status
- 00:26:26id-nya Nikita ekskul saja ternyata
- 00:26:29enggak butuh ya kemudian jika status
- 00:26:31publication date nyanyi kita juga gak
- 00:26:33butuh kita ekskul saja jadi kita enggak
- 00:26:36kita mau nggak kita masukkan ya tidak
- 00:26:38kita ikutkan kedalam
- 00:26:40hatimu kita olah ya legenda kasetnya
- 00:26:44Ingat klasterisasi tidak memiliki label
- 00:26:48ya ya enggak punya label ih sekarang
- 00:26:50kita klik finish saja
- 00:26:53kalian enggak ngerti apa ya ngecek dari
- 00:26:56seperti apa
- 00:26:57India datanya
- 00:27:00ekornya ada Rp7.000
- 00:27:027050 rekor nih ya ada sebanyak
- 00:27:067050 record pada dataset yang kita pakai
- 00:27:09di sini
- 00:27:11lagi sekarang langsung saja kita
- 00:27:13klasterisasi ya di sini kita nggak perlu
- 00:27:17nyeplit data ya kita demokan bagaimana
- 00:27:20clusternya saja ya di sini operator teh
- 00:27:23cari
- 00:27:25amin
- 00:27:27amin amin atau masukkan
- 00:27:32Diva mint ya nama offroad reklasering di
- 00:27:36sini ya Nah sekarang kita lihat dulu ada
- 00:27:38parameter apa saja di operator
- 00:27:40klastering kamin sini ya terjebak klik
- 00:27:43operatornya dan kita cek di panel
- 00:27:44parameter sebelah kanan itu ya eh di
- 00:27:48sini ada parameter k yang secara default
- 00:27:51itu diset 5 oleh revit miner ya ini bisa
- 00:27:55kita ganti nih slime artinya dia ingin
- 00:27:58membentuk lima cluster yang berbeda
- 00:28:00misalkan kita mau bikin 2 Cluster saja
- 00:28:02Misalnya the ganti2 kemudian ada
- 00:28:05parameter Max Runs Max rasanya Artinya
- 00:28:09kita menentukan berapa kali sirkuit
- 00:28:11minat akan melakukan proses clustering
- 00:28:13ya ini ya berapa kali dia akan melakukan
- 00:28:16proses klastering ini dan nanti dia akan
- 00:28:19menampilkan hasil yang paling baik
- 00:28:21misalkan di sini default-nya adalah 10
- 00:28:24nantinya kamisnya akan dijalankan 10
- 00:28:27kali dan dari 10 kali itu dipilih mana
- 00:28:29hasil Kamis yang paling baik itu yang
- 00:28:31ditampilkan oleh redminer ini nggak
- 00:28:34perlu kita ubah Biarkan saja seperti itu
- 00:28:36nah yang perlu kita ubah lagi adalah in
- 00:28:39teman-teman ini ya di sini meser tipsnya
- 00:28:43itu default-nya adalah Black Monday
- 00:28:45divergences ini kita ganti saja kmix
- 00:28:49mazer ini mix mazars Kenapa karena
- 00:28:53dataset yang kita miliki tadi atributnya
- 00:28:56itu beda-beda ada yang tipenya nominal
- 00:28:58ya polinom knuth dia ada juga yang
- 00:29:01tipenya integer tadi integer dan real
- 00:29:03jadi beda nih ada yang numerik ada yang
- 00:29:06nominal maka supaya ifrit yang distensi
- 00:29:09yang bisa bekerja dengan baik maka kita
- 00:29:11ganti ke mix mazars ingin nanti di bawah
- 00:29:15ini ya parameter mix misalnya akan
- 00:29:18berubah jadi mix IPDN distance Iya nanti
- 00:29:22kalau teman-teman misalkan punya
- 00:29:24data-datanya tuh isinya integer atau
- 00:29:27Real semuanya numerik semua Anda bisa
- 00:29:30aja ganti ke numerikal mizarzz atau
- 00:29:32bretman devergent Sis masalah ya ini
- 00:29:36kita pakai mic schnizer nah kemudian
- 00:29:38yang perlu kita set juga adalah maksimum
- 00:29:42maksimum optimization step sedih disini
- 00:29:46setnya apa nilainya diset 100 oleh
- 00:29:49rakyat mainannya artinya Apa artinya
- 00:29:52tadi kita lihat kami satukan setiap kali
- 00:29:55proses dia memindahkan posisi sentroid
- 00:29:58atau pusat Cluster nya Oh ya Nah di sini
- 00:30:02kita bisa batasi berapa kali pusat
- 00:30:05Cluster itu Akan berpindah misalkan
- 00:30:08maksimal 100 kali ya sehingga nanti
- 00:30:10kalau udah sampai 100 kali ya dia akan
- 00:30:13stop dan kelas setting diambil begitu
- 00:30:16atau misalnya sebelum mencapai 100 kali
- 00:30:20ya ternyata si Centro ini sudah pada
- 00:30:24posisi yang enggak berubah lagi maka
- 00:30:26sirkuit menerjunkan menghentikan proses
- 00:30:28klasterisasi nya ini ya Beberapa
- 00:30:30parameter yang bisa kita setting di apa
- 00:30:33namanya di operator kami nge-trend kita
- 00:30:36coba ya kita koneksikan
- 00:30:38sp-nya ke posternya Nikita sambungan ke
- 00:30:43Rizal kita jalankan
- 00:30:46ih ini hasil dari klasterisasi tadi
- 00:30:49ngelihat di sini
- 00:30:52eh teman-teman bisa liat di sini ya data
- 00:30:55yang pertama ini masuk ke dalam Cluster
- 00:30:58nol cluster yang Oh ya nanti kedua juga
- 00:31:01begitu ketiga dan seterusnya Mbak kita
- 00:31:04Scroll kebawah
- 00:31:07high nih and ini ternyata pusatnya
- 00:31:11banyak di kelas Ronald ya nih yang tak
- 00:31:146849 ini masuk ke Cluster 1
- 00:31:18atau kita lihat di sini Ya sepertinya
- 00:31:21perbandingan Cluster nya agak jomplang
- 00:31:23nih ya Ah Anda bisa lihat di sini nih
- 00:31:27eh Cluster nol banyak sekali dengan yang
- 00:31:30ada di Cluster satunya sedikit sekali ya
- 00:31:33hanya 141 ya Ini ini jadi plaster nya
- 00:31:39seperti teman-teman
- 00:31:41kemudian ini kalau Cluster modelnya
- 00:31:44kayak gini ya laser nalanda 6900 mesum
- 00:31:48ya Cluster 0ada 6000an ya uang salah
- 00:31:52satunya 141 atau itunya 7050 ya Nah
- 00:31:57kalau kita ingin menampilkan a
- 00:32:00visualisasi dari klastering yang tadi
- 00:32:02kita perlu beberapa setting di sini ya
- 00:32:05Coba kita save disini
- 00:32:08pada menu visualizations Coba kita ganti
- 00:32:11ke Skeleton atau Babel ya
- 00:32:14kemudian karena ini adalah kurva x koma
- 00:32:18y kita hanya bisa menampilkan dua
- 00:32:21atribut saja maka disini Coba kita ganti
- 00:32:24ya untuk sumbu x nya kita misalkan pakai
- 00:32:28eh number of commerce misalnya Kemudian
- 00:32:32untuk Cluster nya kita ganti nih Agan
- 00:32:36Tia
- 00:32:36yang tadinya Cluster kita kembalikan ke
- 00:32:39kiri untuk subuh Yeni sembunyinya nih
- 00:32:43sumbu y nya kita ganti number of apa ya
- 00:32:47komen share coba number of shares a
- 00:32:51posisikan sebelah kanan play ya sekarang
- 00:32:54kalau misalnya nih ya Nah di sini ya
- 00:33:00yang kita miliki Ya seperti ini bumbu x
- 00:33:02adalah number of commons dengan sumbu y
- 00:33:05nya adalah number of shares jadi
- 00:33:07ceritanya gini teman-teman yang paling
- 00:33:09kita pakai tadi itu adalah data eh apa
- 00:33:13ya postingan di Facebook ya postingan
- 00:33:16jualan di Facebook yang diambil dari
- 00:33:18Thailand gitu aja kita tampilkan disini
- 00:33:21adalah Jumlah komentar Ya jumlah
- 00:33:24komentar dan juga jumlah share dari
- 00:33:26setiap postingan tersebut jumlah setnya
- 00:33:29Berapa jumlah komentar yang berapa ingat
- 00:33:31sumber Anda kain seperti ini Nah
- 00:33:33sekarang Coba kita tampilkan Cluster nya
- 00:33:36tadi sih di sini yang settingan tadi
- 00:33:38pada bagian kolornya kita ganti menjadi
- 00:33:40Cluster lihat Ani lo ya lele di sini
- 00:33:46yang warnanya biru Iya Yang bawah ini
- 00:33:49yang warnanya biru ini adalah cluster
- 00:33:51yang nol tadi laser yang pertama jangan
- 00:33:54yang warna hijau ini adalah cluster yang
- 00:33:56ke-1 tadi yag laser yang kedua itu
- 00:33:58pasrah satu ya ini Hai lihat di sini ya
- 00:34:02masternya terpisah seperti itu ini kalau
- 00:34:06kita menggunakan number of shares dan
- 00:34:08nampak of commons Anda bisa ganti disini
- 00:34:10lfc ganti zikirkan subyek diganti ya
- 00:34:13jangan komen jumlah like misalnya
- 00:34:16terjadi Ya seperti ini ya Ya kan Ya
- 00:34:19seperti ini pastinya
- 00:34:20ya jadi di sini Kita emang punya
- 00:34:24keterbatasan ya kita nggak bisa
- 00:34:25menampilkan semua atributnya dalam dalam
- 00:34:27kurva x koma y kita hanya bisa memilih
- 00:34:30dua atribut untuk ditampilkan di sini
- 00:34:32gitu ya hilang yang paling bagus tadi
- 00:34:35ini ya comment dan
- 00:34:37eh share gitu ya seperti ini terlihat
- 00:34:41nih pemisahan lasernya seperti ini Nah
- 00:34:45sekarang kita coba ya mungkin kita ganti
- 00:34:48nilai kannya ya tadi dua coba kita ganti
- 00:34:52jadi tiga klaster ya kita ganti jadi
- 00:34:55tiga klaster ternyata jalankan lagi
- 00:34:57hehehe
- 00:35:00Hai Gazebo lihat visualisasi yang
- 00:35:02teman-temannya
- 00:35:03gimana visualisasinya Oh ini dia nih
- 00:35:07hadiah ini ya Jadi ada Cluster hijau
- 00:35:11biru dan juga oranye atau Jingga gitu ya
- 00:35:16kalau meledaknya seperti ini datanya ada
- 00:35:19yang seperti ini ya
- 00:35:21melihat Cluster modelnya nih
- 00:35:23Cluster nol itu ada 6000an juga masih
- 00:35:26Cluster 137 cluster2 ada 484
- 00:35:32ini
- 00:35:35Nah sekarang pertanyaan yang paling
- 00:35:38mendasar nya itu adalah bagaimana ya
- 00:35:41Gimana sih cara kita
- 00:35:43menentukan jumlah cluster yang tepat
- 00:35:47pertanyaan pentingnya Apakah dua apakah
- 00:35:50tiga Apakah 4 dan seterusnya Gimana
- 00:35:52caranya menentukan
- 00:35:54apakah Cluster kita itu sudah baik atau
- 00:35:57belum maka disini teman-teman bisa bisa
- 00:36:00cek di panel operator kita cari
- 00:36:03operator performance ya performance
- 00:36:06untuk yang plastering
- 00:36:09sini ya kali ih segmentation ini kita
- 00:36:13ambil yang ini nah Cluster distance
- 00:36:17performance ya kita ukur kualitas
- 00:36:19Cluster kita menggunakan berapa berbasis
- 00:36:23jaraknya ya kita pakai ingin ini Italia
- 00:36:26ke kanvas
- 00:36:27nyanyi kita terus ya Ini dari kelas
- 00:36:32ternyata sambungkan kesimpulan teman ya
- 00:36:34hot balik Sari maaf ini ke bawah ya Di
- 00:36:38kesini yang ini ke atas ini
- 00:36:41Nah sekarang ini kita kalau misalkan
- 00:36:43performancenya sini
- 00:36:46stempelnya juga ada nih pas rekening
- 00:36:48centraza Mencoba ini dengan tiga klaster
- 00:36:52ya dengan tiga klaster coba kita
- 00:36:54jalankan lagi
- 00:36:55Oke akan HP ini nah keenam numerical
- 00:37:00keyboard oke ternyata
- 00:37:02operator performance ini dia tidak mau
- 00:37:06jalan karena ada atribut dari data
- 00:37:09sekitarnya yang tipenya polinominal
- 00:37:11yakni atribut status tipe ini Oke deh
- 00:37:14kalau gitu kita drop saja ya atributnya
- 00:37:17ya dan tetap saja trip 1-step tadi
- 00:37:20Supaya apa namanya performa sih mau
- 00:37:24jalan gitu ya ini kita klik dulu di CSB
- 00:37:27nya kemudian cek di panel parameter
- 00:37:30kita cari paling bagian paling bawah nih
- 00:37:34ya dataset metadata ya
- 00:37:36jika kemudian
- 00:37:39cari satu Style Ini Anindya polinominal
- 00:37:44kita centangnya kita buang aja ya kita
- 00:37:47drop biaya ini tuh dengan simulasi saja
- 00:37:50teman-temannya nanti kalau misalkan
- 00:37:52tetap butuh atribut yang paling nominal
- 00:37:55tadi teman-teman harus konversi dulu
- 00:37:58yang file name ini menjadi numerik gitu
- 00:38:01ya dikonversi ke numerik dulu ada
- 00:38:03operatornya jadi kita buang saja biar
- 00:38:05gampang Lay sekarang Coba kita jalankan
- 00:38:10lagi
- 00:38:12Oke ini nih ya ah kita buka tab
- 00:38:18performance yang teman-teman hanya lihat
- 00:38:20nih kita bisa baca di situ ya
- 00:38:23websites with in centred distance ya
- 00:38:26adalah minus 33 berapa nih 380.000
- 00:38:31Sekian dulu ada minus ya oke Pelangi
- 00:38:35Kenapa ada minus karena tadi di
- 00:38:37performancenya kita belum centang
- 00:38:39maximize nih ya aksi masih lupa centang
- 00:38:43lebih ini kita channel Maxim esnya
- 00:38:45supaya nanti hasilnya enggak negatif
- 00:38:47gitu ya tolong lagi
- 00:38:50nah sekarang di Tab performance ini
- 00:38:54Nah kita bisa lihat nih kampret Swittins
- 00:38:58centred distance adalah 300 7000 sekian
- 00:39:01gitu ya artinya Apa artinya rata-rata
- 00:39:04jarak dalam tiap klaster itu kan kita
- 00:39:08punya tinggal sekali ya kita punya tidak
- 00:39:10laser tadi Nah rata-rata jarak data di
- 00:39:13tiap klaster itu adalah 380
- 00:39:177385 ini ya Ah ini jarak rata-ratanya
- 00:39:22nanti gini ya jarak rata-rata ini ini
- 00:39:26kita copy Aku pilih nanti coba kita
- 00:39:30paste kan ke Excel atau ya aplikasi
- 00:39:32semacamnya gitu ya nanti kita akan coba
- 00:39:35analisis ya berdasarkan nilai empret
- 00:39:38sini ya kabar apa yang harusnya kita
- 00:39:41pakai pada klaster yang kita buat ini
- 00:39:44gitu cuma Dian ya itu lakukan running
- 00:39:48kembali tetapi disini nilai kain kita
- 00:39:50ganti Nah tadi mereka 3 ya tadi nilai
- 00:39:54kayaknya tiga Sekarang kita coba ganti
- 00:39:55jadi dua dengan di dua ya lalu kita
- 00:39:59jalankan lagi Hai pelanggan
- 00:40:01kemudian kita chat lagi performance
- 00:40:05vektornya ya ini kita copy lagi copy
- 00:40:08kita copy lagi Memang iya teh kopi
- 00:40:11masukkan ke XL ya tapi masukkan ke XL
- 00:40:14kalai kemudian kita lakukan cara yang
- 00:40:16sama ya untuk nilai k yang lain ya di
- 00:40:19sini saya coba akan pakai nilainya
- 00:40:20nilainya 2 sampai dengan ke-7 jadi
- 00:40:26234567 ya kita coba ya
- 00:40:29semuanya Nah sekarang saya sudah
- 00:40:32melakukan eh klasterisasi dengan kambing
- 00:40:35sebanyak berapa kali ini enam kali ya
- 00:40:37enam kali dengan nilai k23 sampai dengan
- 00:40:41ke-7 ini menjadi avents distancia saya
- 00:40:45catat saya masukkan ke sini
- 00:40:46teman-temannya sekarang kita akan
- 00:40:49melakukan teknik yang namanya elbow
- 00:40:51method ya elbow method elbow support ya
- 00:40:57Jadi kita ingin menentukan pernah nilai
- 00:41:00k yang tepat ya pada klaster kita ini
- 00:41:03Baihaqi hasil plastiknya itu bagus ya
- 00:41:06menggunakan teknik yang disebut dengan
- 00:41:08elbow metalborg teknik gitu ya elbowed
- 00:41:10botusi Kuya itu nah sekarang Eh Bells
- 00:41:15distensi tadi kita seleksi yang kita
- 00:41:18seleksi ini kemudian kita visualisasikan
- 00:41:20ya menggunakan kurva x koma y
- 00:41:24Ini aja Iya di sini
- 00:41:27kita mau semuanya
- 00:41:29dan sekarang kita bisa lihat di sini ya
- 00:41:32Sesuai dengan namanya elbow method l
- 00:41:35butuhkan si Kuya Nasibku Jadi sini kita
- 00:41:38akan mencari kurva yang bentuknya paling
- 00:41:41siku yang bentuknya paling siku itu yang
- 00:41:44mana Ini bagian sini ini Paling siku
- 00:41:48dengan kalau yang lain ini enggak sih
- 00:41:50Kuya perbedaannya enggak enggak
- 00:41:52signifikan melihat di sini kalian
- 00:41:54internet banget sih punya ya makan nanti
- 00:41:57di sini lihat didata yang di atas ini
- 00:42:00yang pertama ini adalah data Everest
- 00:42:02distance pada
- 00:42:04ktanya dua ya ini saat ke-3 ih saat
- 00:42:08kannya 4 ini saat kannya 5 6 dan 7 Rita
- 00:42:13ya elbow nya sikunya ada di sini pada
- 00:42:17saat kannya 3 nanti dengan Eldo metode
- 00:42:20ini kita bisa ambil kesimpulan bahwa
- 00:42:23nilai k yang paling bagus untuk data
- 00:42:26kita tadi itu adalah 3 ya 3 Cluster
- 00:42:30mengganti kita bisa Tentukan obati dari
- 00:42:32sini saya bisa pakai tiga klaster ya
- 00:42:36seperti itu caranya jadi ini teknik
- 00:42:38untuk menentukan Berapa nilai cluster
- 00:42:41yang paling bagus oke NK coba Iya ke
- 00:42:45cobakan nilai k3di
- 00:42:48recruitment.ka.id Takan udah kembali
- 00:42:50kyrakidz mindernya kita klik eh
- 00:42:54klastering nya kita ganti kannya
- 00:42:5633 ini ya maka kita dapatkan hasil yang
- 00:43:00seperti ini nah ini pun jadi ini adalah
- 00:43:03hasil klasterisasi menggunakan Kamis
- 00:43:05dengan jumlah kas = 3 di mana tadi nilai
- 00:43:10tiga lah jumlah cluster yang paling
- 00:43:12bagus ya setelah kita menggunakan teknik
- 00:43:15elbow mepet ya dimana disini amprex
- 00:43:19distance ya rata-rata jarak pada setiap
- 00:43:22Cluster itu adalah Spanyol sebesar
- 00:43:26380.000 sekian ya jarak data ya pada
- 00:43:31setiap Cluster
- 00:43:33ini ini mungkin hanya dasar saja
- 00:43:36teman-teman tentu saja bisa belajar dari
- 00:43:38sumber lain yang lebih kaya materinya
- 00:43:40gitu ya mudah-mudahan video ini bisa
- 00:43:43membantu teman-teman dalam memahami
- 00:43:44Bagaimana cara kerja Kamis dan bagaimana
- 00:43:48menerapkan algoritma k-means di
- 00:43:49rapidminer jadi saya kira sekian saja
- 00:43:53video ini ia benda mudahan teman-teman
- 00:43:56bisa mendapatkan pelajaran manfaat dari
- 00:43:58sini Insyaallah jumpa lagi di video
- 00:44:00selanjutnya terima kasih assalamualaikum
- 00:44:02warahmatullah wabarakatuh
- klasterisasi
- k-means
- algoritma
- data
- klasifikasi
- kemiripan
- Euclidean distance
- RapidMiner
- pengelompokan
- segmentasi