Belajar Data Mining - Konsep Decision Tree (Pohon Keputusan)

00:16:02
https://www.youtube.com/watch?v=hKb1oE2H9Es

概要

TLDRThe video provides an overview of Decision Trees, a method for problem-solving that maps alternatives and represents decision-making rules. It explains the structure of a Decision Tree, including root nodes, internal nodes, and leaf nodes, and how they are used to classify data. The video illustrates the process of analyzing both categorical and numerical data to make predictions, emphasizing that the structure can vary based on the data and methods used. It concludes with an example of applying a Decision Tree to new data for classification, demonstrating its practical use in decision-making.

収穫

  • 🌳 Decision Trees map problem-solving alternatives.
  • 🔑 Root nodes have no incoming edges but multiple outgoing edges.
  • 🔄 Internal nodes have one incoming edge and multiple outgoing edges.
  • 🏁 Leaf nodes represent final outcomes or classifications.
  • 📊 Categorical and numerical data can be analyzed.
  • 🔍 The structure of a Decision Tree can change with different data.
  • 📈 Decision Trees can be used for predictions on new data.
  • 📉 Numerical data can be grouped into ranges for analysis.
  • 🧩 Attributes and conditions determine the branches of the tree.
  • 💡 Decision Trees are a practical tool in machine learning.

タイムライン

  • 00:00:00 - 00:05:00

    The video introduces the concept of Decision Trees, explaining it as a method for mapping alternatives for problem-solving. It describes how data is transformed into a decision tree structure that represents decision rules, including the root, internal nodes, and leaf nodes, each serving a specific function in the decision-making process.

  • 00:05:00 - 00:10:00

    The presenter illustrates how to apply the decision tree using a dataset, focusing on the 'refund' column. The analysis shows how to classify data based on categorical values (Yes/No) and how to derive conclusions from the data, leading to predictions about outcomes based on the established rules.

  • 00:10:00 - 00:16:02

    The video concludes by demonstrating how to apply the decision tree model to new data for prediction. It emphasizes that the structure of the decision tree can change with new data and methods, and it highlights the importance of understanding the decision-making process for accurate predictions.

マインドマップ

ビデオQ&A

  • What is a Decision Tree?

    A Decision Tree is a method for mapping alternatives for problem-solving, representing decision-making rules.

  • What are the main components of a Decision Tree?

    The main components are root nodes, internal nodes, and leaf nodes.

  • How does a Decision Tree classify data?

    It analyzes categorical and numerical data to make predictions based on established rules.

  • Can the structure of a Decision Tree change?

    Yes, the structure can change based on the data and methods used.

  • What is the purpose of a leaf node?

    A leaf node represents the final outcome or classification in a Decision Tree.

  • How are numerical data handled in Decision Trees?

    Numerical data can be grouped into ranges to simplify the decision-making process.

  • What is the significance of the root node?

    The root node is the starting point of the Decision Tree, with no incoming edges but multiple outgoing edges.

  • Can Decision Trees be used for predictions?

    Yes, once a Decision Tree is established, it can be used to predict outcomes for new data.

  • What types of data can be used in Decision Trees?

    Both categorical and numerical data can be used.

  • How do you determine the branches in a Decision Tree?

    Branches are determined based on the attributes and conditions of the data.

ビデオをもっと見る

AIを活用したYouTubeの無料動画要約に即アクセス!
字幕
id
オートスクロール:
  • 00:00:00
    halo halo teman-teman jumpa lagi dengan
  • 00:00:03
    saya paksa enggak Authors hari ini kita
  • 00:00:06
    akan belajar tentang konsep decision
  • 00:00:09
    Tree atau yang banyak dikenal dengan
  • 00:00:11
    pohon keputusan desentri ini adalah
  • 00:00:17
    proses pemetaan mengenai
  • 00:00:20
    alternatif-alternatif pemecahan masalah
  • 00:00:22
    yang dapat diambil mas dari masalah
  • 00:00:25
    tersebut Jadi konsep dari decision Tree
  • 00:00:29
    ini sebenarnya adalah eh mengubah
  • 00:00:32
    tumpukan data menjadi sebuah pohon
  • 00:00:36
    keputusan yang merepresentasikan
  • 00:00:38
    aturan-aturan dari sebuah keputusan
  • 00:00:42
    Seperti apa bentuk dari struktur pohon
  • 00:00:46
    keputusan ini seperti ini contohnya
  • 00:00:51
    pohon ini menunjukkan
  • 00:00:58
    Hai faktor-faktor kemungkinan atau
  • 00:01:01
    probabilitas yang akan mempengaruhi
  • 00:01:04
    alternatif-alternatif keputusan Selain
  • 00:01:08
    itu pohon ini juga menunjukkan estimasi
  • 00:01:12
    hasil akhir yang akan didapat bila kita
  • 00:01:15
    mengambil alternatif keputusan jadi
  • 00:01:18
    apapun yang kita pilih itu sudah
  • 00:01:20
    menunjukkan alternatifnya
  • 00:01:26
    Hai Terdiri dari apa saja struktur pohon
  • 00:01:30
    ini yang pertama adalah root root note
  • 00:01:37
    adalah sebuah not atau titik yang tidak
  • 00:01:41
    mempunyai aids atau garis yang masuk
  • 00:01:45
    tetapi banyak it's yang keluar jadi
  • 00:01:48
    tidak ada garis yang masuk tapi banyak
  • 00:01:51
    yang keluar itu ciri-ciri dada dari
  • 00:01:55
    perut atau akarnya Kemudian yang kedua
  • 00:02:02
    adalah internal nut internal not Ini
  • 00:02:07
    adalah sebuah nut yang mempunyai 1x
  • 00:02:11
    masuk
  • 00:02:12
    Hai dan dua atau lebih Eyang keluar jadi
  • 00:02:16
    hanya satu yang masuk dan yang keluar
  • 00:02:19
    itu bisa dua atau lebih jadi ada yang
  • 00:02:23
    masuk dan ada yang keluar tapi masuknya
  • 00:02:25
    hanya satu tapi keluarnya banyak gitu
  • 00:02:29
    Iya yang ketiga adalah life life not ini
  • 00:02:34
    adalah disebut juga dengan Terminal Loop
  • 00:02:38
    terminalbet Terminal berarti not
  • 00:02:41
    terakhir jadi sebuah not yang hanya
  • 00:02:44
    mempunyai satu it's yang masuk tapi
  • 00:02:47
    tidak ada yang keluar Jadi kalau yang
  • 00:02:49
    tadi ada yang masuk dan banyak yang
  • 00:02:51
    keluar kalau yang Terminal itu yang
  • 00:02:55
    masuk hanya satu tapi tidak ada yang
  • 00:02:56
    keluar roti ini sudah menunjukkan sebuah
  • 00:03:00
    label atau hasil dari klasifikasi itu
  • 00:03:05
    adalah Terminal udh
  • 00:03:06
    Hai Sedangkan untuk yang non Terminal
  • 00:03:12
    laut ya yang non Terminal laut seperti
  • 00:03:15
    ini seperti yang internal nut segitu itu
  • 00:03:21
    terdiri dari sebuah atribut kondisi
  • 00:03:24
    untuk membedakan record dengan
  • 00:03:26
    karakteristik yang berbeda jadi bisa
  • 00:03:29
    terlihat dari sebuah atribut-atribut
  • 00:03:33
    kondisi
  • 00:03:36
    Hai ini adalah contoh dari data yang
  • 00:03:44
    bisa kita terapkan untuk diproses dengan
  • 00:03:48
    menggunakan decision Tree jadi disini
  • 00:03:54
    sudah ada beberapa contoh data ada kolom
  • 00:03:57
    Island ada memberitahu status kemudian
  • 00:04:00
    ada teksnya berikam dan cheat nah kita
  • 00:04:03
    ini adalah kolom klasifikasinya atau
  • 00:04:06
    kelasnya jadi target kita nanti adalah
  • 00:04:09
    ke kolom yang terakhir ini kalau kita
  • 00:04:15
    terapkan ke
  • 00:04:17
    Hai Desi santri sekarang kita tunjukkan
  • 00:04:21
    kita awali dengan kolom rifan.com
  • 00:04:25
    rivando Nah kalau kita lihat kolom
  • 00:04:29
    refund disini kolom refund ini adalah
  • 00:04:33
    categorical kalau kita lihat kelompok
  • 00:04:36
    datanya itu ada dua yaitu Yes dan NU
  • 00:04:40
    saja Jadi kalau tidak Des Yano berarti
  • 00:04:44
    garis atau garis yang keluar dari dari
  • 00:04:51
    Reva ini jadi perutnya ini rutenya
  • 00:04:56
    refund Rukh Khan ini sebagai runut garis
  • 00:04:59
    yang keluar dari fan itu hanya ada
  • 00:05:03
    Hai yaitu Yes dan danau Tapi masalahnya
  • 00:05:07
    sekarang kita lihat kalau Yes itu apakah
  • 00:05:12
    sudah menghasilkan sebuah class atau
  • 00:05:15
    tidak
  • 00:05:17
    Ayo kita coba lihat sekarang yang Yes
  • 00:05:19
    yang Yes kita coba lihat data yang Yes
  • 00:05:23
    untuk yang Yes yang pertama ini hasilnya
  • 00:05:26
    adalah no kemudian kita lihat yang kedua
  • 00:05:29
    Yes Reva Yes disini juga dog kemudian
  • 00:05:34
    yang ketiga di sini yes hasilnya juga No
  • 00:05:39
    berarti dari contoh data ini setiap
  • 00:05:42
    refund sama dengan Yes hasilnya adalah
  • 00:05:45
    No berarti dapat kita tarik kesimpulan
  • 00:05:48
    untuk garis Yes hasilnya adalah no
  • 00:05:54
    berapi jika nanti ada data yang nilainya
  • 00:05:58
    adalah Yes maka prediksinya adalah Now i
  • 00:06:03
    Hai Kemudian yang kedua untuk garis yang
  • 00:06:08
    kedua di sini ya untuk cabang yang kedua
  • 00:06:11
    berikutnya adalah no itu data no untuk
  • 00:06:16
    data no di sini kita lihat now hasilnya
  • 00:06:19
    now kemudian jc0 ternyata ada yang Yes
  • 00:06:22
    di sini noh Coba ada yang Yes berarti
  • 00:06:26
    butuh yang no ada yang Yes dan ada yang
  • 00:06:29
    No berarti kita tidak bisa langsung
  • 00:06:33
    [Musik]
  • 00:06:35
    memberikan sebuah prediksi atau sebuah
  • 00:06:37
    klasifikasi bahwa hasilnya adalah Desa
  • 00:06:39
    tahun nah jika kondisinya seperti ini
  • 00:06:42
    maka di desentri Harus melihat kondisi
  • 00:06:45
    yang lainnya nah kondisi lainnya kita
  • 00:06:49
    coba dengan menggunakan kolom marital
  • 00:06:53
    status
  • 00:06:54
    Hai Jadi jika revenue Lihatlah kondisi
  • 00:06:58
    yang lain kondisi yang lain disini
  • 00:07:00
    adalah status pernikahan Nah untuk
  • 00:07:05
    status pernikahan disini ini kilo Gita
  • 00:07:08
    lihat itu ada tiga dan tiga kelompok gak
  • 00:07:11
    tahu itu single merried dan Devil's jadi
  • 00:07:15
    garisnya pada tiga tapi disini saya
  • 00:07:20
    jadikan dua saja Kenapa karena saya
  • 00:07:23
    anggap single dan divorce itu sama
  • 00:07:25
    sama-sama jomblo itu ya jadi hanya merit
  • 00:07:29
    yang tidak jomblo berarti darinya
  • 00:07:32
    sebagai Jadi dua yaitu merit dan single
  • 00:07:36
    atau difos
  • 00:07:38
    Hai apakah boleh seperti nih Boleh saja
  • 00:07:40
    atau misalkan nanti kita bagi jadi 3
  • 00:07:42
    boleh Enggak boleh saja dengan data yang
  • 00:07:45
    semakin banyak itu masih dimungkinkan
  • 00:07:47
    Nah sekarang kita lihat mirip untuk
  • 00:07:51
    setiap kolom Rivan Rivan yang no dan
  • 00:07:56
    mitos statusnya adalah merried hasilnya
  • 00:07:59
    adalah qtela disini no untuk yang no
  • 00:08:02
    kemudian Med no di sini merried hasilnya
  • 00:08:05
    adalah nol juga kemudian disini no
  • 00:08:08
    merried dan hasilnya adalah no roti
  • 00:08:11
    dapat dipastikan bahwa setiap rivalnya =
  • 00:08:16
    no dan Mari tahu statusnya adalah mirip
  • 00:08:19
    Maka hasilnya adalah no begitu kemudian
  • 00:08:27
    sekarang Yesus yang kedua yaitu yang
  • 00:08:32
    a single atau yang jomblo sekarang
  • 00:08:36
    Kitalah yang jomblo yang no kemudian
  • 00:08:39
    single disini no yang no divorce
  • 00:08:43
    ternyata Yes Berarti ada yang model Yes
  • 00:08:46
    berarti kita harus melihat kondisi yang
  • 00:08:50
    lain lagi nah kondisi terakhir yang
  • 00:08:52
    belum kita lihat adalah taxable income
  • 00:08:55
    Nah untuk jenis data yang berupa angka
  • 00:09:00
    baik disket maupun continue seperti ini
  • 00:09:02
    itu bisa kita kado kit kita kelompokkan
  • 00:09:06
    lebih besar lebih kecil jadi tidak perlu
  • 00:09:09
    kita buat cabangnya banyak di sini ada
  • 00:09:12
    125 128 puluh pada 120 Wah jadi tidak
  • 00:09:16
    terhingga nanti Nah untuk mengatasi ini
  • 00:09:19
    bisa kita kelompokkan menjadi lebih
  • 00:09:21
    besar sama dengan berapa atau lebih
  • 00:09:22
    kecil sama dengan berapa dan disini saya
  • 00:09:25
    bagi jadi 2 saja
  • 00:09:27
    Oh ya jadi sebagai Jadi dua yang pertama
  • 00:09:31
    adalah nyuci 80 dan lebih besar dari 80
  • 00:09:35
    Nah sekarang kita lihat yang bisa 80 itu
  • 00:09:39
    pasti NU yang 80 single no8 di atas 80
  • 00:09:45
    ya No ini juga NU juga ini juga no jadi
  • 00:09:51
    Sudah dipastikan no seperti yang
  • 00:09:54
    terakhir yang ini Itu sudah pasti yes
  • 00:09:59
    dapat Yes nah Kalian nih yang lebih
  • 00:10:03
    kecil dari 80 disini hanya ada 75 61
  • 00:10:08
    Hai tapi yang hifanya no dan statusnya
  • 00:10:11
    adalah jomblo semuanya kebetulan sini
  • 00:10:15
    adalah Yes berarti harus
  • 00:10:18
    Hai karena semua not sudah memiliki
  • 00:10:21
    hasil yang sudah ada hasil ini cadasil
  • 00:10:24
    semua semua semua cabang sudah memiliki
  • 00:10:28
    hasil sudah ada kelasnya sudah adalah
  • 00:10:31
    Belnya maka struktur pohon ini sudah
  • 00:10:33
    selesai
  • 00:10:36
    Hai itu
  • 00:10:38
    Hai apakah struktur pohon ini akan
  • 00:10:41
    selalu seperti ini tidak dengan
  • 00:10:46
    bertambahnya data kemudian metode apa
  • 00:10:49
    yang kita gunakan bisa saja hasilnya
  • 00:10:51
    akan berbeda tergantung metode atau
  • 00:10:54
    jumlah data yang digunakan tahun semakin
  • 00:10:58
    banyaknya kolom atau variabel yang
  • 00:10:59
    digunakan saya kasih contoh yang kedua
  • 00:11:03
    model yang kedua
  • 00:11:05
    Ayo kita coba berangkat dari marital
  • 00:11:07
    status gizi kita mulai dari kolom editor
  • 00:11:10
    status kita lihat yang merekam tadi ada
  • 00:11:14
    kita bagi dua ya yaitu jomblo dan tidak
  • 00:11:18
    jomblo yang merit tadi sudah pasti tidak
  • 00:11:22
    pasti NU
  • 00:11:24
    Hai mudanya single atau devos single
  • 00:11:26
    ganti Force berarti harus melihat kolom
  • 00:11:29
    yang lain karena untuk Yang single ada
  • 00:11:32
    yang nunggu kemudian ada yang dipost ada
  • 00:11:34
    yang Yes single Yes sudah berarti harus
  • 00:11:37
    melihat kolom yang lain kalau yang lain
  • 00:11:39
    kita coba mulai dari kolom refund dan
  • 00:11:41
    ketemulah dari volume refund Nah
  • 00:11:45
    sekarang kita lihat yang refund tadi ada
  • 00:11:48
    dua yes dan dan no udah sekarang kita
  • 00:11:52
    lihat yang Yes Yang single atau default
  • 00:11:55
    dan tv-nya adalah yes yes single dismeno
  • 00:11:59
    kemudian yes yes divorce di sini lo
  • 00:12:04
    berarti semua yang Yes hasilnya adalah
  • 00:12:07
    no
  • 00:12:08
    di bulan yang terakhir yang terakhir
  • 00:12:11
    untuk refund = u = Nuno single menu edit
  • 00:12:17
    no devo shop ada yang jelas berarti
  • 00:12:19
    masih ada yang Yes dan Ahmad yang no
  • 00:12:23
    juga berarti kita harus melihat kolom
  • 00:12:25
    yang lain lagi nya kondisi yang lain
  • 00:12:27
    lagi nah kolom terakhir adalah teksnya
  • 00:12:29
    beling complete teletong kolom teks.com
  • 00:12:32
    kita bagi lagi menjadi di besar 40 dan
  • 00:12:35
    lebih dari 80 dan hasil akhirnya adalah
  • 00:12:39
    yang bisa lewat buruh NU dan yang lebih
  • 00:12:42
    jelasnya adalah Yes jadi dengan data
  • 00:12:46
    yang sama bisa menghasilkan lebih dari
  • 00:12:48
    satu pohon keputusan tergantung dari
  • 00:12:53
    metode dan rekondisi yang lainnya
  • 00:12:57
    Hai diserap ini mudah dipahami nah
  • 00:13:03
    berikutnya adalah bagaimana penerapan
  • 00:13:06
    struktur pohon ini atau penggunaan
  • 00:13:08
    superpower Ini yang mana Ini sudah
  • 00:13:11
    menghasilkan sebuah pola disini sudah
  • 00:13:13
    menghasilkan sebuah kebiasaan Bagaimana
  • 00:13:17
    struktur ini nanti akan digunakan untuk
  • 00:13:20
    melakukan sebuah prediksi terhadap
  • 00:13:22
    adanya data baru juga data baru nanti
  • 00:13:27
    tinggal diprediksi Ini hasilnya apa atau
  • 00:13:30
    kelasnya apa gitu ya in penerapannya di
  • 00:13:36
    sini nanti jadi setelah kita tadi
  • 00:13:39
    melakukan proses learning dan dihasilkan
  • 00:13:42
    sebuah pola baru kita terapkan kita
  • 00:13:44
    terapkan untuk menghasilkan sebuah
  • 00:13:47
    hasil-hasil prediksi
  • 00:13:49
    Hai Keh kita kasih contoh
  • 00:13:54
    Indonesia
  • 00:13:56
    Hai jadi misalkan saya ada data baru
  • 00:13:58
    seperti ini revanya adalah now metal
  • 00:14:02
    statusnya adalah merried kemudian
  • 00:14:04
    taxable singkongnya adalah 80.000 nah
  • 00:14:08
    hasilnya nanti ini apa Nah kita terapkan
  • 00:14:12
    dengan menggunakan model yang pertama
  • 00:14:16
    tadi kita tekan dengan model yang
  • 00:14:18
    pertama tadi sekarang kita lihat di sini
  • 00:14:21
    Yang pertama rootnya adalah refund
  • 00:14:24
    berarti yang dibaca dulu dari data yang
  • 00:14:28
    baru ini adalah kolom refund dulu
  • 00:14:30
    di kolom refund kita jadi kita berangkat
  • 00:14:33
    dari rute kita biarkan dari root root
  • 00:14:37
    nya adalah refund berarti kita lihat
  • 00:14:39
    kolom-kolom refund nah di kolom refund
  • 00:14:43
    kita lihat di kolom Rifandi data baru
  • 00:14:46
    itu nilainya adalah No berarti cabang
  • 00:14:50
    yang dipilih adalah No berarti
  • 00:14:54
    algoritmanya adalah Ivan = no sense apa
  • 00:14:59
    ternyata jika Divanya Sama denganmu maka
  • 00:15:03
    kita harus melihat kondisi yang lain di
  • 00:15:05
    sini nah kondisi yang lain tersebut
  • 00:15:07
    adalah beritahu status seperti IV
  • 00:15:12
    a refund = no n marital status = apa
  • 00:15:18
    disini ternyata mitos satunya adalah
  • 00:15:20
    merried berarti mirip ternyata disini
  • 00:15:24
    sudah menghasilkan sebuah label atau
  • 00:15:27
    sebuah prediksi atau sebuah klasifikasi
  • 00:15:30
    Hai hasilnya adalah NU berarti data baru
  • 00:15:35
    tersebut hasilnya adalah nug
  • 00:15:39
    Hai Oke udah ya tentunya lebih semoga
  • 00:15:42
    mudah dipahami Oke cukup sampai disini
  • 00:15:49
    dulu terima kasih banyak semoga
  • 00:15:51
    bermanfaat subscribe ya save jangan lupa
  • 00:15:55
    like jika suka dan bisa juga tidak suka
  • 00:15:58
    dan jangan lupa untuk di share Terima
  • 00:16:01
    kasih sampai
タグ
  • Decision Tree
  • Data Classification
  • Root Node
  • Internal Node
  • Leaf Node
  • Categorical Data
  • Numerical Data
  • Prediction
  • Data Analysis
  • Machine Learning