Persamaan Garis Terbaik (Garis Regresi)

00:25:20
https://www.youtube.com/watch?v=Y6I_H1tAVGk

Summary

TLDRVideo ini membahas tentang data bivariat dan cara menemukan garis regresi atau garis penduga terbaik. Diberikan contoh data siswa yang menguasai bahasa asing dan nilai ulangan harian bahasa Inggris. Tiga garis penduga awal dibandingkan, dan ditemukan bahwa garis y = 15x + 30 adalah yang terbaik berdasarkan jumlah kuadrat error terkecil. Video ini juga menjelaskan tentang scatter plot, variabel bebas dan terikat, serta rumus untuk menghitung garis regresi. Akhirnya, garis regresi y = 15x + 25 ditemukan sebagai garis terbaik dengan jumlah kuadrat error 1750.

Takeaways

  • 📊 Data bivariat melibatkan dua variabel.
  • 📈 Garis regresi adalah garis penduga terbaik.
  • 🔍 Jumlah kuadrat error digunakan untuk menentukan garis terbaik.
  • 📉 Scatter plot membantu visualisasi hubungan antara variabel.
  • 🔗 Variabel bebas mempengaruhi variabel terikat.
  • 🧮 Rumus umum garis lurus adalah y = mx + c.
  • 📏 Koefisien determinasi menunjukkan pengaruh variabel.
  • 📊 Hasil akhir adalah garis regresi y = 15x + 25.
  • 📉 Jumlah kuadrat error untuk garis regresi adalah 1750.
  • 💻 Gunakan Excel untuk visualisasi data dan garis regresi.

Timeline

  • 00:00:00 - 00:05:00

    Video ini membahas tentang data bivariat, khususnya hubungan antara jumlah bahasa asing yang dikuasai siswa (X) dan nilai ulangan harian bahasa Inggris (Y). Tiga garis penduga diajukan, dan garis penduga terbaik ditentukan berdasarkan jumlah kuadrat error terkecil, yaitu y = 15x + 30.

  • 00:05:00 - 00:10:00

    Pembelajaran berlanjut dengan penjelasan tentang scatter plot yang digunakan untuk merepresentasikan data bivariat. Scatter plot membantu dalam melihat hubungan antara dua variabel, baik itu linear atau nonlinear, serta kekuatan hubungan tersebut. Namun, untuk analisis yang lebih tepat, koefisien korelasi R diperlukan.

  • 00:10:00 - 00:15:00

    Diberikan contoh data pengunjung pantai berdasarkan suhu harian, di mana hubungan antara suhu (X) dan jumlah pengunjung (Y) diasumsikan linear. Persamaan garis lurus umum y = mx + c diperkenalkan, di mana m adalah gradien dan c adalah titik potong sumbu Y.

  • 00:15:00 - 00:20:00

    Garis regresi atau garis penduga terbaik adalah persamaan yang memiliki jumlah kuadrat error terkecil. Dalam analisis regresi, variabel X adalah variabel independen, sedangkan Y adalah variabel dependen. Penjelasan tentang bagaimana variabel bebas mempengaruhi variabel terikat juga diberikan.

  • 00:20:00 - 00:25:20

    Akhirnya, video menjelaskan cara menghitung nilai M dan C untuk mendapatkan persamaan garis regresi terbaik, yaitu y = 15x + 25. Dengan menggunakan software seperti Desmos atau Microsoft Excel, garis regresi dapat divisualisasikan dan diverifikasi, menunjukkan bahwa tidak ada garis lain yang memiliki jumlah kuadrat error lebih kecil.

Show more

Mind Map

Video Q&A

  • Apa itu data bivariat?

    Data bivariat adalah data yang memuat dua variabel, misalnya variabel X dan Y.

  • Apa itu garis regresi?

    Garis regresi adalah persamaan garis terbaik yang memprediksi variabel Y berdasarkan variabel X.

  • Bagaimana cara menentukan garis penduga terbaik?

    Garis penduga terbaik ditentukan dengan mencari garis yang memiliki jumlah kuadrat error terkecil.

  • Apa itu scatter plot?

    Scatter plot adalah diagram pencar yang digunakan untuk merepresentasikan data bivariat.

  • Apa itu variabel bebas dan terikat?

    Variabel bebas adalah variabel independen (X) yang mempengaruhi variabel terikat (Y).

  • Apa rumus umum dari persamaan garis lurus?

    Rumus umum dari persamaan garis lurus adalah y = mx + c.

  • Apa itu koefisien determinasi?

    Koefisien determinasi (r^2) menunjukkan seberapa besar variabel bebas mempengaruhi variabel terikat.

  • Bagaimana cara menghitung nilai M dan C dalam garis regresi?

    Nilai M dihitung dengan rumus SSXY/SSX, dan nilai C dihitung dengan rata-rata Y dikurangi M dikali rata-rata X.

  • Apa hasil akhir dari perhitungan garis regresi dalam video ini?

    Hasil akhir adalah garis regresi y = 15x + 25 dengan jumlah kuadrat error 1750.

  • Apa yang harus dilakukan untuk memvisualisasikan data dan garis regresi?

    Gunakan software seperti Microsoft Excel untuk membuat scatter plot dan menampilkan garis regresi.

View more video summaries

Get instant access to free YouTube video summaries powered by AI!
Subtitles
id
Auto Scroll:
  • 00:00:03
    Oke, baik. Selamat datang. Pada video
  • 00:00:05
    pembelajaran kali ini kita akan
  • 00:00:06
    melanjutkan materi data bivariat yang
  • 00:00:08
    sudah kita bahas di pertemuan
  • 00:00:10
    sebelumnya. Jadi di pertemuan sebelumnya
  • 00:00:12
    kalau kita kan sudah punya data bivariat
  • 00:00:15
    nih, data bivariatnya itu adalah terkait
  • 00:00:19
    data banyak bahasa asing yang dikuasai
  • 00:00:21
    siswa itu kita sebut X dan juga nilai
  • 00:00:24
    ulangan harian bahasa Inggris itu kita
  • 00:00:25
    sebut Y dari en orang siswa di suatu
  • 00:00:29
    kelas. Jadi misalkan untuk siswa yang
  • 00:00:31
    pertama dia menguasai tiga bahasa asing.
  • 00:00:33
    Terus nilai ulangan hariannya 70. Yang
  • 00:00:36
    berikutnya dia menguasai tiga bahasa
  • 00:00:38
    asing. Nilai ulangan harian berikutnya
  • 00:00:40
    untuk siswa itu adalah 100. Kemudian ada
  • 00:00:43
    siswa yang ketiga, dia menguasai empat
  • 00:00:45
    bahasa asing. Nilai ulangan hariannya 90
  • 00:00:47
    dan seterusnya ya sampai siswa yang
  • 00:00:49
    keenam. Di pertemuan sebelumnya kita
  • 00:00:51
    sudah mengajukan misalkan ada tiga garis
  • 00:00:54
    penduga
  • 00:00:55
    nih. Ada 15x + 30, 25x -5, 10x + 50.
  • 00:01:01
    Masing-masing saling mengklaim bahwa
  • 00:01:02
    dirinya adalah garis penduga yang
  • 00:01:03
    terbaik. Ingat kembali, kita bisa
  • 00:01:05
    menyatakan suatu garis penduga itu
  • 00:01:08
    adalah yang terbaik kalau apa? Jumlahan
  • 00:01:11
    dari kuadrat errornya adalah yang paling
  • 00:01:13
    minimum kalau dibandingkan dengan garis
  • 00:01:14
    penduga-garis penduga pesaing lainnya.
  • 00:01:17
    Ternyata ketika kita melakukan
  • 00:01:18
    perhitungan, kita mendapatkan bahwa
  • 00:01:21
    untuk y = 15x + 30 dia memberikan
  • 00:01:24
    jumlahan dari kuadrat error yang paling
  • 00:01:26
    kecil. Maka kita bisa membuat kesimpulan
  • 00:01:28
    bahwa dari tiga garis penduga ini yang
  • 00:01:32
    terbaik adalah y = 15x + 30. Yang jadi
  • 00:01:36
    masalah adalah kalau misalkan muncul
  • 00:01:38
    garis penduga keempat kemudian dia
  • 00:01:41
    menyampaikan bahwa saya bisa memberikan
  • 00:01:43
    jumlahan dari kuadrat error dengan
  • 00:01:46
    besaran yang lebih kecil dari 1900.
  • 00:01:49
    Nah, kemudian muncul lagi. Misalkan
  • 00:01:52
    garis penduga yang kelima mengajukan
  • 00:01:53
    bahwa dirinya memberikan jumlahan
  • 00:01:55
    kuadrat error yang lebih kecil lagi dari
  • 00:01:57
    garis penduga keempat. Maka timbul
  • 00:01:59
    pertanyaan, kalau begitu ada enggak satu
  • 00:02:01
    buah cara, satu buah rumus, satu buah
  • 00:02:04
    formula yang bisa kita pakai untuk
  • 00:02:06
    langsung
  • 00:02:09
    menentukan persamaan garis yang terbaik
  • 00:02:11
    sedemikian sehingga dialah persamaan
  • 00:02:15
    garis yang memberikan jumlahan kuadrat
  • 00:02:17
    error terkecil. sehingga tidak akan ada
  • 00:02:20
    lagi persamaan garis lain yang memiliki
  • 00:02:22
    jumlahan kuadrat error yang lebih kecil
  • 00:02:24
    dari dirinya. Nah, itu adalah tujuan
  • 00:02:27
    pembelajaran kita untuk pertemuan hari
  • 00:02:29
    ini. Bagaimana caranya menemukan
  • 00:02:32
    persamaan garis lurus yang memberikan
  • 00:02:34
    jumlahan kuadrat error terkecil.
  • 00:02:39
    Nanti kalau kita sudah menemukan
  • 00:02:41
    persamaan garis yang memberikan jumlahan
  • 00:02:43
    kuadrat error terkecil, maka kita bisa
  • 00:02:46
    sebut garis tersebut sebagai garis
  • 00:02:48
    penduga terbaik atau line of best
  • 00:02:52
    fit. Oke, jadi hari ini kita akan bahas
  • 00:02:55
    tentang line of bestfit atau garis
  • 00:02:57
    penduga
  • 00:02:58
    terbaik. Nah, ingat kembali terkait
  • 00:03:02
    skater plot atau diagram pencar ya. Jadi
  • 00:03:05
    kita sama-sama tahu kalau data bivariat
  • 00:03:07
    itu adalah data yang memuat dua
  • 00:03:08
    variabel. Misalkan variabel X dan Y. Dan
  • 00:03:11
    kita sama-sama tahu bahwa best way cara
  • 00:03:14
    terbaik untuk merepresent suatu data
  • 00:03:17
    bivariat itu adalah disajikan ke dalam
  • 00:03:19
    diagram pencar atau scatter
  • 00:03:21
    plot. Kita tahu bahwa diagram pencar
  • 00:03:24
    dapat membantu kita sebagai reader untuk
  • 00:03:26
    melihat korelasi atau hubungan dari dua
  • 00:03:28
    buah variabel misalkan X dan Y. Nah, apa
  • 00:03:32
    sih yang bisa dibaca dari hubungan itu?
  • 00:03:34
    Yang pertama adalah trendnya seperti
  • 00:03:36
    apa? Is it linear or nonlinear? Ya,
  • 00:03:39
    misalkan kita bisa lihat arah kursor
  • 00:03:41
    yang ini linear dan yang ini adalah yang
  • 00:03:43
    nonlinear. Opsi untuk nonlinear dia bisa
  • 00:03:46
    eksponensial atau yang bentuknya U.
  • 00:03:49
    Kemudian kita bisa melihat dari skatter
  • 00:03:51
    plot terkait arahnya is positif atau
  • 00:03:53
    negatif atau tidak ada. Dan yang ketiga
  • 00:03:56
    adalah kita bisa melihat kekuatannya ya.
  • 00:03:58
    Kekuatan streng-nya itu apa? bisa dia
  • 00:04:01
    strong, bisa dia moderate, bisa dia weak
  • 00:04:03
    atau non. Tapi kekurangannya adalah dari
  • 00:04:06
    skatter plot itu hanya untuk perkiraan
  • 00:04:08
    saja. Sehingga kalau misalkan kamu mau
  • 00:04:11
    tahu kekuatannya itu apa, kamu harus
  • 00:04:13
    pakai menggunakan rumus product momen
  • 00:04:16
    atau koefisien korelasi R yang mana kita
  • 00:04:19
    sudah bahas di dua pertemuan sebelumnya,
  • 00:04:21
    ya.
  • 00:04:22
    Nah, sekarang coba lihat dulu gambar
  • 00:04:24
    berikut ini. Kita punya data bivariat
  • 00:04:27
    beach visitors. Kita punya informasi
  • 00:04:30
    tentang di sumbu X-nya average daily
  • 00:04:33
    temperature ya, rata-rata suhu harian
  • 00:04:35
    dalam derajat fahrenheit. Kemudian di
  • 00:04:37
    sumbu Y-nya itu adalah banyaknya
  • 00:04:39
    pengunjung pantai. Di sini kita coba
  • 00:04:42
    sama-sama baca untuk yang titik ini. Ini
  • 00:04:44
    artinya apa sih? Artinya adalah bahwa
  • 00:04:46
    ketika rata-rata suhu hariannya itu 84
  • 00:04:49
    derajat Fahenheit, maka visitorsnya itu
  • 00:04:52
    ada 225 orang. Kemudian yang kalau yang
  • 00:04:56
    ini ketika suhunya itu adalah 94 derajat
  • 00:05:00
    Fahrenheit, maka banyaknya visitors di
  • 00:05:03
    pantai itu ada 600 orang dan seterusnya
  • 00:05:06
    ya. Nah, kalau kita lihat kan dari
  • 00:05:08
    gambar ini bisa kita asumsikan trennya
  • 00:05:11
    linier ya. Ketika trennya linear, maka
  • 00:05:13
    kita dapat membuat beberapa persamaan
  • 00:05:15
    garis lurus penduga
  • 00:05:17
    tentunya. Nah, bentuk umum dari
  • 00:05:19
    persamaan garis lurus itu adalah y = mx
  • 00:05:23
    + c. Di mana m itu adalah gradien atau
  • 00:05:27
    kemiringan dari garis dan citik potong
  • 00:05:31
    pada sumbu Y. Nanti kita akan bahas
  • 00:05:33
    lebih detailnya.
  • 00:05:36
    Nah, nanti si persamaan garis-persamaan
  • 00:05:39
    garis yang lurus ini mereka akan saling
  • 00:05:42
    mengklaim nih bahwa mereka mampu
  • 00:05:44
    mewakili arus persebaran dari data
  • 00:05:46
    bivariat kita. Di mana setiap garis
  • 00:05:48
    tersebut pasti memiliki informasi
  • 00:05:50
    terkait jumlah kuadrat error yang
  • 00:05:54
    berbeda-beda. Misalkan di layar, kamu
  • 00:05:56
    bisa lihat di sini ada empat garis pendu
  • 00:05:58
    yang saling mengflame dirinya adalah
  • 00:06:00
    garis pendu yang paling baik untuk
  • 00:06:03
    merepresentasikan si databat kita.
  • 00:06:05
    Tentu kita sebagai reader akan bertanya
  • 00:06:07
    kira-kira dari mereka berempat yang bisa
  • 00:06:10
    memprediksi jumlah pengunjung banyaknya
  • 00:06:12
    visitors ya yang bisa memprediksi nilai
  • 00:06:14
    y ketika x diketahui itu yang mana sih?
  • 00:06:18
    Pertemuan lalu kita sudah tahu kalau
  • 00:06:19
    kita bisa pakai cara jumlahan kuadrat
  • 00:06:23
    error yang paling kecil dia yang paling
  • 00:06:24
    baik. Nah, tapi gimana caranya ee kita
  • 00:06:28
    bisa menentukan persamaannya langsung
  • 00:06:30
    nih yang terbaik tanpa harus menghitung
  • 00:06:32
    jumlahan kuadrat errornya ya. Jadi itu
  • 00:06:34
    target kita hari ini. Kita akan lihat
  • 00:06:36
    rumusnya
  • 00:06:38
    apa. Nah, nanti kalau kita sudah tahu
  • 00:06:40
    cara hitungnya, kita bisa menyatakan
  • 00:06:42
    bahwa persamaan garis lurus itu pasti
  • 00:06:44
    memiliki jumlahan kuadrat error terkecil
  • 00:06:47
    tanpa kita harus hitung lagi menggunakan
  • 00:06:48
    tabel seperti di dua pertemuan
  • 00:06:50
    sebelumnya atau di pertemuan sebelumnya,
  • 00:06:52
    ya. Nah, persamaan garis lurus yang
  • 00:06:54
    memiliki jumlahan kuadrat error terkecil
  • 00:06:57
    itu kita sebut sebagai garis regresi
  • 00:06:59
    atau regresi linear, ya. Karena garis
  • 00:07:02
    regresi itu memiliki jumlahan kuadrat
  • 00:07:04
    error yang terkecil, maka kita bisa
  • 00:07:06
    menyimpulkan bahwa garis regresi
  • 00:07:09
    merupakan persamaan garis terbaik atau
  • 00:07:11
    line of best fit untuk memprediksi
  • 00:07:14
    variabel y berdasarkan variabel x yang
  • 00:07:17
    sudah
  • 00:07:20
    diketahui. Jadi nanti kita akan ketahui
  • 00:07:23
    bahwa hanya ada tepat satu garis terbaik
  • 00:07:25
    atau line of best fit yang mampu
  • 00:07:27
    mempredik nilai Y yang mana dia adalah
  • 00:07:31
    memiliki jumlahan kuadrat error terkecil
  • 00:07:33
    kalau dia di battle dibandingkan dengan
  • 00:07:36
    semua garis-garis lain yang mengklaim
  • 00:07:39
    dirinya juga paling baik.
  • 00:07:43
    Oke, pada garis regresi atau line of
  • 00:07:45
    best fit atau persamaan garis terbaik,
  • 00:07:48
    kita sama-sama tahu kalau persamaan
  • 00:07:49
    garis itu kan rumus umumnya materi SMP
  • 00:07:52
    ya, y = mx + c. Nah, kita lihat di
  • 00:07:56
    persamaan garis y = mx + c itu ada dua
  • 00:07:59
    variabel kan, ada x dan juga ada
  • 00:08:02
    y. Kita bisa definisikan dua istilah di
  • 00:08:06
    sini. Yang pertama x. X itu kita sebut
  • 00:08:08
    sebagai variabel bebas atau nama lainnya
  • 00:08:11
    variabel independen. Artinya apa sih?
  • 00:08:14
    Artinya pada persamaan ini nanti x itu
  • 00:08:16
    adalah apa yang mau kita input ya. Itu
  • 00:08:18
    adalah apa yang mau kita input. Bebas,
  • 00:08:20
    terserah angkanya berapa. Nah, kemudian
  • 00:08:22
    kalau kita sudah nginput si X nanti kan
  • 00:08:25
    kita akan dapat hasil Y kan. Y itu kita
  • 00:08:27
    sebut sebagai output. Nah, si output
  • 00:08:29
    inilah yang kita sebut sebagai variabel
  • 00:08:31
    trik, variabel dependen. Kenapa
  • 00:08:34
    variabelnya trikat? Kenapa variabelnya
  • 00:08:36
    dependen? karena it depends on del nilai
  • 00:08:38
    x yang kamu input. Oke, jadi hati-hati
  • 00:08:41
    jangan sampai ketukar. Kalau kita lihat
  • 00:08:43
    keer plot yang ada di sebelah kiri ini
  • 00:08:45
    case-nya gimana nih
  • 00:08:47
    kira-kira? Yang jadi variabel bebasnya
  • 00:08:49
    tentu berdasarkan gambar itu bisa kita
  • 00:08:52
    pasang adalah yang average daily
  • 00:08:54
    temperaturnya. Kenapa? Karena target
  • 00:08:56
    kita di sini adalah kalau kita tahu suhu
  • 00:09:00
    rata-rata hariannya misalkan 92 derajat
  • 00:09:03
    Fahheit, maka nanti visitornya bakalan
  • 00:09:05
    berapa orang ya?
  • 00:09:06
    Jadi visitornya itu jadi variabel yang
  • 00:09:08
    terikat. It depends on average daily
  • 00:09:11
    temperature yang kita ajukan yang kita
  • 00:09:13
    input pada persamaan garis itu. Kayak
  • 00:09:15
    gitu
  • 00:09:15
    ya. Nah, ini untuk detailnya lagi.
  • 00:09:19
    Variabel bebas adalah variabel yang
  • 00:09:20
    diasumsikan mempengaruhi variabel
  • 00:09:22
    terikat pada analisis regresi pada
  • 00:09:26
    analisis persamaan garis terbaik.
  • 00:09:28
    Kemudian variabel terikat itu adalah
  • 00:09:30
    variabel yang dipredik, yang dijelaskan,
  • 00:09:33
    yang diprediksi atau dipengaruhi oleh si
  • 00:09:35
    variabel X, si variabel bebas dalam
  • 00:09:39
    analisis
  • 00:09:40
    regresi. Nah, ini ya. Ini berarti yang
  • 00:09:43
    bebasnya rata-rata suhu harian, yang
  • 00:09:46
    terikatnya itu adalah jumlah
  • 00:09:48
    pengunjung.
  • 00:09:51
    Oke. Nah, ini ya tadi ini Ibu buat lagi
  • 00:09:54
    di sini. X-nya rata-rata suhu udara
  • 00:09:57
    harian. y-nya itu adalah jumlah
  • 00:09:58
    pengunjung pantai. Oke. Nah, ini
  • 00:10:01
    maknanya. Jadi, nanti ketika kita sudah
  • 00:10:03
    tahu persamaan garis regresinya apa,
  • 00:10:05
    misalkan y = 15x + 25 gitu ya. Maka
  • 00:10:10
    dengan menggunakan persamaan garis y =
  • 00:10:12
    15x + 25 itu misalkan ya, misalkan itu
  • 00:10:15
    persamaan garisnya, kita akan mampu nih
  • 00:10:17
    memprediksi banyak visitors di hari itu
  • 00:10:20
    kalau suhu udara x-nya
  • 00:10:22
    diberikan dan pastinya dia akan
  • 00:10:24
    memberikan jumlahan kuadrat error yang
  • 00:10:26
    paling kecil ya. Kalau dia dibandingkan
  • 00:10:28
    dengan menggunakan persamaan garis yang
  • 00:10:30
    lain. Yang berikutnya adalah kita juga
  • 00:10:33
    bisa melihat besar partisipasi suhu
  • 00:10:35
    udara atau x dalam mempredik jumlah
  • 00:10:38
    pengunjung y dengan menggunakan
  • 00:10:40
    koefisien determinasi r^. Nah, untuk
  • 00:10:42
    formulanya ini nanti kamu bisa ingat
  • 00:10:44
    kembali di dua pertemuan sebelumnya kita
  • 00:10:46
    sudah bahas tentang koefisien korelasi.
  • 00:10:48
    Jadi, r = ssxy / √ ssx * √ ssyy. Ya,
  • 00:10:54
    nanti result-nya hasilnya dikuadratkan
  • 00:10:56
    aja. ya, it will tell you tentang ee
  • 00:11:00
    berapa persen sih partisipasinya si
  • 00:11:02
    variabel bebas terhadap variabel triket
  • 00:11:04
    dari si persamaan garis terbaik yang
  • 00:11:06
    kamu akan temukan di slide berikutnya
  • 00:11:09
    untuk
  • 00:11:10
    formulanya. Oke, kita baca dulu di sini
  • 00:11:13
    ada penjabaran informasi ya. Line of
  • 00:11:16
    bestfit adalah garis penduga terbaik
  • 00:11:19
    yang menduga si variabel dependen Y
  • 00:11:21
    ketika nilai variabel independen X-nya
  • 00:11:24
    diberikan. Dan tentu line of bestfit
  • 00:11:28
    memiliki jumlah kuadrat error yang
  • 00:11:29
    terkecil jika dibandingkan dengan semua
  • 00:11:31
    garis penduga lainnya yang mungkin
  • 00:11:33
    diklaim atau
  • 00:11:37
    dibuat. Bed ini sama aja dengan line of
  • 00:11:40
    speed ya. Jadi persamaan garis terbaik
  • 00:11:42
    itu disebut juga dengan garis
  • 00:11:45
    regresi. Persamaan garis itu kita pakai
  • 00:11:47
    Y topi ya atau Y duga sama aja. Y topi =
  • 00:11:51
    MX + C. Nah, karena Y topi adalah garis
  • 00:11:55
    pasti dia punya gradien kan, punya
  • 00:11:57
    kemiringan. Kemiringan dari si persamaan
  • 00:11:59
    garis terbaik ini itu ditunjukkan oleh
  • 00:12:01
    nilai M.
  • 00:12:03
    Nanti kalau misalkan kamu ketemu nilai
  • 00:12:05
    m-nya itu positif, artinya korelasinya
  • 00:12:08
    dari variabel x dan y itu pasti
  • 00:12:10
    korelasinya positif. Tapi kalau kamu
  • 00:12:12
    ketemunya gradiennya itu kurang dari 0,
  • 00:12:16
    berarti kan gradiennya negatif. Nih
  • 00:12:18
    artinya apa? Ketika kamu
  • 00:12:21
    memberikan pos 1 untuk nilai x, maka
  • 00:12:25
    nilai y-nya akan turun, akan negatif.
  • 00:12:27
    Jadi dia enggak saling dukung ya. Yang
  • 00:12:29
    satunya semakin besar, yang satunya
  • 00:12:31
    justru mengecil. makanya korelasinya
  • 00:12:33
    negatif ya. Sementara itu nanti nilai C
  • 00:12:35
    itu akan menunjukkan nilai dari y juga
  • 00:12:37
    ketika x-nya = 0. Atau dengan kata lain
  • 00:12:41
    ee si persamaan garis itu akan memiliki
  • 00:12:43
    titik potong sumbu y di 0, c. Jadi
  • 00:12:47
    misalkan kamu punya persamaan garis y =
  • 00:12:50
    15x + 25. Artinya apa? Gradiennya adalah
  • 00:12:54
    +15 ya. Artinya setiap kamu kasih satu
  • 00:12:58
    satuan
  • 00:12:59
    X, maka si Y-nya itu akan bergerak 25
  • 00:13:04
    satuan positif ke atas. Tapi kalau
  • 00:13:06
    misalkan dia itu ee sori 15 satuan
  • 00:13:10
    positif ke atas. Tapi kalau
  • 00:13:13
    misalkan negatif berarti dia akan turun
  • 00:13:15
    ke bawah kayak
  • 00:13:18
    gitu. Nah, ini adalah formula garis
  • 00:13:21
    regresi. Kamu bisa pause dulu videonya.
  • 00:13:24
    Jadi, tolong dicatat di sini ada tiga
  • 00:13:26
    kotak. Ini semuanya penting. Silakan
  • 00:13:28
    dicatat
  • 00:13:32
    dulu. Jadi kalau misalkan kamu mau cari
  • 00:13:35
    formula garis regresi atau formula dari
  • 00:13:37
    persamaan garis yang terbaik untuk
  • 00:13:39
    merepresentasikan suatu data variat,
  • 00:13:42
    yang kamu harus lakukan adalah kamu
  • 00:13:44
    tulis dulu rumus
  • 00:13:46
    umumnya atau y = fx + c. Kemarin kan
  • 00:13:50
    kita sudah nyari beberapa kan. Coba ini
  • 00:13:53
    Ibu keluar
  • 00:13:55
    dulu. Nah, ini kita yang kemarin nih ada
  • 00:13:58
    beberapa garis penduga. Misalkan y = 15x
  • 00:14:02
    + 30. Berarti m-nya berapa? M-nya 15.
  • 00:14:05
    Jadi, m itu adalah gradien. Nah, gradien
  • 00:14:09
    itu adalah koefisien dari variabel x
  • 00:14:11
    yang nempel di depannya x nih. Nah,
  • 00:14:13
    kalau garis penduga berarti m-nya
  • 00:14:14
    berapa? M-nya 25. Garis penduga 3, m-nya
  • 00:14:17
    berapa? M-nya 10. Nah, kemudian kan y =
  • 00:14:21
    mx + c
  • 00:14:26
    ya. Untuk c-nya itu adalah informasi
  • 00:14:29
    titik potong pada sumbu Y. Berarti garis
  • 00:14:31
    pendug 1 titik potong sumbu Y-nya
  • 00:14:32
    berapa? 0, C atau
  • 00:14:35
    0,30. Garis pendu 2 berarti di
  • 00:14:38
    0,-5. Garis pendug 3 di 0,50 dan
  • 00:14:41
    seterusnya. Nah, PR kita adalah kita mau
  • 00:14:43
    cari nih garis penduga terbaik.
  • 00:14:52
    Kira-kira dia itu formulanya apa
  • 00:14:56
    sih? Y = mx + c. Sedemikian sehingga dia
  • 00:15:01
    bisa mengalahkan ketiga garis penduga
  • 00:15:02
    ini dan mengalahkan semua garis penduga
  • 00:15:04
    yang mengklaim dirinya yang terbaik.
  • 00:15:06
    Oke, jadi PR kita adalah kita cari, kita
  • 00:15:09
    hitung nilai M yang memenuhi dan kita
  • 00:15:12
    cari juga nilai dari C. Terus kalau kamu
  • 00:15:16
    sudah dapat, tinggal masukin aja ke
  • 00:15:17
    persamaan ini. Sesimpel itu.
  • 00:15:21
    Oke. Nah, ini formulanya pastikan kamu
  • 00:15:24
    sudah mencatat ya. Nah, sekarang kita
  • 00:15:26
    akan melakukan
  • 00:15:28
    perhitungan. Oke, jadi untuk menghitung
  • 00:15:32
    ya nilai M dan nilai C ini Ibu tutup
  • 00:15:36
    dulu.
  • 00:15:44
    Tadi kita sudah sama-sama tahu kalau
  • 00:15:46
    rumus dari menghitung m itu adalah yang
  • 00:15:49
    ini.
  • 00:16:06
    [Musik]
  • 00:16:14
    [Musik]
  • 00:16:16
    Nah, ini untuk menghitung yang M berarti
  • 00:16:19
    Berarti kita cari dulu nih fsxy sama
  • 00:16:22
    fsx-nya berapa. Kita sudah belajar di
  • 00:16:24
    koefisien korelasi. Ini adalah rumus
  • 00:16:27
    dari ssxy dan juga ssxx-nya kan. Ini Bu
  • 00:16:31
    Nita copy dulu di sini ya. Jadi nanti
  • 00:16:33
    tinggal kita ikutin aja. Kamu boleh
  • 00:16:35
    mengerjakan ini dengan menggunakan
  • 00:16:39
    kalkulator meskipun nanti ketika ulangan
  • 00:16:41
    kita enggak pakai kalkulator ya. Nah,
  • 00:16:43
    karena nanti ulangan soalnya juga
  • 00:16:45
    angka-angkanya yang
  • 00:16:47
    enggak susah-susah banget ya, yang harus
  • 00:16:50
    pakai kalkulator enggak. Oke, kita lihat
  • 00:16:53
    berarti kita di sini untuk nyari SSXY
  • 00:16:55
    sama SSX perlu apa aja nih? Perlu N.
  • 00:16:58
    Nah, kita data ya. N itu apa sih?
  • 00:17:02
    Banyaknya datum kan? Banyaknya isian
  • 00:17:03
    dari data bivariat. Ini ada berapa
  • 00:17:05
    siswa? Ada 6. Berarti n-nya 6.
  • 00:17:09
    Kemudian kita perlu jumlahan dari x,
  • 00:17:13
    jumlahan dari y, jumlahan dari xy
  • 00:17:15
    jumlahan dari x^ berarti kita bikin aja
  • 00:17:17
    di sini kita buat kita perlu
  • 00:17:21
    x² terus kita perlu apa lagi nih? kita
  • 00:17:25
    perlu
  • 00:17:26
    XY. Oke.
  • 00:17:38
    Ini kita kuadratin aja ya. 3
  • 00:17:39
    dikuadratkan berapa? 9. 3 dikuadratkan
  • 00:17:42
    9. 4 dikuadratkan 16. 1 dikuadratkan 1.
  • 00:17:46
    2 jadi 4 5 jadi 25. Oke. Kalau sudahudah
  • 00:17:50
    nanti kita lakukan penjumlahan. Kamu
  • 00:17:52
    boleh pakai kalkulator, tapi hitung
  • 00:17:54
    manual juga lebih baik. Ini diam dapat
  • 00:17:57
    64. Nah, kemudian kita perlu cari juga
  • 00:18:00
    ya jumlahan x ini diam
  • 00:18:06
    aja. Kemudian ini juga di su untuk yang
  • 00:18:09
    jumlahan Y. Kemudian untuk jumlahan yang
  • 00:18:12
    x-nya ini di
  • 00:18:13
    juga. Oh sori kita hitung dulu ya.
  • 00:18:17
    Berarti yang ini 3 * 70 210 3 * 100 itu
  • 00:18:20
    300 dan seterusnya.
  • 00:18:28
    Kalau udah kita
  • 00:18:33
    suah sekarang kita sudah dapat nih
  • 00:18:35
    info-infonya. Ini ibu tulis di sini dulu
  • 00:18:38
    ya.
  • 00:18:52
    Di sini enggak ada
  • 00:18:54
    jumlahannya. Untuk mempermudah Ibu
  • 00:18:56
    nulisnya gini aja ya. Jumlahan dari X
  • 00:18:59
    itu berapa? Terus jumlahan
  • 00:19:02
    sori jumlahan
  • 00:19:05
    dari Y. Kemudian jumlahan
  • 00:19:09
    dari ee
  • 00:19:15
    x². Kemudian ada jumlahan dari XY.
  • 00:19:23
    Oke. Nah, ini sama dengan berapa
  • 00:19:28
    ya? Kita lihat di sini jumlahan x itu
  • 00:19:31
    dia ada di 18. Jumlahan y itu ada di
  • 00:19:34
    420. itu jumlahan x^ itu ada di
  • 00:19:38
    64. Kemudian jumlahan dari xy itu ada di
  • 00:19:42
    1410. Nah, kalau udah kamu hitung untuk
  • 00:19:45
    m ee sori hitung ss xy-nya dulu ya. SS
  • 00:19:58
    XY. Oke, rumusnya apa?
  • 00:20:02
    Berarti N itu kan 6 ya, 6 itu dikalikan
  • 00:20:07
    dengan jumlahan dari XY. Jumlahan dari
  • 00:20:09
    XY itu 14 10. Oke. Kalau sudah dikurangi
  • 00:20:13
    sama jumlahan dari X kali jumlahan dari
  • 00:20:16
    Y. Jumlahan dari X tadi 18. Kemudian
  • 00:20:19
    dikalikan dengan jumlahan dari Y itu
  • 00:20:23
    420. Oke, jadi jawabannya adalah 900.
  • 00:20:27
    ini ssx ya kita kamu bisa pakai
  • 00:20:29
    kalkulator. Nah, kemudian kita nyari
  • 00:20:31
    untuk
  • 00:20:32
    SSX ya ini sama dengan kan berarti sama
  • 00:20:36
    dengan banyaknya datum itu ada 6
  • 00:20:40
    dikalikan dengan jumlahan dari x^ itu
  • 00:20:43
    adalah
  • 00:20:45
    64. Ee ini dikasih kali 64 ditambahkan
  • 00:20:50
    dengan jumlahan x dikali jumlahan x.
  • 00:20:52
    Jumlahan x itu 18. Kemudian dikalikan
  • 00:20:55
    dengan 18 lagi. Oke, di-enter dapat
  • 00:20:59
    708. Oh, ini dikurang ya. Oh, jadi
  • 00:21:01
    ditambah sih dikurang. Nah, dapat 60.
  • 00:21:04
    Oke. Nah, maka kita bisa menghitung nih
  • 00:21:07
    nilai M-nya berapa. Nilai M-nya itu
  • 00:21:09
    adalah tadi apa? SS XY / SSX.
  • 00:21:14
    Berarti itu sama dengan 900 / 60 kan di
  • 00:21:18
    antar dapat M-nya 15.
  • 00:21:21
    Oke, berarti kita tahu kalau ini nanti
  • 00:21:24
    garis penduga terbaik M-nya itu adalah
  • 00:21:26
    15. Oke, sudah beres nih buat nyari
  • 00:21:30
    M. Kita
  • 00:21:32
    bisa taruh geser dulu ke sini. Cari
  • 00:21:35
    nilai M. Sudah beres. Kita hapus.
  • 00:21:37
    Sekarang kita cari nilai C. Nah, gimana
  • 00:21:39
    cara nyari nilai
  • 00:21:41
    C? Kita lihat ke sini. Cara nyari nilai
  • 00:21:44
    C itu
  • 00:21:46
    adalah rata-rata dari Y dikurangin sama
  • 00:21:49
    rata-rata dari m dikali rata-ratanya
  • 00:21:52
    [Musik]
  • 00:21:56
    X. Oke, that's what we gonna do. Jadi
  • 00:21:59
    kita cari dulu rata-rata Y itu berapa
  • 00:22:01
    sih? Nah, kita tulis
  • 00:22:04
    rata-rata Y. Rumus rata-rata itu
  • 00:22:08
    apa? Jumlah nilai Y berapa? 7 y 420 kan
  • 00:22:13
    dibagi banyaknya data. Data kita ada 6.
  • 00:22:17
    Nah, ini sudah dapat. Next. Rata-rata
  • 00:22:21
    x. Rumus rata-rata apa? Banyaknya
  • 00:22:26
    berapa? 18 dibagi banyaknya data kamu
  • 00:22:28
    ada 6 3 kan? Oke. Jadi tinggal dimasukin
  • 00:22:32
    aja ke sini. Maka nilai
  • 00:22:35
    C itu sama dengan rata-ratanya Y.
  • 00:22:39
    Rata-rata Y berapa tadi?
  • 00:22:43
    70 itu dikurangin sama nilai m kamu tadi
  • 00:22:46
    15 itu dikaliin sama rata-ratanya si x
  • 00:22:51
    3. Oke, hasilnya
  • 00:22:55
    25. Maka kita bisa ganti nih C-nya itu
  • 00:22:58
    adalah 25. Oke, sehingga kita bisa
  • 00:23:01
    simpulkan bahwa garis terbaik untuk
  • 00:23:05
    menduga dengan jaminan bahwa jumlahan
  • 00:23:08
    kuadrat errornya adalah yang paling
  • 00:23:09
    kecil dari semua garis penduga itu
  • 00:23:11
    dipenuhi oleh persamaan garis y = 15x +
  • 00:23:16
    25. Seperti itu ya. Nah, untuk
  • 00:23:19
    membuktikannya kamu bisa pakai bantuan
  • 00:23:21
    Desmos atau bisa juga menggunakan
  • 00:23:23
    bantuan dari Microsoft Excel. Jadi
  • 00:23:26
    caranya gini, ini kamu
  • 00:23:27
    bisa blok semua data bivariat kamu.
  • 00:23:31
    Terus kamu klik insert, pilih scatter
  • 00:23:34
    plot.
  • 00:23:36
    This one skatter yang pertama aja, maka
  • 00:23:39
    dia akan kasih skatter plot kamu.
  • 00:23:42
    Nih, inilah visualisasi dari data kamu.
  • 00:23:49
    Oke, hebatnya dia bisa
  • 00:23:53
    ngebaca garis regresi atau line of best
  • 00:23:55
    fit kamu. Persamaannya apa. Caranya
  • 00:23:58
    adalah kamu klik aja salah satu dari
  • 00:24:01
    titik data ini. Terus kamu klik kanan,
  • 00:24:04
    pilih
  • 00:24:06
    trendline. Terus di sini ada display air
  • 00:24:09
    squed value on chart. Itu dia ngasih
  • 00:24:11
    tahu koefisien determinasi. Nah, ini
  • 00:24:14
    koefisien determinasinya di
  • 00:24:15
    0,5625. Kemudian display equation on
  • 00:24:18
    chart dia akan kasih line of best fit.
  • 00:24:21
    Dan ini dia jawabannya sama y = 15x + 25
  • 00:24:26
    kayak gitu ya. Oke. Jadi
  • 00:24:30
    ketika kamu kemarin sudah menghitung
  • 00:24:33
    jumlahan kuadrat error dari tiga buah
  • 00:24:35
    garis yang mengklaim dirinya paling
  • 00:24:37
    baik, ternyata ada yang lebih baik,
  • 00:24:39
    yaitu si y = 15x + 25. seperti
  • 00:24:44
    itu. Dan kalau misalkan kamu mau coba
  • 00:24:47
    untuk menghitung jumlahan kuadrat
  • 00:24:49
    errornya, kamu akan temukan bahwa untuk
  • 00:24:53
    regresi linear ini dia memberikan
  • 00:24:55
    jumlahan kuadrat error sebesar
  • 00:24:58
    1750 dan bisa dijamin tidak akan ada
  • 00:25:01
    garis penduga lain yang mampu memberikan
  • 00:25:04
    jumlahan kuadrat error kurang dari angka
  • 00:25:07
    milik si y = 15x + 25. Mungkin cukup
  • 00:25:11
    sekian untuk materi hari ini. Untuk
  • 00:25:13
    tugas akan Ibu berikan via WhatsApp.
  • 00:25:15
    Terima kasih. Selamat pagi, selamat
  • 00:25:17
    siang untuk F3, F4, dan F5.
Tags
  • data bivariat
  • garis regresi
  • scatter plot
  • variabel bebas
  • variabel terikat
  • jumlah kuadrat error
  • koefisien determinasi
  • persamaan garis
  • analisis regresi
  • line of best fit