Pengantar Sains Data 01 - Pendahuluan Sains Data & Big Data

00:09:13
https://www.youtube.com/watch?v=ybxwS6rTSU8

Summary

TLDRKuliah ini menjelaskan bahwa saat ini kita berada di era industri 4.0, yang merupakan perkembangan besar dalam teknologi seperti big data, data science, serta inovasi digital. Revolusi industri dimulai dari mesin uap hingga teknologi robot dan komputer saat ini. Big Data menjadi bahan baku yang penting, dengan tiga atribut utama: volume, velocity, dan verity. Data Science dianggap sebagai perluasan statistik untuk menghadapi tantangan data yang semakin beragam dan tidak terstruktur. Kuliah ini menekankan pentingnya pemahaman tentang hubungan antara industri 4.0, Big Data, dan Data Science, serta perbedaan antara Data Science dan bidang lain seperti Data Mining.

Takeaways

  • 📊 Era industri 4.0 ditandai oleh kemajuan teknologi.
  • 🔍 Big Data memiliki tiga atribut: volume, velocity, dan verity.
  • 📈 Data Science merupakan perluasan dari bidang statistik.
  • 🤖 Kecerdasan buatan dan IoT adalah komponen penting industry 4.0.
  • 📉 Data mining berbeda dari data science dalam pendekatan analisisnya.
  • 💼 Bisnis intelijen menggunakan data untuk visualisasi dan pengambilan keputusan.

Timeline

  • 00:00:00 - 00:09:13

    Kuliah pertama mengenai pengantar sains data oleh Prodi Statistika FMIPA Universitas Indonesia memperkenalkan konsep revolusi industri 4.0. Revolusi ini dimulai di abad ke-18 dengan penemuan mesin uap dan berkembang dengan penemuan listrik dan jalur perakitan. Era industri 4.0 ditandai oleh adanya big data, kecerdasan buatan, dan teknologi blockchain yang semuanya berhubungan dengan pengolahan data menjadi solusi. Dalam konteks ini, penting bagi mahasiswa untuk memahami bagaimana big data berasal dari berbagai sumber, termasuk data karyawan dan pelanggan, serta data dari media sosial. Big data memiliki tiga karakteristik utama: volume, velocity, dan variety.

Mind Map

Video Q&A

  • Apa itu industri 4.0?

    Industri 4.0 adalah era teknologi yang ditandai dengan penggunaan big data, kecerdasan buatan, dan inovasi digital.

  • Mengapa Big Data penting?

    Big Data penting karena dapat mengolah data dalam volume besar dan real-time untuk menghasilkan solusi.

  • Apa hubungan antara Data Science dan Big Data?

    Data Science adalah disiplin yang mengolah dan menganalisis Big Data untuk mendapatkan informasi dan pola.

  • Apa perbedaan antara Data Science dan Data Mining?

    Data Science mencakup analisis data tidak terstruktur, sementara Data Mining lebih fokus pada penemuan informasi dari data terstruktur.

  • Apa saja komponen yang muncul di era industri 4.0?

    Komponen yang muncul termasuk Big Data, Internet of Things (IoT), smart cities, kecerdasan buatan, dan blockchain.

View more video summaries

Get instant access to free YouTube video summaries powered by AI!
Subtitles
id
Auto Scroll:
  • 00:00:00
    Ayo kita sering mendengar Bahwa saat ini
  • 00:00:14
    adalah era industri 40 tapi apa
  • 00:00:18
    maksudnya Ya lalu Apa kaitannya antara
  • 00:00:20
    big data dan data science Apakah ini
  • 00:00:24
    penting bagi mahasiswa untuk meraih
  • 00:00:26
    sukses di masa depan Mari kita bahas
  • 00:00:29
    lebih mendetail di kuliah pertama
  • 00:00:31
    pengantar sains dana oleh Prodi
  • 00:00:34
    statistika fmipa Universitas Indonesia
  • 00:00:38
    ada suatu tahapannya disebut sebagai
  • 00:00:41
    tahapan revolusi industri yang dimulai
  • 00:00:44
    pertama di sekitar abad 18 dengan
  • 00:00:48
    ditemukannya mesin uap dan juga mesin
  • 00:00:50
    tenun mechanical lalu sekitar 100 tahun
  • 00:00:54
    kemudian listrik ditemukan dan juga
  • 00:00:58
    assembly LINE nah
  • 00:01:00
    Hai mulai masuk Manufacturing
  • 00:01:01
    Manufacturing mulai tumbuh di sekitar
  • 00:01:06
    tahun 1870 pada revolusi industri kedua
  • 00:01:10
    Nah kita 100 tahun kemudian lagi barulah
  • 00:01:15
    kemudian Pak padat masuk pada tahap
  • 00:01:17
    ketiga dari revolusi industri yaitu
  • 00:01:20
    ketika robot elektronik dan komputer
  • 00:01:23
    serta jaringan komputer digunakan kalau
  • 00:01:26
    kita lihat ada beberapa komponen yang
  • 00:01:29
    kemudian muncul di industri 40 ada
  • 00:01:32
    big-data disana ada ada yang namanya
  • 00:01:35
    ayoti smart city Lalu ada kecerdasan
  • 00:01:39
    buatan dan ada blockchain kalau semua
  • 00:01:42
    komponen ini juga ada sebenarnya ada
  • 00:01:45
    hal-hal lain lagi ofmeet reality atau
  • 00:01:48
    ide printing dan lain sebagainya benang
  • 00:01:50
    merah dari komponen-komponen yang muncul
  • 00:01:53
    di industri 40 ini tidak lain tidak
  • 00:01:55
    bukan adalah datang makanya kemudian
  • 00:01:58
    industri 4
  • 00:02:00
    yang sering disebut juga sebagai eradata
  • 00:02:02
    itu nah perusahaan yang tumbuh dan
  • 00:02:05
    berkembang di era data
  • 00:02:06
    perusahaan-perusahaan digital tadi maka
  • 00:02:09
    dia juga butuh bahan baku nah bahan
  • 00:02:11
    bakunya apa Nah bahan bakunya karena dia
  • 00:02:13
    tadi sudah sama-sama kita bahas dia
  • 00:02:15
    sebenernya cuma mengolah data menjadi
  • 00:02:17
    suatu solusi maka dia butuh sumber bahan
  • 00:02:21
    bakunya adalah daftar sebelum zaman
  • 00:02:23
    industri 40 data ini biasanya Berasal
  • 00:02:26
    dari mana sih kalau perusahaan datanya
  • 00:02:29
    bisa jadi data karyawan data konsumennya
  • 00:02:32
    data transaksi bisnisnya kalau misalnya
  • 00:02:35
    di institusi pendidikan mungkin adalah
  • 00:02:38
    data pengajarnya data karyawannya data
  • 00:02:41
    siswa atau mahasiswa nya dan lain
  • 00:02:43
    sebagainya serta ini biasanya diinput
  • 00:02:45
    oleh bagian administrasi kemudian
  • 00:02:48
    disimpan dalam bentuk tabel-tabel Nah
  • 00:02:51
    kemudian ada tambahan-tambahan Sumber
  • 00:02:54
    data tambahan sumber Datanya ada yang
  • 00:02:56
    berasal dari media sosial ada yang
  • 00:02:59
    berasal dari
  • 00:03:00
    Club Sensor dari mobilephone dari
  • 00:03:03
    internet dan lain sebagainya Nah
  • 00:03:05
    sekarang barulah kita siap untuk
  • 00:03:07
    mendefinisikan apa sih sebenarnya big
  • 00:03:09
    data GTA ada sebuah kesepakatan dari
  • 00:03:12
    definisi-definisi yang ada bahwa big
  • 00:03:15
    data itu berkenaan dengan tiga sifat
  • 00:03:20
    dasar titik yaitu Volume atau ukuran
  • 00:03:24
    data yang besar lalu velocity yaitu
  • 00:03:28
    datanya terus bertambah besar atau
  • 00:03:31
    disebut sebagai streaming data terkadang
  • 00:03:33
    atau ada juga yang menyebut sebagai
  • 00:03:34
    online jadi datanya tidak statis tapi
  • 00:03:38
    terus bertambah besar dan ketiga adalah
  • 00:03:41
    verity yang tadi 3v ini diprakarsai oleh
  • 00:03:46
    odop Lini tadi di 2011 baik kita
  • 00:03:50
    lanjutkan secara umum sebenarnya
  • 00:03:52
    definisi data science itu ada banyak
  • 00:03:54
    ketika kita kemudian menurut berusaha
  • 00:03:57
    melakukan studi pustaka the literature
  • 00:04:00
    definisi-definisi data science dan ini
  • 00:04:02
    sebenarnya juga tidak perlu di
  • 00:04:03
    perdebatkan apa itu dapat sains Tapi
  • 00:04:06
    tentu saja kita harus memiliki suatu
  • 00:04:09
    referensi yang jelas dalam
  • 00:04:11
    mendefinisikan sesuatu Tentu saja tidak
  • 00:04:13
    berdasarkan opini belakang atau pendapat
  • 00:04:17
    eh kalaupun pendapat boleh tapi pendapat
  • 00:04:20
    seorang ahli bukan dan ahli dibidangnya
  • 00:04:22
    bukan pendapat ahli dari bidang lain
  • 00:04:24
    misalkan nah salah satu referensi yang
  • 00:04:27
    saya suka dalam mendefinisikan data
  • 00:04:30
    science yaitu adalah definisi yang
  • 00:04:34
    diberikan di referensi dibawah ini saya
  • 00:04:38
    sedikit modifikasi definisinya untuk
  • 00:04:40
    memperjelas silahkan anda membaca Factor
  • 00:04:44
    ini untuk melihat definisinya Kita juga
  • 00:04:47
    bisa sebenarnya membaca referensi dari
  • 00:04:50
    Cleveland widyan Kristen seseorang yang
  • 00:04:52
    memang pertama kali mengutarakan istilah
  • 00:04:56
    datapine jadi beliau lebih berhak untuk
  • 00:04:58
    mengatakan
  • 00:05:00
    data science itu apaan kita udah bahas
  • 00:05:02
    tadi rasain sebenarnya adalah perluasan
  • 00:05:04
    dari statistik perluasan kemana Kalau
  • 00:05:08
    sesuai dengan pembahasan tadi sebenarnya
  • 00:05:10
    adalah perluasan ke data tidak
  • 00:05:12
    terstruktur atau karena masalah velocity
  • 00:05:15
    detik realtime analitik kalau kita ke
  • 00:05:18
    masalah ke folium nanti ada masalah
  • 00:05:20
    distributing data disebut it computing
  • 00:05:22
    jadi sampai saat ini kita sudah bisa nih
  • 00:05:25
    berusaha untuk kemudian membedakan
  • 00:05:27
    antara bidang-bidang ilmu tersebut Jadi
  • 00:05:30
    kalau statistik biasanya ya statistik
  • 00:05:32
    biasanya dia hipotesisnya sudah jelas
  • 00:05:35
    dari awal misalnya memprediksi harga
  • 00:05:38
    rumah berdasarkan misalkan luas tanah
  • 00:05:42
    banyaknya kamar dan lain sebagainya dan
  • 00:05:45
    datanya biasanya dari satu atau beberapa
  • 00:05:47
    tabel jadi tapi satu datasheetnya tapi
  • 00:05:50
    dataset tuh bisa terdiri dari beberapa
  • 00:05:52
    tabel Nah kalau data maining kalau data
  • 00:05:55
    maining itu misalkan ada seorang atasan
  • 00:05:59
    di sebuah
  • 00:06:00
    kan misalnya mendatangi pegawainya nih
  • 00:06:03
    Saya punya data ah tiga bulan kebelakang
  • 00:06:07
    dari dari perusahaan tersebut penjualan
  • 00:06:10
    data pegawai dan lain sebagainya lalu
  • 00:06:12
    dia memerintahkan pegawainya untuk cari
  • 00:06:15
    informasi sebanyak-banyaknya dari data
  • 00:06:17
    tersebut jadi hipotesisnya tidak ada
  • 00:06:19
    dari awal hipotesisnya justru oleh sang
  • 00:06:22
    pegawai cari dulu beberapa hipotesis
  • 00:06:25
    lalu masih masih hipotesisnya dicek
  • 00:06:28
    dengan beberapa model Nah itu adalah
  • 00:06:30
    data maining jadi dia di awal tidak
  • 00:06:31
    hipotesisnya dan dia melakukan proses
  • 00:06:34
    mining mencari informasi biasanya tidak
  • 00:06:37
    selalu biasanya data terstruktur dan
  • 00:06:40
    yang membedakan dengan data science
  • 00:06:42
    nanti dengan data mining adalah data
  • 00:06:45
    mining biasanya metode-metode dan
  • 00:06:47
    algoritmanya dipakai sejak jadi
  • 00:06:49
    argoritma dan metode adalah tools didata
  • 00:06:52
    mainin beda nanti didata science gimana
  • 00:06:54
    kita bisa memodifikasi algoritma maupun
  • 00:06:57
    metodenya nah eh
  • 00:07:00
    kita di sudah jelas kita sudah bahas
  • 00:07:01
    panjang lebar intinya adalah dia
  • 00:07:03
    berusaha untuk meniru rekan buatan
  • 00:07:07
    manusia nah machine-learning itu tadi
  • 00:07:09
    juga sudah kita bahas adalah bagian dari
  • 00:07:12
    eh jadi contohnya misalnya pada mobile
  • 00:07:16
    phone kita pengenalan sidik jari itu
  • 00:07:18
    machine-learning kenalan muka itu masih
  • 00:07:20
    learning tapi ketika misalnya dipadukan
  • 00:07:23
    jadi satu untuk sebuah sistem misalnya
  • 00:07:26
    kalian membuat sebuah robot sederhana
  • 00:07:28
    yang bisa mengenali wajah dan juga
  • 00:07:30
    berkomunikasi maka jatuhnya earna
  • 00:07:34
    beberapa machine-learning dipadukan
  • 00:07:36
    membuat sebuah sistem kita ya Nah terus
  • 00:07:40
    ada juga bisnis intelijen bisnis
  • 00:07:43
    intelijen biasanya visualisasinya
  • 00:07:45
    berbentuk dashboard nah ini sebenarnya
  • 00:07:47
    adalah ketika deskriptif atau agregat
  • 00:07:50
    sampai installnya Pren Lalu ada KPI akif
  • 00:07:55
    Eki performance Indicator untuk kemudian
  • 00:07:57
    melihat pakpol
  • 00:08:00
    dari suatu institusi di suatu
  • 00:08:02
    permasalahan tertentu gitu ya dia
  • 00:08:04
    biasanya hipotesisnya sudah ada lalu
  • 00:08:07
    mengukur apa yang sudah ditetapkan
  • 00:08:09
    sebelumnya dan ini biasanya jarang
  • 00:08:12
    sekali menggunakan model
  • 00:08:14
    machine-learning atau statistik yang
  • 00:08:16
    Advance kalau dia menggunakan model
  • 00:08:18
    statistik atau mesin minyak fast
  • 00:08:20
    biasanya nyebutnya sebagai bisnis
  • 00:08:22
    analitik ada lagi six Sigma dan tqm di
  • 00:08:26
    quality control Lalu ada one di Finance
  • 00:08:32
    j&t Harap mudah-mudahan sampai sini jadi
  • 00:08:36
    jelas ya perbedaan antara data science
  • 00:08:38
    dengan bidang-bidang ilmu lainnya dari
  • 00:08:41
    penjelasan tadi diharapkan kemudian kita
  • 00:08:44
    sudah dapat memahami apa kaitan antara
  • 00:08:47
    industri 40 atau eradata dengan big data
  • 00:08:50
    dan data science pada pertemuan
  • 00:08:52
    berikutnya kita akan membicarakan
  • 00:08:54
    langsung ke data tipe-tipe data dan
  • 00:08:57
    format data serta model-model didata SAW
  • 00:09:00
    Hai Sampai berjumpa di kuliah
  • 00:09:02
    selanjutnya
Tags
  • industri 4.0
  • big data
  • data science
  • teknologi
  • statistik
  • data mining
  • kecerdasan buatan
  • smart cities
  • machine learning
  • bisnis intelijen