00:00:00
Ayo kita sering mendengar Bahwa saat ini
00:00:14
adalah era industri 40 tapi apa
00:00:18
maksudnya Ya lalu Apa kaitannya antara
00:00:20
big data dan data science Apakah ini
00:00:24
penting bagi mahasiswa untuk meraih
00:00:26
sukses di masa depan Mari kita bahas
00:00:29
lebih mendetail di kuliah pertama
00:00:31
pengantar sains dana oleh Prodi
00:00:34
statistika fmipa Universitas Indonesia
00:00:38
ada suatu tahapannya disebut sebagai
00:00:41
tahapan revolusi industri yang dimulai
00:00:44
pertama di sekitar abad 18 dengan
00:00:48
ditemukannya mesin uap dan juga mesin
00:00:50
tenun mechanical lalu sekitar 100 tahun
00:00:54
kemudian listrik ditemukan dan juga
00:00:58
assembly LINE nah
00:01:00
Hai mulai masuk Manufacturing
00:01:01
Manufacturing mulai tumbuh di sekitar
00:01:06
tahun 1870 pada revolusi industri kedua
00:01:10
Nah kita 100 tahun kemudian lagi barulah
00:01:15
kemudian Pak padat masuk pada tahap
00:01:17
ketiga dari revolusi industri yaitu
00:01:20
ketika robot elektronik dan komputer
00:01:23
serta jaringan komputer digunakan kalau
00:01:26
kita lihat ada beberapa komponen yang
00:01:29
kemudian muncul di industri 40 ada
00:01:32
big-data disana ada ada yang namanya
00:01:35
ayoti smart city Lalu ada kecerdasan
00:01:39
buatan dan ada blockchain kalau semua
00:01:42
komponen ini juga ada sebenarnya ada
00:01:45
hal-hal lain lagi ofmeet reality atau
00:01:48
ide printing dan lain sebagainya benang
00:01:50
merah dari komponen-komponen yang muncul
00:01:53
di industri 40 ini tidak lain tidak
00:01:55
bukan adalah datang makanya kemudian
00:01:58
industri 4
00:02:00
yang sering disebut juga sebagai eradata
00:02:02
itu nah perusahaan yang tumbuh dan
00:02:05
berkembang di era data
00:02:06
perusahaan-perusahaan digital tadi maka
00:02:09
dia juga butuh bahan baku nah bahan
00:02:11
bakunya apa Nah bahan bakunya karena dia
00:02:13
tadi sudah sama-sama kita bahas dia
00:02:15
sebenernya cuma mengolah data menjadi
00:02:17
suatu solusi maka dia butuh sumber bahan
00:02:21
bakunya adalah daftar sebelum zaman
00:02:23
industri 40 data ini biasanya Berasal
00:02:26
dari mana sih kalau perusahaan datanya
00:02:29
bisa jadi data karyawan data konsumennya
00:02:32
data transaksi bisnisnya kalau misalnya
00:02:35
di institusi pendidikan mungkin adalah
00:02:38
data pengajarnya data karyawannya data
00:02:41
siswa atau mahasiswa nya dan lain
00:02:43
sebagainya serta ini biasanya diinput
00:02:45
oleh bagian administrasi kemudian
00:02:48
disimpan dalam bentuk tabel-tabel Nah
00:02:51
kemudian ada tambahan-tambahan Sumber
00:02:54
data tambahan sumber Datanya ada yang
00:02:56
berasal dari media sosial ada yang
00:02:59
berasal dari
00:03:00
Club Sensor dari mobilephone dari
00:03:03
internet dan lain sebagainya Nah
00:03:05
sekarang barulah kita siap untuk
00:03:07
mendefinisikan apa sih sebenarnya big
00:03:09
data GTA ada sebuah kesepakatan dari
00:03:12
definisi-definisi yang ada bahwa big
00:03:15
data itu berkenaan dengan tiga sifat
00:03:20
dasar titik yaitu Volume atau ukuran
00:03:24
data yang besar lalu velocity yaitu
00:03:28
datanya terus bertambah besar atau
00:03:31
disebut sebagai streaming data terkadang
00:03:33
atau ada juga yang menyebut sebagai
00:03:34
online jadi datanya tidak statis tapi
00:03:38
terus bertambah besar dan ketiga adalah
00:03:41
verity yang tadi 3v ini diprakarsai oleh
00:03:46
odop Lini tadi di 2011 baik kita
00:03:50
lanjutkan secara umum sebenarnya
00:03:52
definisi data science itu ada banyak
00:03:54
ketika kita kemudian menurut berusaha
00:03:57
melakukan studi pustaka the literature
00:04:00
definisi-definisi data science dan ini
00:04:02
sebenarnya juga tidak perlu di
00:04:03
perdebatkan apa itu dapat sains Tapi
00:04:06
tentu saja kita harus memiliki suatu
00:04:09
referensi yang jelas dalam
00:04:11
mendefinisikan sesuatu Tentu saja tidak
00:04:13
berdasarkan opini belakang atau pendapat
00:04:17
eh kalaupun pendapat boleh tapi pendapat
00:04:20
seorang ahli bukan dan ahli dibidangnya
00:04:22
bukan pendapat ahli dari bidang lain
00:04:24
misalkan nah salah satu referensi yang
00:04:27
saya suka dalam mendefinisikan data
00:04:30
science yaitu adalah definisi yang
00:04:34
diberikan di referensi dibawah ini saya
00:04:38
sedikit modifikasi definisinya untuk
00:04:40
memperjelas silahkan anda membaca Factor
00:04:44
ini untuk melihat definisinya Kita juga
00:04:47
bisa sebenarnya membaca referensi dari
00:04:50
Cleveland widyan Kristen seseorang yang
00:04:52
memang pertama kali mengutarakan istilah
00:04:56
datapine jadi beliau lebih berhak untuk
00:04:58
mengatakan
00:05:00
data science itu apaan kita udah bahas
00:05:02
tadi rasain sebenarnya adalah perluasan
00:05:04
dari statistik perluasan kemana Kalau
00:05:08
sesuai dengan pembahasan tadi sebenarnya
00:05:10
adalah perluasan ke data tidak
00:05:12
terstruktur atau karena masalah velocity
00:05:15
detik realtime analitik kalau kita ke
00:05:18
masalah ke folium nanti ada masalah
00:05:20
distributing data disebut it computing
00:05:22
jadi sampai saat ini kita sudah bisa nih
00:05:25
berusaha untuk kemudian membedakan
00:05:27
antara bidang-bidang ilmu tersebut Jadi
00:05:30
kalau statistik biasanya ya statistik
00:05:32
biasanya dia hipotesisnya sudah jelas
00:05:35
dari awal misalnya memprediksi harga
00:05:38
rumah berdasarkan misalkan luas tanah
00:05:42
banyaknya kamar dan lain sebagainya dan
00:05:45
datanya biasanya dari satu atau beberapa
00:05:47
tabel jadi tapi satu datasheetnya tapi
00:05:50
dataset tuh bisa terdiri dari beberapa
00:05:52
tabel Nah kalau data maining kalau data
00:05:55
maining itu misalkan ada seorang atasan
00:05:59
di sebuah
00:06:00
kan misalnya mendatangi pegawainya nih
00:06:03
Saya punya data ah tiga bulan kebelakang
00:06:07
dari dari perusahaan tersebut penjualan
00:06:10
data pegawai dan lain sebagainya lalu
00:06:12
dia memerintahkan pegawainya untuk cari
00:06:15
informasi sebanyak-banyaknya dari data
00:06:17
tersebut jadi hipotesisnya tidak ada
00:06:19
dari awal hipotesisnya justru oleh sang
00:06:22
pegawai cari dulu beberapa hipotesis
00:06:25
lalu masih masih hipotesisnya dicek
00:06:28
dengan beberapa model Nah itu adalah
00:06:30
data maining jadi dia di awal tidak
00:06:31
hipotesisnya dan dia melakukan proses
00:06:34
mining mencari informasi biasanya tidak
00:06:37
selalu biasanya data terstruktur dan
00:06:40
yang membedakan dengan data science
00:06:42
nanti dengan data mining adalah data
00:06:45
mining biasanya metode-metode dan
00:06:47
algoritmanya dipakai sejak jadi
00:06:49
argoritma dan metode adalah tools didata
00:06:52
mainin beda nanti didata science gimana
00:06:54
kita bisa memodifikasi algoritma maupun
00:06:57
metodenya nah eh
00:07:00
kita di sudah jelas kita sudah bahas
00:07:01
panjang lebar intinya adalah dia
00:07:03
berusaha untuk meniru rekan buatan
00:07:07
manusia nah machine-learning itu tadi
00:07:09
juga sudah kita bahas adalah bagian dari
00:07:12
eh jadi contohnya misalnya pada mobile
00:07:16
phone kita pengenalan sidik jari itu
00:07:18
machine-learning kenalan muka itu masih
00:07:20
learning tapi ketika misalnya dipadukan
00:07:23
jadi satu untuk sebuah sistem misalnya
00:07:26
kalian membuat sebuah robot sederhana
00:07:28
yang bisa mengenali wajah dan juga
00:07:30
berkomunikasi maka jatuhnya earna
00:07:34
beberapa machine-learning dipadukan
00:07:36
membuat sebuah sistem kita ya Nah terus
00:07:40
ada juga bisnis intelijen bisnis
00:07:43
intelijen biasanya visualisasinya
00:07:45
berbentuk dashboard nah ini sebenarnya
00:07:47
adalah ketika deskriptif atau agregat
00:07:50
sampai installnya Pren Lalu ada KPI akif
00:07:55
Eki performance Indicator untuk kemudian
00:07:57
melihat pakpol
00:08:00
dari suatu institusi di suatu
00:08:02
permasalahan tertentu gitu ya dia
00:08:04
biasanya hipotesisnya sudah ada lalu
00:08:07
mengukur apa yang sudah ditetapkan
00:08:09
sebelumnya dan ini biasanya jarang
00:08:12
sekali menggunakan model
00:08:14
machine-learning atau statistik yang
00:08:16
Advance kalau dia menggunakan model
00:08:18
statistik atau mesin minyak fast
00:08:20
biasanya nyebutnya sebagai bisnis
00:08:22
analitik ada lagi six Sigma dan tqm di
00:08:26
quality control Lalu ada one di Finance
00:08:32
j&t Harap mudah-mudahan sampai sini jadi
00:08:36
jelas ya perbedaan antara data science
00:08:38
dengan bidang-bidang ilmu lainnya dari
00:08:41
penjelasan tadi diharapkan kemudian kita
00:08:44
sudah dapat memahami apa kaitan antara
00:08:47
industri 40 atau eradata dengan big data
00:08:50
dan data science pada pertemuan
00:08:52
berikutnya kita akan membicarakan
00:08:54
langsung ke data tipe-tipe data dan
00:08:57
format data serta model-model didata SAW
00:09:00
Hai Sampai berjumpa di kuliah
00:09:02
selanjutnya