12_Kualitas Data

00:55:37
https://www.youtube.com/watch?v=3xYvFDJGnXo

Sintesi

TLDRThe video presentation highlights the significance of data quality in the context of implementing data warehouses. It asserts that clean, accurate, and well-organized data is fundamental for a successful data warehouse operation. The lecturer explains that data quality is pivotal as it directly impacts the reliability and accuracy of the outcomes derived from data warehouses. High-quality data leads to reliable analysis, better decision-making, enhanced customer service, and operational efficiency. The speaker emphasizes that poor data quality can result in erroneous conclusions and business inefficiencies, highlighting the need for data validation and cleansing as crucial steps in maintaining high-quality data. The lecture also discusses common data quality challenges, such as inaccuracies, duplicates, and inconsistencies, and suggests ways to address these issues to improve overall data quality.

Punti di forza

  • 💡 Data quality is critical for decision-making and business success.
  • 🔍 Accurate data leads to reliable analysis and insights.
  • ⚙️ Poor data quality results in faulty outputs and decisions.
  • 🗂️ Common issues include inaccuracies and data duplication.
  • 📊 Validation and cleansing improve data quality.
  • 🌟 High-quality data enhances customer service and productivity.
  • 🔄 Tools exist to detect and correct data errors.
  • 🛠️ Regular data verification is essential for maintaining quality.
  • 🔑 Data serves as a strategic resource for businesses.
  • 📈 Businesses need to prioritize data quality for efficiency.

Linea temporale

  • 00:00:00 - 00:05:00

    Introduction to the importance of data quality for data Warehouse implementation and its impact on data analysis outcomes like text and data mining.

  • 00:05:00 - 00:10:00

    Data quality is described as a critical component for reliable data. Low-quality input leads to poor analysis outputs.

  • 00:10:00 - 00:15:00

    Examples of how data quality affects decision-making processes in companies and its perceived importance.

  • 00:15:00 - 00:20:00

    The strategic value of data is compared to resources like oil, with real-life examples from Facebook and Google.

  • 00:20:00 - 00:25:00

    The role of data quality in providing accurate and actionable business insights and improving customer service.

  • 00:25:00 - 00:30:00

    Discussion on personalizing education through data quality, assessing the importance of tailored learning experiences.

  • 00:30:00 - 00:35:00

    The impact of high quality, accurate data on executive decision-making processes, with a focus on educational institutions.

  • 00:35:00 - 00:40:00

    Challenges of data inaccuracies in databases and the importance of initial validation and ongoing verification processes.

  • 00:40:00 - 00:45:00

    Common issues like redundant data, duplicate entries, and inconsistent formats in data systems.

  • 00:45:00 - 00:50:00

    Final thoughts on sustaining data quality, ensuring its role in effective decision supporting processes.

  • 00:50:00 - 00:55:37

    A summary on the benefits of maintaining high data quality for better decision-making, marketing practices, and customer service.

Mostra di più

Mappa mentale

Mind Map

Domande frequenti

  • What is the importance of data quality in data warehousing?

    Data quality is crucial because it determines the accuracy and reliability of the analyses and decisions based on the data warehouse.

  • How does data quality affect decision-making?

    Poor data quality leads to inaccurate decision-making, as decisions are based on faulty data or insights.

  • What does 'garbage in, garbage out' mean in data processing?

    It means that if low-quality, incorrect data is inputted into a system, the output will also be poor-quality or incorrect.

  • What are the common problems associated with data quality?

    Common problems include inaccurate data, missing data, duplicate entries, and inconsistent or outdated information.

  • Why should businesses care about data quality?

    High data quality ensures reliable insights, enhances decision-making processes, and can significantly impact business success.

  • What factors influence data quality?

    Data accuracy, integrity, consistency, completeness, and validity are key factors that determine data quality.

  • How can data quality be improved?

    Data quality can be improved through validation processes, data cleansing, and ensuring accurate data entry at the source.

  • What tools are available for maintaining data quality?

    There are various data quality tools that can detect errors, inconsistencies, and help correct or cleanse the data.

  • How does data quality impact customer service?

    Accurate data allows for better customer service by enabling precise customer insights and personalized interactions.

  • What role do data validation and cleansing play in data quality?

    They are essential processes to ensure that data is accurate and clean before being analyzed or used in decision-making.

Visualizza altre sintesi video

Ottenete l'accesso immediato ai riassunti gratuiti dei video di YouTube grazie all'intelligenza artificiale!
Sottotitoli
id
Scorrimento automatico:
  • 00:00:00
    Halo
  • 00:00:02
    Bismillahirohmanirohim Assalamualaikum
  • 00:00:04
    warahmatullahi wabarakatuh
  • 00:00:09
    Waalaikumsalam warahmatullahi
  • 00:00:10
    wabarakatuh butuh berharap pagi
  • 00:00:14
    semuanya kita jumpa lagi di pertemuan
  • 00:00:16
    yang ke-12 ini tadi minggu yang lalu
  • 00:00:19
    kalian sudah atau kita sudah membahas
  • 00:00:21
    mengenai
  • 00:00:23
    ITL ya Jadi kalian sedang mencoba untuk
  • 00:00:26
    merancang idealnya dengan menggunakan
  • 00:00:29
    pentaho hari ini kita akan masuk ke
  • 00:00:31
    materi selanjutnya jadi nanti pen
  • 00:00:33
    tahunnya kita tentastic Andi pertemuan
  • 00:00:35
    terakhir saja jadi kita akan masuk ke
  • 00:00:38
    materi selanjutnya yaitu kualitas data
  • 00:00:41
    sebagai kunci menuju sukses implementasi
  • 00:00:44
    dari data Warehouse ini jadi data ini
  • 00:00:47
    menjadi input bagi ada wireless yang
  • 00:00:50
    kita atau menjadi ngapa ya sumber ya
  • 00:00:54
    sumber dari data Warehouse yang kita
  • 00:00:56
    jadi kualitas data itu akan menentukan
  • 00:00:58
    hasil-hasil
  • 00:01:00
    khalish yang kita nanti bahkan ketika
  • 00:01:02
    kita melakukan text mining atau data
  • 00:01:04
    mining pun nanti itu ditentukan oleh
  • 00:01:06
    yang namanya kualitas data jadi data itu
  • 00:01:10
    Eh belum diproses ya kita tahu
  • 00:01:13
    sendirikan definisi data fakta objek
  • 00:01:15
    atau kejadian tentang suatu hal itu
  • 00:01:17
    belum lalu melalui yang namanya tahapan
  • 00:01:19
    proses Nah bisa jadi data yang
  • 00:01:22
    dimasukkan itu belum valid atau perlu
  • 00:01:24
    kita lakukan perbaikan atau koreksi
  • 00:01:27
    jadi kualitas data itu menentukan
  • 00:01:30
    reputasi dan nilai data dalam data
  • 00:01:33
    Warehouse ya jadi kualitas datanya kita
  • 00:01:36
    itu kan akan menentukan reputasinya
  • 00:01:37
    apakah nanti hasilnya itu hasil analisis
  • 00:01:40
    itu bisa dipastikan benar atau tidak
  • 00:01:43
    tergantung dari inputannya jadi
  • 00:01:46
    prosesnya kan sudah seperti itu untuk
  • 00:01:48
    datawarehouse Bagaimana caranya kita mau
  • 00:01:50
    bukan data ya umumnya seperti itu hanya
  • 00:01:53
    saja nanti outputnya itu sangat
  • 00:01:55
    bergantung dari input yang dimasukkan
  • 00:01:57
    Jadi kalau misalnya kita ibaratkan dalam
  • 00:02:00
    zat istamitu Kanada tidak ada input ada
  • 00:02:03
    proses ada outputnya Itu kan hal yang
  • 00:02:06
    lumrah di dalam sebuah proses pengolahan
  • 00:02:09
    sistem ya Nah outputnya ini akan sangat
  • 00:02:13
    bergantung pada inputnya jadi ketika
  • 00:02:15
    kita
  • 00:02:16
    memasukkan sampah di dalam sistemnya
  • 00:02:18
    kita maka keluarannya pasti sampah oleh
  • 00:02:21
    istilahnya itu apa Herbert in fade out
  • 00:02:24
    ternyata ketika sampah itu kita masukkan
  • 00:02:26
    maka yang keluar adalah sampah juga gitu
  • 00:02:29
    ya Artinya ketika data yang kita
  • 00:02:31
    masukkan datanya asal pakaian keluar
  • 00:02:33
    dari sistemnya kita atau yang keluar
  • 00:02:35
    dari hasil analisis yang kita adalah
  • 00:02:37
    ampas juga tidak punya Axiata tidak
  • 00:02:40
    punya nilai
  • 00:02:41
    nah ah
  • 00:02:44
    Bilamanakah kesalahan data mempengaruhi
  • 00:02:47
    hasil informasi gitu ya jadi ketika
  • 00:02:50
    misalnya kita memasukkan data salah
  • 00:02:53
    menulis nama kemudian salah menulis apa
  • 00:02:58
    penjualan rasa gitu dan harga barang dan
  • 00:03:01
    lain sebagainya maka dia akan
  • 00:03:02
    menghasilkan informasi yang salah juga
  • 00:03:05
    banyak perusahaan menganggap sistem data
  • 00:03:07
    mereka sudah terlalu baik sehingga tidak
  • 00:03:09
    memerlukan mekanisme pemeriksaan data
  • 00:03:11
    Jadi sebenarnya kan kita sudah membuat
  • 00:03:15
    validasi terhadap
  • 00:03:16
    sistem yang kita ya ketika kalian
  • 00:03:19
    membangun sistem dia pasti ada
  • 00:03:20
    validasinya misalnya ibell ya email itu
  • 00:03:23
    kan dipanjat juga nama-nama nama itu
  • 00:03:26
    akan dilakukan validasi oleh sistemnya
  • 00:03:27
    kita jadi kalau misalnya sudah dilakukan
  • 00:03:29
    diawal Saya mau validasi nama lasmedi
  • 00:03:32
    afuan Griya plasmedia Apaan itu harusnya
  • 00:03:35
    semuanya huruf tidak boleh ada angkanya
  • 00:03:38
    jadi misalnya ada yang menuliskan
  • 00:03:40
    plasmedia Fany tuanya diganti sama empat
  • 00:03:42
    Riana dengan harus diverifikasi oleh
  • 00:03:44
    sistem langsung gitu ya ketika kita
  • 00:03:46
    menginputkan datanya ya sistem akan
  • 00:03:49
    memberikan dikasih bahwa yang boleh
  • 00:03:51
    masuk itu bukan alfanumerik gitu ya Ya
  • 00:03:53
    hanya boleh alfabet saja ya numeriknya
  • 00:03:56
    dihilangkan itu salah satunya contoh 10
  • 00:04:00
    verifikasi datanya kita email juga sama
  • 00:04:02
    jadi emailkan ketika kita masukkan
  • 00:04:05
    lasmedi 2008 at gmail.com itu dilakukan
  • 00:04:08
    validasi di sana terus dilakukan
  • 00:04:10
    verifikasi koin yang dimasukan ada email
  • 00:04:12
    yang valid Apakah dia terdaftar atau
  • 00:04:14
    tidak di Gmail itors diverifikasi juga
  • 00:04:17
    nanti ketika misalnya sudah melakukan
  • 00:04:20
    hal ini berarti kita tahapan berikutnya
  • 00:04:22
    akan lebih lebih lebih enak gitu ya
  • 00:04:24
    karena part datanya sudah diverifikasi
  • 00:04:27
    Nah kalau misalnya sistem yang
  • 00:04:28
    dikembangkan itu tidak melakukan
  • 00:04:30
    verifikasi batik ini akan menjadi
  • 00:04:32
    pekerjaan bagi kita lebih bagi kita
  • 00:04:34
    siapa bagi kita yang akan melakukan
  • 00:04:36
    proses data Warehouse ingini jadi banyak
  • 00:04:40
    perusahaan menganggap
  • 00:04:42
    sistem data mereka sudah terlalu baik
  • 00:04:44
    sehingga tidak perlu tidak memerlukan
  • 00:04:47
    mekanisme yang namanya pemeriksaan
  • 00:04:49
    data-data tidak perlu diverifikasi
  • 00:04:50
    mereka mangga biodata itu benar ya Nah
  • 00:04:53
    mereka menganggap bahwa kualitas data
  • 00:04:55
    bukan menjadi prioritas Jadi kalau
  • 00:04:57
    misalnya kita belajar data maining t
  • 00:05:00
    Hening ya kamu Dian ya pokoknya yang
  • 00:05:04
    kaitanya dengan mailing menganalisis
  • 00:05:06
    data gitu ya data ini menjadi hal yang
  • 00:05:08
    sangat penting Siapa bilang data itu
  • 00:05:09
    tidak menjadi penting ya kalau sekarang
  • 00:05:11
    kita tahu bahwa data itu menjadi apa
  • 00:05:16
    istilahnya itu ya sumberdaya utama
  • 00:05:18
    sekarang Jadi di jadi orang tidak lagi
  • 00:05:20
    menganggap minyak itu sebagai sumber
  • 00:05:22
    daya tapi orang menganggap data itu
  • 00:05:24
    sebagai sumber daya ketika kita memiliki
  • 00:05:26
    data banyak hal yang bisa kita lakukan
  • 00:05:28
    Google kalian ketahui sendiri kemudian
  • 00:05:31
    Facebook ya dengan datanya kita dengan
  • 00:05:34
    aktivitasnya kita yang kita masukkan
  • 00:05:36
    setiap hari foto yang kita posting
  • 00:05:37
    kemudian komentar dan lain sebagainya
  • 00:05:40
    kita menjadi data buat mereka kemudian
  • 00:05:42
    kebiasaan-kebiasaan yang kita lakukan ya
  • 00:05:45
    hobi yang kita isi itu kan menjadi data
  • 00:05:47
    buat mereka ketika kita masukkan data
  • 00:05:50
    yang benar kalian masukin kalau misalnya
  • 00:05:52
    saya
  • 00:05:53
    memasukkan data-data Pa misalnya data
  • 00:05:55
    sekolahnya saya gitu ya Mulai dari SD
  • 00:05:58
    sampai SMA
  • 00:06:00
    Oh ya makan nanti Google akeh bukan
  • 00:06:02
    Google Maaf Facebook akan memberikan
  • 00:06:04
    rekomendasi yang ada kaitanya dengan
  • 00:06:06
    kita gitu ya atau yang kaitanya dengan
  • 00:06:08
    hobinya kita atau yang kaitanya dengan
  • 00:06:10
    sma-nya kita atau yang kaitannya dengan
  • 00:06:13
    aktivitas kita setiap kita akan
  • 00:06:15
    ditawarkan gede direkomendasikan ini
  • 00:06:17
    berawal dari data ketika kalian
  • 00:06:19
    memasukkan datanya benar maka diolah
  • 00:06:22
    oleh Facebook tadi dia akan menghasilkan
  • 00:06:24
    informasi atau keputusan yang benar
  • 00:06:26
    Huriah Adam kita direkomendasikan karena
  • 00:06:29
    di kontaknya kita itu sudah ada
  • 00:06:30
    nama-nama ya kalau Google sama WhatsApp
  • 00:06:32
    Facebook sama WhatsApp ditekan ketika
  • 00:06:34
    kita punya kontak di WhatsAppnya kita di
  • 00:06:37
    Google halte Maaf lagi di Facebook nanti
  • 00:06:40
    kita akan direkomendasikan
  • 00:06:42
    orang-orang yang sebenarnya ada di
  • 00:06:44
    kotaknya kita ya
  • 00:06:46
    Hai ini Ini salah satu contohnya bahwa
  • 00:06:49
    kualitas data itu akan mempengaruhi
  • 00:06:51
    hasilnya ia Jadi kalau misalnya yang
  • 00:06:54
    kita masukkan itu yang baik data yang
  • 00:06:57
    baik yang berkualitas Maka hasilnya
  • 00:06:59
    pasti akan berkualitas
  • 00:07:01
    jadi meskipun prosesnya bagus proses
  • 00:07:04
    standarkan Hanya seperti itu saja gitu
  • 00:07:06
    ya proses didalam sebuah Tengah seperti
  • 00:07:08
    itu saja tapi ketika datanya dimasukkan
  • 00:07:11
    maka
  • 00:07:13
    akan menghasilkan sesuatu yang baik itu
  • 00:07:17
    nah ini kualitas data Nah jadi selama
  • 00:07:22
    data yang diinputkan dan bisa disajikan
  • 00:07:24
    diterima maka sistem tersebut baik-baik
  • 00:07:27
    saja gitu ya itu kan biasa kalo misalnya
  • 00:07:30
    tidak ada tidak ada verifikasi di awal
  • 00:07:33
    di dalam sistemnya kita lebih dalam
  • 00:07:35
    apa itu
  • 00:07:39
    jadi dalam sistemnya kita ya ketika kita
  • 00:07:42
    akan misalnya ada beberapa sistem nih
  • 00:07:44
    sistem informasi akademik ada datanya
  • 00:07:47
    kemudian sistem informasi eh penelitian
  • 00:07:51
    dan pengabdian ada datanya sistem yang
  • 00:07:54
    lain ada selama tidak dilakukan
  • 00:07:55
    verifikasi ya dianggap bahwa data yang
  • 00:07:57
    dimasukkan itu benar gitu ya karena
  • 00:07:59
    tidak ada verifikasi disana dan bisa
  • 00:08:01
    dianggap by outputnya juga benar karena
  • 00:08:03
    tidak dilakukan verifikasi ya jadi
  • 00:08:06
    dianggap baik-baik saja gitu ya Tapi
  • 00:08:08
    ketika misalnya dilakukan misalnya nanti
  • 00:08:10
    ya dilakukan analisis ya Oh kok seperti
  • 00:08:13
    ini hasilnya terjadi anomali gitu ya
  • 00:08:15
    terjadi sesuatu yang tidak yang kita
  • 00:08:17
    tidak seperti yang kita harapkan anomali
  • 00:08:19
    di harusnya seperti ini tapi yang keluar
  • 00:08:22
    ternyata seperti itu gitu ya maka
  • 00:08:24
    terjadi anomali ini bisa berawal dari
  • 00:08:26
    kualitas data yang dimasukkan oleh
  • 00:08:28
    Regita
  • 00:08:30
    Nah jadi mengapa mengapa kualitas data
  • 00:08:35
    itu penting ya jadi data itu kan
  • 00:08:38
    sifatnya strategis tadi yang saya
  • 00:08:40
    sampaikan kalau sekarang ketika kita
  • 00:08:42
    memiliki data banyak hal yang kita bisa
  • 00:08:43
    lakukan ya ya kalau chord gojek kemudian
  • 00:08:50
    grab ya kemudian Bukalapak atau syaraf
  • 00:08:53
    yang sekarang aja ya mau yang yunikon
  • 00:08:56
    atau yang DK kode tengah mereka mereka
  • 00:08:59
    sangat bergantung dengan data gitu ya
  • 00:09:01
    maka itu ada ada muncul bidang yang
  • 00:09:04
    namanya data Scientist atau data analyst
  • 00:09:07
    gitu ya data itu akan dilakukan analisis
  • 00:09:10
    gitu ya maka dia akan memberikan
  • 00:09:12
    keputusan yang membantu siapa membantu
  • 00:09:14
    sistemnya ya oh sistem bisa
  • 00:09:17
    merekomendasikan recommender system
  • 00:09:19
    Bagaimana sekarang kita bisa
  • 00:09:21
    direkomendasikan dengan kebiasaannya
  • 00:09:23
    kita menggunakan gojek gitu ya Bahkan
  • 00:09:26
    kita ditawarkan promo his aku suka
  • 00:09:28
    belanja di shopee gitu ya kebiasaannya
  • 00:09:30
    beli apa ya direkomendasikan ketika ada
  • 00:09:33
    produk baru dari dari toko yang biasa
  • 00:09:35
    kita belanja maka kita direkomendasikan
  • 00:09:37
    itu
  • 00:09:39
    kemudian yang kedua menambah pede dalam
  • 00:09:41
    pengambilan keputusan nah sekarang itu
  • 00:09:44
    dengan data yang cukup banyak ya kita
  • 00:09:47
    mau melakukan analisis secara manual
  • 00:09:49
    tidak akan mengalami kesulitan kita
  • 00:09:52
    membutuhkan sistem ketika misalnya
  • 00:09:55
    sistem itu mendapatkan input data yang
  • 00:09:56
    baik di pengambil keputusan Oke di level
  • 00:10:00
    eksekutif lah ya seperti misalnya Rektor
  • 00:10:03
    Rektor Unsoed itu dengan menggunakan
  • 00:10:05
    sistem informasi eksekutif nya dia bisa
  • 00:10:07
    mengambil keputusan dengan cepat
  • 00:10:09
    berdasarkan data yang ditampilkan atau
  • 00:10:11
    Berdasarkan informasi yang ditampilkan
  • 00:10:13
    dari pemrosesan data yang yang
  • 00:10:15
    dimasukkan oleh level operasionalnya
  • 00:10:17
    operasionalnya masukin data kemudian
  • 00:10:19
    diolah oleh sistem Kemudian dari sana
  • 00:10:23
    Rektor bisa mengambil keputusan Oh
  • 00:10:26
    ternyata gitu ya Misalnya
  • 00:10:28
    publikasi dosen Unsoed masih rendah
  • 00:10:31
    sekali keputusannya apa nanti Oke kita
  • 00:10:33
    akan meningkatkan dengan memberikan
  • 00:10:35
    reward kepada dosen yang yang yang
  • 00:10:37
    mempublikasikan artikelnya di jurnal
  • 00:10:40
    nasional atau dicentang nasional gitu ya
  • 00:10:43
    kemudian pelayanan pelanggan yang lebih
  • 00:10:45
    baik jelasin Hai jadi
  • 00:10:48
    eh bahkan kalau misalnya di pendidikan
  • 00:10:51
    itu juga sebenarnya bisa dilakukan yang
  • 00:10:52
    namanya personalisasi pendidikan jadi
  • 00:10:55
    kalau kita lihat sekarang ya sistem
  • 00:10:57
    pendidikan kita itu apa semua orang akan
  • 00:11:00
    mendapatkan pembelajaran yang sama gaya
  • 00:11:03
    belajar yang sama Padahal kan antara
  • 00:11:05
    saya anief kemudian Aji Novanto kemudian
  • 00:11:10
    yang lain itu pasti memiliki gaya
  • 00:11:12
    belajar yang berbeda gitu ya Rafli kan
  • 00:11:15
    punya misalnya Rafli itu lebih cepat
  • 00:11:16
    menangkap kalau misalnya mendengarkan
  • 00:11:17
    musik kalau misalnya saya suruh baca
  • 00:11:21
    mungkin Raffi agak kesulitan
  • 00:11:23
    membaca membaca tulisan gitu ya
  • 00:11:26
    kesulitan Tapi akan lebih mudah kalau
  • 00:11:27
    misalnya materi saya saya makanya saya
  • 00:11:31
    itu disajikan dalam bentuk
  • 00:11:32
    dalam bentuk lagu atau misalnya dalam
  • 00:11:35
    bentuk video Nah itu sebenarnya proses
  • 00:11:38
    personalisasi Artinya bahwa setiap
  • 00:11:40
    mahasiswa akan mendapatkan mendapatkan
  • 00:11:43
    layanan yang berbeda karena memiliki
  • 00:11:45
    learning style yang berbeda Hai nah ini
  • 00:11:47
    berawal dari data dari kebiasaan Oh saya
  • 00:11:50
    punya data nih terkait dengan Nicholas
  • 00:11:52
    Hanifah Rafli kemudian pembelajarannya
  • 00:11:54
    didata pembelajarannya Kemudian dari
  • 00:11:57
    sana sistem bisa merekomendasikan Oh
  • 00:11:59
    Wasia ini dia lebih soalnya misalnya
  • 00:12:02
    aktif-aktif ya kemudian ada yang
  • 00:12:05
    apa itu
  • 00:12:08
    kelapa aktif intuitif kemudian apa yang
  • 00:12:10
    misalnya cenderung video cenderung
  • 00:12:13
    ditanya eh yang teks cenderung di
  • 00:12:16
    sambungan bisanya pembelajaran
  • 00:12:18
    Apalagi saya lupa evangelista kemudian
  • 00:12:22
    meningkatkan nilai tambah jelas dia
  • 00:12:25
    ketika misalnya datanya kita dengan
  • 00:12:26
    bakal baik ya kemudian yang inputnya
  • 00:12:30
    baik prosesnya standar seperti itu saja
  • 00:12:33
    apa-apa semua sama gitu ya prosesnya
  • 00:12:35
    kemudian outputnya pasti akan berbeda
  • 00:12:37
    gitu ya Kenapa datanya baik tadi data
  • 00:12:40
    yang baik kemudian
  • 00:12:42
    eh apa dengan data yang tidak baik
  • 00:12:45
    proses yang sama maka hasilnya pasti
  • 00:12:48
    berbeda gitu ya pasti beda ya ya kalau
  • 00:12:52
    misalnya kita Contohkan ya Informatika
  • 00:12:54
    kan punya inputnya ikut bagus semua gitu
  • 00:12:56
    ya inputnya bagus prosesnya pandang
  • 00:12:59
    seperti itu saja pembelajaran kemudian
  • 00:13:01
    keluarannya Bagus Pasti ya Tapi ketika
  • 00:13:04
    misalnya inputnya biasa
  • 00:13:07
    atau jelek gitu ya datanya jelek
  • 00:13:10
    kemudian diolah diproses kemudian
  • 00:13:13
    keluarannya ya pasti
  • 00:13:15
    ya bisa Bagus bisa jelek ya tapi
  • 00:13:17
    keduanya adalah jelek kenapa prosesnya
  • 00:13:19
    standart kecuali misalnya input data
  • 00:13:22
    tadi yaitu data yang jelek section jelek
  • 00:13:24
    tadi kemudian dilakukan pemrosesan
  • 00:13:27
    diperbaiki di pop diprosesnya maka dia
  • 00:13:30
    akan bisa menghasilkan informasi yang
  • 00:13:32
    berkualitas
  • 00:13:34
    kemudian mengurangi ongkos pertama biaya
  • 00:13:36
    marketing nah ini juga sama nih kalau
  • 00:13:38
    misalnya seperti apa itu ya Eh nya ini
  • 00:13:43
    contohnya apa misalnya yang penawaran
  • 00:13:46
    kredit gitu ya ya karena ending dari
  • 00:13:50
    data Warehouse itu kan sebenarnya
  • 00:13:52
    Eh bisa didata mainin bisa dilakukan
  • 00:13:55
    analisis yang nantinya akan membantu
  • 00:13:58
    baik itu marketing baik itu level
  • 00:14:01
    eksekutif untuk mengambil keputusan
  • 00:14:03
    misalnya saya contohkan mengurangi
  • 00:14:05
    ongkos pertama biaya marketing gitu ya
  • 00:14:09
    Jadi kalau misalnya Dulu ketika orang
  • 00:14:12
    mau menawarkan kartu kredit itu dia akan
  • 00:14:14
    broadcast ke semua ya jadi dari 1000
  • 00:14:18
    orang punya data dia broadcast ke 1000
  • 00:14:20
    tapi yang balik ternyata berapa hanya
  • 00:14:24
    lima itu ya padahal biaya yang
  • 00:14:26
    dikeluarkan luar biasa itu ya pakai
  • 00:14:28
    pakai surat gitu ya Nah dengan
  • 00:14:31
    menggunakan data ini tadi ya kan dengan
  • 00:14:35
    menggunakan data dilakukan analisis tadi
  • 00:14:37
    broadcastnya tidak ke-1000 tapi ke ke ke
  • 00:14:40
    ke orang yang paling mungkin untuk
  • 00:14:42
    menggunakan kartu kredit
  • 00:14:44
    akhir-akhir ya jadi dari dari 1000 Dadi
  • 00:14:47
    diperkecil lagi hasil analisisnya kita
  • 00:14:49
    untuk nyatanya 10 orang gitu ya
  • 00:14:51
    Dipercaya saja ke-10 orang tadi
  • 00:14:52
    kelihatan lebih lebih tepat sasaran itu
  • 00:14:55
    ya sama seperti sekarang kalau marketing
  • 00:14:58
    itu kan dia menjual mati brosur atau
  • 00:15:02
    ngasih iklan gitu ya Nah nasi iklan itu
  • 00:15:08
    yakni broadcast ke semua gitu ya padahal
  • 00:15:10
    biaya iklan itu kan luar biasa dari 1000
  • 00:15:13
    orang itu kan belum tentu ya mungkin
  • 00:15:15
    yang kena 5 tadi ya Nah kalau misalnya
  • 00:15:18
    kita berbasis data itu akan di broadcast
  • 00:15:20
    ya berdasarkan kebiasaan saja
  • 00:15:22
    kemungkinan ini ada kemungkinan kita
  • 00:15:24
    belum mandi dia membeli maka seorang
  • 00:15:27
    orang tersebut saja jadi dari sisi dari
  • 00:15:29
    segi tadi kita berkecil menjadi 10 orang
  • 00:15:30
    saja ada rezeki biaya akan lebih murah
  • 00:15:33
    tepat sasaran juga
  • 00:15:35
    Hai intinya kan kalau ketika menjual itu
  • 00:15:37
    kan marketing itu kan ada di ya Eling
  • 00:15:41
    yang menjual selling selling akhirnya
  • 00:15:44
    yang dibutuhkan adalah closing gitu kan
  • 00:15:46
    bahwa yang kita
  • 00:15:49
    tawarkan itu mereka pasti closing gitu
  • 00:15:51
    ya Artinya apa mereka pasti membeli
  • 00:15:53
    produknya
  • 00:15:55
    kemudian meningkatkan kualitas putusan
  • 00:15:57
    ini dari setiap sampaikan meningkatkan
  • 00:15:59
    kode produk tivitas kemudian mengurangi
  • 00:16:01
    kontaminasi kontaminasi data jadi
  • 00:16:04
    dataitem bercampur ya campur kontaminasi
  • 00:16:06
    data dengan dengan sesuatu yang
  • 00:16:08
    sebenarnya tidak penting dari contohnya
  • 00:16:10
    Apa nama Anggita dia nama diisi dengan
  • 00:16:12
    apa dengan
  • 00:16:13
    alfanumerik ada diganti sama kita ya
  • 00:16:16
    lasmedi hanya diganti 4 kemudian ini
  • 00:16:19
    diganti satu
  • 00:16:20
    ini kenapa kualitas data itu penting
  • 00:16:24
    didata itu menjadi sesuatu yang penting
  • 00:16:26
    karena itu didalam proses ya ada namanya
  • 00:16:29
    preprocessing data jadi data itu diklin
  • 00:16:32
    dikelilingi cleansing gitu ya data itu
  • 00:16:34
    dilakukan casing misalnya saya contohkan
  • 00:16:37
    ya kalau kita mengambil data dari tweet
  • 00:16:40
    ya yang ada di Twitter ya saya mau
  • 00:16:43
    melakukan sentimen analisis ya datanya
  • 00:16:46
    dari mana dari pitter atau dari sosial
  • 00:16:48
    media media sosial dari Facebook ya saya
  • 00:16:51
    tidak bisa langsung menggunakan data itu
  • 00:16:53
    karena datanya itu pasti data yang belum
  • 00:16:55
    valid karena apa itu either kita
  • 00:16:58
    menggunakan Apa itu ya Mbak menggunakan
  • 00:17:01
    kata-kata yang tidak baku ya kan kalau
  • 00:17:05
    misalnya eh ya tidak baku ya basah-basah
  • 00:17:09
    gaul kan kita gunakan itu harus
  • 00:17:11
    dilakukan Klinting harus dilakukan yang
  • 00:17:13
    namanya normalisasi jadi misalnya
  • 00:17:15
    kata-kata yang yang tidak baku misalnya
  • 00:17:18
    dia menuliskan
  • 00:17:19
    saya itu S4 yea gitu ya misal ini itu
  • 00:17:24
    harus kita balikan Ya harus kita balikan
  • 00:17:27
    menjadi kata saya gitu ya atau misalnya
  • 00:17:29
    ada yang menuliskan saya gitu hanya akan
  • 00:17:33
    banyak sekali itu harus bisa di Bali
  • 00:17:35
    jadi kata sayang gitu Ini contoh data
  • 00:17:38
    yang tidak berkualitas tapi harus di
  • 00:17:40
    gunakan akan kita gunakan maka kita
  • 00:17:42
    melakukan yang namanya proses kita
  • 00:17:44
    normalisasi kita kalau ada yang
  • 00:17:47
    basah-basah program itu kita balikin
  • 00:17:48
    standarnya gitu ya kita lakukan
  • 00:17:50
    normalisasi agar apa berkualitas datanya
  • 00:17:53
    Nah ini contohnya Jadi kenapa Data itu
  • 00:17:58
    penting
  • 00:18:00
    nah Apa yang disebut data itu
  • 00:18:03
    berkualitas ya Jadi pertama Dia memiliki
  • 00:18:07
    Akurasi
  • 00:18:08
    ya jadi akurasinya itu terkait dengan
  • 00:18:12
    elemen data customer ya jadi misalnya
  • 00:18:16
    alamat yang dimasukkan dia benar gitu ya
  • 00:18:18
    jenis kelamin yang dipilih ya juga benar
  • 00:18:21
    laki-laki atau perempuan kemudian
  • 00:18:22
    tanggal lahir dan lain sebagainya ini
  • 00:18:25
    terkait dengan akurasi jadi data itu
  • 00:18:27
    harus memiliki akurasi yang baik Alamat
  • 00:18:30
    ya Jalan
  • 00:18:31
    HR Bunyamin alamat Unsoed Jalan HR
  • 00:18:35
    Bunyamin Nomor 33
  • 00:18:37
    kemudian jenis kelamin rcc ya harus
  • 00:18:41
    akurat sesuai dengan kenyataan
  • 00:18:44
    kemudian tanggal lahir juga sama
  • 00:18:46
    tanggalnya penting karena data ini nanti
  • 00:18:48
    akan menjadi acuan juga kan bisa jadi
  • 00:18:50
    misalnya kita mau melihat berapa orang
  • 00:18:53
    sih yang di usia 30 menyisir mengisi
  • 00:18:56
    mengisi datanya Kita iya atau deret
  • 00:18:59
    berapa orang sih Eh mahasiswa Unsoed
  • 00:19:02
    yang berusia 19 tahun ditransmisikan
  • 00:19:04
    berawal dari tanggal lahir jadi dengan
  • 00:19:06
    adanya tanggal lahir kita bisa dapat
  • 00:19:08
    usia
  • 00:19:09
    kamudian kualitas data
  • 00:19:12
    Jadi kalau kualitas data ini lebih jadi
  • 00:19:15
    kualitas data itu lebih dari sekadar
  • 00:19:17
    akurasi data tetapi mengacu pada
  • 00:19:20
    ketepatan
  • 00:19:22
    penggunaan yang sesuai dengan usah jadi
  • 00:19:25
    tidak hanya akurasi dari ya tapi
  • 00:19:27
    penggunaannya itu disesuaikan dengan apa
  • 00:19:30
    usernya tadi ya personalisasi tadi yang
  • 00:19:33
    sudah saya sampaikan ya Hai bawa
  • 00:19:36
    papa adab-adab ada personalisasi
  • 00:19:40
    terhadap seseorang gitu ya jadi misalnya
  • 00:19:42
    Si Adi keseruannya Apa itu berdasarkan
  • 00:19:44
    datanya itu itu yang berkualitas
  • 00:19:46
    kemudian saya kecenderungan belajar nya
  • 00:19:49
    seperti apa Nah dari dari data-data ini
  • 00:19:52
    nanti kita bisa bisa memberikan materi
  • 00:19:54
    yang berbeda saya saya bisa misalnya
  • 00:19:56
    memberikan materi osia ibcc ya Jadi
  • 00:20:00
    kalau misalnya kita di sekolah dasar
  • 00:20:02
    kalau kalian sering lihat video itu kan
  • 00:20:04
    ada seseorang yang marah ya Ada burung
  • 00:20:07
    sana ada ada ikan kemudian ada singa dan
  • 00:20:11
    lain sebagainya seseorang itu kalau
  • 00:20:13
    misalnya berkompetisi ya Sesuai dengan
  • 00:20:14
    sesuai dengan bidangnya dia ya burung
  • 00:20:17
    kalau misalnya diajak kompetisi yang
  • 00:20:19
    tidak bisa diajak kompetisi untuk
  • 00:20:20
    berenang jadi ya dia pasti kalah tapi
  • 00:20:22
    burung ketika dia diajak kompetisi
  • 00:20:24
    kompetisi nyoba terbang ikan ia berenang
  • 00:20:27
    kemudian singa yang berlari gitu ya itu
  • 00:20:29
    kompetensi jadi memberikan sesuatu itu
  • 00:20:32
    sesuai dengan eh apa kalau sayangnya
  • 00:20:35
    tebel sesuai dengan keahliannya sesuai
  • 00:20:37
    dengan minatnya ya karena itu kan kita
  • 00:20:40
    harus menyadari deteksi dini ketika
  • 00:20:42
    ketika diawal itu kan ada deteksi dini
  • 00:20:45
    oh si anak ini pintar apaan saniya kalau
  • 00:20:48
    kalian ketika masuk Informatika akan
  • 00:20:49
    kalian mendeteksi bahwa saya pintarnya
  • 00:20:51
    di apa Oh ada anaknya Saya misalnya
  • 00:20:54
    pintarnya Pak pintar melukis gitu ya
  • 00:20:56
    kemudian Muara Ini standar gitu ya
  • 00:20:59
    melukis warnai dia bisa gambar objek
  • 00:21:01
    dengan baik dengan menggunakan pensil
  • 00:21:02
    misal maka saya akan menjadikan kemana
  • 00:21:05
    Oh baik bagusnya kalau nanti kalau
  • 00:21:07
    misalnya mau kuliah ngambilnya ke mana
  • 00:21:10
    Ke DKP atau misalnya ke arsitek atau
  • 00:21:15
    atau mana gitu ya Nah itu kan deteksi
  • 00:21:19
    dini berawal dari apa Data yang saya
  • 00:21:20
    dapatkan gitu ya kebiasaannya dia Apa
  • 00:21:23
    itu kan data Nah itu kaitannya dengan
  • 00:21:26
    kualitas tadi ya Yang yang kita dapatkan
  • 00:21:30
    dari proses aku lagi tadi ya Oh dia
  • 00:21:33
    punya kebiasaan ini kau yang ini dan
  • 00:21:36
    lain sebagainya maka kita bisa
  • 00:21:37
    mendapatkan data yang berkualitas
  • 00:21:42
    nah ini contohnya ketika kita bermain
  • 00:21:46
    gitarnya dikunci kek gitu ya maka yang
  • 00:21:49
    keluar adalah
  • 00:21:51
    kunci ya bukan kunci
  • 00:21:54
    kemudian ketika kita berapa menghentikan
  • 00:21:58
    mobil maka yang mobilnya berhenti gitu
  • 00:22:00
    ya ketika kita mengurutkan data
  • 00:22:02
    diskriptif ya Excel ya maka ia akan
  • 00:22:06
    terus secara tepat pada benar begitu Ini
  • 00:22:09
    ini disebut dengan dengan apa dengan
  • 00:22:14
    data yang berkualitas Jadi apa yang kita
  • 00:22:16
    masukkan itu yang keluar jadi terbitin
  • 00:22:21
    gpsoo tadi aja sama ketika kita
  • 00:22:24
    memasukkan seperti yang tidak baik
  • 00:22:26
    datanya itu tidak baik tidak berkualitas
  • 00:22:28
    maka tidak
  • 00:22:31
    hal ini disebut sebagai data yang
  • 00:22:33
    berkualitas jadi pada data Warehouse itu
  • 00:22:35
    ya sangat penting karena itu pada data
  • 00:22:37
    Warehouse pasti ada proses ke namanya
  • 00:22:39
    pemimpin datanya dulu itu baik di
  • 00:22:41
    dikoreksi dia karena nanti harapannya
  • 00:22:44
    itu data itu ketika digunakan di menjadi
  • 00:22:48
    sebuah informasi itu menghasilkan
  • 00:22:50
    informasi yang berkualitas
  • 00:22:55
    kwalitas data dalam data Warehouse tidak
  • 00:22:57
    hanya kualitas dalam data individu
  • 00:22:59
    tetapi kualitas secara penuh dan
  • 00:23:01
    terintegrasi artinya apa ya Secara satu
  • 00:23:04
    kesatuan dia tabel baik itu perfect
  • 00:23:06
    tempelnya atau dimensional tablenya gitu
  • 00:23:09
    ya Nah maka dia harus atau satuan dan
  • 00:23:12
    terintegrasi tadi dengan sangat penting
  • 00:23:15
    itu ketika saya memberikan misalnya
  • 00:23:17
    contohnya ya
  • 00:23:19
    presiden atas Saya OTW ya yang membuat
  • 00:23:23
    heboh
  • 00:23:23
    yang membuat heboh ketika misalnya data
  • 00:23:26
    Presiden itu mendapatkan bisikan
  • 00:23:28
    biasanya terkait dengan hutang negara
  • 00:23:30
    setiap Oh negara masih dalam kondisi
  • 00:23:32
    aman tapi kan dalam kenyataannya itu
  • 00:23:34
    data yang dimasukkan ke kan mungkin
  • 00:23:36
    data-data mana gitu ya gan data yang
  • 00:23:39
    sebenarnya atau data empiris yang paling
  • 00:23:41
    gitu ya maka informasi yang keluar
  • 00:23:44
    adalah informasi yang tidak balik lagi
  • 00:23:48
    Hai jadi secara menyeluruh ya tidak
  • 00:23:50
    tidak hanya satu kesatuan sebagai sebuah
  • 00:23:52
    rekor tapi dia secara menyeluruh secara
  • 00:23:56
    menyeluruh misalnya laporan transaksi
  • 00:23:59
    penjualan dalam satu bulan atau dalam
  • 00:24:01
    satu semester atau dalam satu tahun ikan
  • 00:24:04
    secara keseluruhan dari proses atau
  • 00:24:07
    record dari masing-masing penjualan ya
  • 00:24:10
    kecil kita tidak bisa tidak kita tidak
  • 00:24:12
    bisa langsung mengatakan Ogawa penjualan
  • 00:24:14
    bulan Juni itu mengalami peningkatan ya
  • 00:24:17
    tidak bisa seperti itu hanya menyebutkan
  • 00:24:19
    Kenapa aja satu transaksi mengalami
  • 00:24:21
    peningkatan tidak bisa terputus jadi itu
  • 00:24:24
    harus transaksi dalam 1 bulan di bulan
  • 00:24:27
    maka baru kita bisa menarik kesimpulan
  • 00:24:29
    bahwa dibulan Juni itu mengalami
  • 00:24:32
    peningkatan atau penurunan atau misalnya
  • 00:24:34
    kemarin ya Eh kan sering sekali itu
  • 00:24:37
    bahwa di Kuartal kedua pada tahun 2021
  • 00:24:40
    ekonomi Indonesia akan naik jadi 3,2
  • 00:24:43
    persen atau misalnya ada yang
  • 00:24:44
    memprediksi waktu di Kuartal ketiga
  • 00:24:48
    Hai wartel ketiga di tahun
  • 00:24:50
    2020 bytecoin Indonesia mengalami apa
  • 00:24:54
    Insaf pertumbuhan minus 0,8 persen waktu
  • 00:24:58
    itu kan kita sering dengar naik berasal
  • 00:25:01
    dari dari akumulasi lebih dari
  • 00:25:04
    masing-masing provinsi kemudian rata ih
  • 00:25:07
    GTA dikumpulkan kemudian baru bisa
  • 00:25:10
    dilihat secara satu-satuan bahwa Oh kita
  • 00:25:13
    memang itu asal kedua Kuartal ketiga di
  • 00:25:16
    tahun 2020 itu ekonomi Indonesia tumbuh
  • 00:25:19
    minus Widya minus
  • 00:25:22
    kalau sekarang ya alhamdulillah sudah
  • 00:25:24
    mulai mengalami perbaikan ya Asal tidak
  • 00:25:29
    PPKN lagi kalau misalnya perfect airnya
  • 00:25:31
    diperpanjang level 4 lagi ya daerah maka
  • 00:25:35
    ya mau tidak mau ekonominya di Santosa
  • 00:25:37
    lagi ngarang tidak bisa berhenti hisab
  • 00:25:40
    terbagi batasi aktivitas Nah ini apa
  • 00:25:44
    yang disebut oleh data sudah terbalik
  • 00:25:48
    Oh ya jadi akurasi data di ya kemudian
  • 00:25:50
    folder data
  • 00:25:52
    ini Santa spesifik secara akurat
  • 00:25:55
    merepresentasikan objek secara tepat
  • 00:25:56
    nama Nadia alamat tanggal lahir
  • 00:26:01
    elemen data dijelaskan dalam istilah
  • 00:26:04
    teknologi elemen data menyesuaikan diri
  • 00:26:06
    untuk divalidasi tipe data yang benar
  • 00:26:08
    karena tradisional berhubungan dengan
  • 00:26:10
    obat ini kaitanya dengan datanya kita
  • 00:26:12
    Tadinya godata itu ya punya tipe data
  • 00:26:15
    gitu kan kalau misalnya data
  • 00:26:17
    biarkan sudah memberikan konspirasi
  • 00:26:20
    sebenarnya pada tipe data bahwa kalau
  • 00:26:22
    misalnya
  • 00:26:28
    jadi kalau misalnya datanya itu tipenya
  • 00:26:31
    integer yang yang boleh masuk yaitu
  • 00:26:33
    Jerry banyak kita sudah memberikan
  • 00:26:35
    konser disana akurasinya gitu ya tapi
  • 00:26:37
    kalau misalnya
  • 00:26:39
    tipenya itu desimal maka yang di Taman
  • 00:26:42
    Surya desimal gitu ya Oh iya benar di
  • 00:26:47
    anaknya say Iya
  • 00:26:54
    dek Jadi kalau misalnya tipe data tipe
  • 00:26:58
    data itu semuanya sudah konsernya kita
  • 00:26:59
    sudah membersihkan kekangan terhadap
  • 00:27:02
    datanya kita Ditambah lagi dengan
  • 00:27:04
    validasi melalui aplikasinya kita bahwa
  • 00:27:07
    misalnya harusnya di SGC alfabet tapi
  • 00:27:10
    diisi alfanumerik mangkat sekolah itu
  • 00:27:12
    sudah sudah pembatasan untuk mendapatkan
  • 00:27:15
    sebuah data yang berkualitas Iya kita
  • 00:27:18
    memberikan Kostrad pengecekan gitu ya
  • 00:27:20
    sering sekali tuh ya pengecekan atau
  • 00:27:23
    misalnya nama-nama itu harus harus
  • 00:27:26
    terisi gitu ya tidak boleh terisi kalau
  • 00:27:28
    sudah diisi di cek lagi apakah dia Alfan
  • 00:27:30
    merik atau 8-bit saja itu kan proses
  • 00:27:34
    untuk mendapatkan data yang akurat Nah
  • 00:27:36
    kalau misalnya ini kita abaikan ya bisa
  • 00:27:38
    tetap bisa masuk itu ya nama diisi tetap
  • 00:27:42
    terus password juga nah tetap biji
  • 00:27:46
    kemudian tidak ada misalnya pengecekan
  • 00:27:48
    Apakah minimal 8 karakter atau Oh
  • 00:27:53
    beberapa karakter gitu ya love biar
  • 00:27:55
    nanti pasti saja ketika bisa kosong
  • 00:28:00
    Nah kalau elemen data dijelaskan dalam
  • 00:28:03
    teknologi ini apa yang tandanya apa ya
  • 00:28:07
    elemen data elemen data itu ya
  • 00:28:13
    Hai ingin ada yang tahun waktunya zaman
  • 00:28:15
    data direkam dalam istilah teknologi
  • 00:28:21
    eh kita lanjut aja dulu ya
  • 00:28:23
    kemudian kualitas data di penggunaan
  • 00:28:28
    data sesuai dengan tujuan yang
  • 00:28:30
    ditentukan jadi harus ada sesuai dengan
  • 00:28:32
    tujuannya tujuan data itu untuk apa
  • 00:28:36
    kemudian konsep yang yang lebih luas
  • 00:28:38
    yang ditanamkan dalam spesifikasi serta
  • 00:28:40
    and I
  • 00:28:42
    Hai
  • 00:28:42
    kemudian berhubungan dengan sistem
  • 00:28:45
    Om dan isi konsisten terhadap sistem
  • 00:28:47
    Tuhan
  • 00:28:48
    penggunaan untuk pengguna data Warehouse
  • 00:28:51
    nih ini beberapa
  • 00:28:54
    kualitas data ya jadi data itu harus
  • 00:28:57
    digunakan sesuai dengan tujuan yang
  • 00:28:59
    ditentukan Jadi kalau misalnya data-data
  • 00:29:01
    Kalian tadi ya saya mengumpulkan data
  • 00:29:04
    tentang Apa kebiasaan kalian Kebiasaan
  • 00:29:06
    apa belajar kita lihat maka tujuannya
  • 00:29:08
    saya apa untuk mendapatkan personalisasi
  • 00:29:11
    jadi nanti saya bisa memberikan materi
  • 00:29:13
    yang berbeda terhadap siswa atau
  • 00:29:15
    misalnya contohnya begini ya Jadi ada
  • 00:29:18
    masker yang mungkin yang tipe belajarnya
  • 00:29:21
    itu tidak berurutan ya Bisa rendem ya
  • 00:29:23
    jadi kalo misalnya kita punya taksonomi
  • 00:29:25
    dengan Rasulullah itu kan ada urutannya
  • 00:29:26
    gold orang itu harus apa tahu dulu
  • 00:29:29
    pernah tahu siapa mengerti Rahmawati
  • 00:29:32
    memahami kemudian tingkatan lagi sampai
  • 00:29:34
    Dia iPad Anda nah ternyata setiap orang
  • 00:29:38
    punya kemampuan yang berbeda ya setelah
  • 00:29:40
    saya punya datanya kalian otaknya tapi
  • 00:29:42
    Ahmad
  • 00:29:44
    Habiballah ini saya tidak bisa langsung
  • 00:29:47
    pakai tahu saja gitu ya akan memberikan
  • 00:29:49
    memberitahu tapi dia sudah levelnya di
  • 00:29:51
    tingkat implementasi maka dia boleh
  • 00:29:53
    langsung loncat ke implementasi Tadi
  • 00:29:55
    kenapa berbasis data tadi
  • 00:29:58
    personalisasi tadi ada juga inisialnya
  • 00:30:01
    Oh dia kalau misalnya saya kasih Blend
  • 00:30:02
    tatif tidak bisa gitu SR memberi
  • 00:30:05
    definisi dulu Oh definisi dari data itu
  • 00:30:08
    apa itu saya belikan dulu Contohnya
  • 00:30:11
    seperti apa kemudian baru implementasi
  • 00:30:13
    yang bertahap ada yang acap ada yang
  • 00:30:18
    urutan tiada atau ada yang palsu
  • 00:30:21
    terakhir lebih taksonominya nggak
  • 00:30:24
    jadi-jadi itu penggunaan data sesuai
  • 00:30:27
    dengan tujuan yang diusulkan jadi
  • 00:30:28
    pesannya contohnya saja kanalisasi atau
  • 00:30:31
    untuk mengambil keputusan
  • 00:30:33
    misalnya promosinya saya gitu ya kalau
  • 00:30:36
    Unsoed itu kan biasanya kalau Pak ya
  • 00:30:39
    kalau untuk kan nanti kan kalau Negeri
  • 00:30:40
    tekan dicari jati diri Meskipun tidak
  • 00:30:43
    jadi masalah tapi bagi suarta itu kan
  • 00:30:45
    mereka akan melakukan analisis terhadap
  • 00:30:46
    data-data nyapa inputan mahasiswa Salah
  • 00:30:49
    satunya apa ke asal sekolah juga bisa
  • 00:30:52
    kemudian daerah itu juga bisa Oh
  • 00:30:55
    misalnya amikompurwokerto rata-rata
  • 00:30:57
    masanya Berasal dari mana nih hari
  • 00:31:01
    sma-smk gede misal rsmk ex-situ ya maka
  • 00:31:05
    mereka akan untuk menjaga menjaga apa
  • 00:31:09
    agar tetap ada yang masuk mereka akan
  • 00:31:10
    famosi kali 2 kali kemudian ada lagi
  • 00:31:13
    daerah lain yang belum pulang belum Iya
  • 00:31:16
    belum belum dipromosikan di daerah di
  • 00:31:19
    daerah mana gitu misalnya di Jawa Barat
  • 00:31:21
    Amerika pengen ada siswa yang berasal
  • 00:31:23
    dari tanah atau pengen memerintahkan
  • 00:31:25
    bahwa mahasiswanya kita itu harapannya
  • 00:31:28
    itu berasal dari 34 provinsi maka mereka
  • 00:31:30
    akan promosi ya promosi kemana the
  • 00:31:33
    daerah-daerah yang belum Tadi merasakan
  • 00:31:35
    apa Biarkan data yang masuk tadi Wow
  • 00:31:36
    ternyata dari kita belum ada dari daerah
  • 00:31:40
    misalnya Jawa Barat belum ada KBK
  • 00:31:42
    pemutih tanah atau dari daerah Jawa
  • 00:31:44
    Timur belum ada berdarah-darah yang
  • 00:31:46
    sudah ada ya biasanya mereka tidak
  • 00:31:49
    promosi tidak papa karena memperhatikan
  • 00:31:51
    daerah tersebut sudah tahu gitu ya tapi
  • 00:31:53
    kalau untuk menjaga ya sekali dua kali
  • 00:31:54
    tidak papa melakukan promosi ya nanti
  • 00:31:58
    untuk daerah-daerah yang belum mereka
  • 00:31:59
    promosi agar apa aja nanti ada mahasiswa
  • 00:32:03
    yang berasal dari daerah-daerah yang
  • 00:32:05
    sudah dipromosikan tadi bisa jadikan
  • 00:32:07
    daerah-daerah yang dipromosikan dari kan
  • 00:32:09
    belum mengenal sama sekali gitu ya maka
  • 00:32:11
    dengan mereka
  • 00:32:13
    promosi@detik.com karena oh ternyata ada
  • 00:32:15
    unit
  • 00:32:16
    haluskan tidak perlu ya ya Kalau tadi
  • 00:32:19
    kenapa kalau ditekan biasanya nabi kalau
  • 00:32:21
    nabi itu kan kalau masih tidak promosia
  • 00:32:24
    tetap tetap ada yang mau masuk gitu lah
  • 00:32:27
    ya apa tapi ini menjadi kelemahan
  • 00:32:29
    sebenarnya akhirnya apa ya andai saja
  • 00:32:31
    tidak ada kita
  • 00:32:34
    tidak dengan misalnya yang pasta gitu ya
  • 00:32:37
    mereka berusaha untuk untuk meningkatkan
  • 00:32:39
    meningkatkan jumlah Marsha saudari
  • 00:32:42
    berbagai daerah Kemudian
  • 00:32:45
    apa ada promosi juga yang berasal dari
  • 00:32:47
    word of mouth itu ya si seri obrolan
  • 00:32:50
    dari omongan Oh Kuliah dimana disana
  • 00:32:52
    bagus itu kan promosi yang dilakukan
  • 00:32:55
    secara tidak langsung melalui apa
  • 00:32:57
    melalui mulut dari alumni atau tetap
  • 00:33:02
    mulut dari misalnya orangtua kali
  • 00:33:05
    ngobrol itu itu contohnya
  • 00:33:08
    nah ini kualitas data jadi nanti akan
  • 00:33:11
    sangat menentukan akurasi data di dan
  • 00:33:14
    kualitas data tadi akan sangat
  • 00:33:15
    menentukan hasil dari
  • 00:33:18
    data Warehouse mestica atau nanti
  • 00:33:21
    menjadi input bagi proses selanjutnya
  • 00:33:23
    Apakah itu mau dilakukan data maining
  • 00:33:26
    gitu ya karena data maining itu
  • 00:33:28
    didalamnya pasti ada namanya
  • 00:33:30
    preprocessing kualitas dari datangnya
  • 00:33:32
    ini kita akan sangat ditentukan dari
  • 00:33:34
    reprocessing nya dia artinya Pak Datanya
  • 00:33:37
    dia Tata yang sudah diproses dia olah
  • 00:33:40
    raga sangat menentukan jadi kita mainin
  • 00:33:42
    kita bisa menempel keputusan yang tepat
  • 00:33:46
    ya Iya salah satunya adalah data yang
  • 00:33:48
    dimasukkan datanya
  • 00:33:52
    Nah indikatornya apa indikator dari data
  • 00:33:56
    itu berkualitas tinggi pada beberapa
  • 00:33:58
    yang pertama adalah akurasi
  • 00:34:00
    datanya sesuai gitu ya
  • 00:34:03
    I Wayan dimasukkan itu sesuai benar
  • 00:34:06
    kemudian integrity
  • 00:34:08
    jadi datanya itu udah main integrity nya
  • 00:34:13
    bawa-bawa dia memang data yang
  • 00:34:15
    sebenarnya gitu yang dimasukkan memiliki
  • 00:34:18
    integritas
  • 00:34:19
    ndak bisa ditolak kemudian tipe data
  • 00:34:22
    juga jadi pendeta ini menentukan juara
  • 00:34:25
    kita sedang memberikan konten dari
  • 00:34:28
    kekangan terhadap datanya bahwa kau yang
  • 00:34:30
    masuk itu adalah alfanumerik atau inti
  • 00:34:33
    cerita atau desimal atau fade ya
  • 00:34:35
    kemudian konsistensi jika kode produksi
  • 00:34:38
    sambal dalam pameran 1234 maka oleh 1234
  • 00:34:42
    akan digunakan untuk semua produk sambal
  • 00:34:44
    dalam sistem kehidupan suspensi
  • 00:34:47
    Nah kemudian ada redudansi
  • 00:34:51
    Oh ya Jadi redudansi
  • 00:34:54
    kalau template basket akan tidak boleh
  • 00:34:57
    namanya juga sih tapi kalau ingin
  • 00:34:59
    maksudnya redudansi lebih dari satu
  • 00:35:01
    tempat penyimpanan artinya data Itu
  • 00:35:03
    disimpan di beberapa tempat
  • 00:35:05
    kemudian
  • 00:35:08
    completeness ini tidak ada file yang
  • 00:35:10
    hilang gitu ya jadi semuanya lengkap
  • 00:35:13
    kefir kolom ini indikator dari data
  • 00:35:18
    berkualitas ini ada operasi domain
  • 00:35:20
    integrity kemudian fitur Eta konser
  • 00:35:23
    konsistensi redudansi kemudian fitness
  • 00:35:26
    artinya tidak ada akhir yang hilang dan
  • 00:35:30
    semuanya lengkap
  • 00:35:33
    baru-baru ini katanya
  • 00:35:36
    kemudian duplikasi ya Nah jika diketahui
  • 00:35:40
    ada record yang sama maka
  • 00:35:42
    duplikat akan diidentifikasi jadi ini
  • 00:35:45
    kan penting juga ya Jadi kalau redudansi
  • 00:35:47
    itu pengulangan dibeberapa tempat kalau
  • 00:35:50
    duplikasi ini ada data yang
  • 00:35:54
    Hai
  • 00:35:55
    kemudian conformance of the Bistro jadi
  • 00:35:59
    mengikuti rapat bisnis rule ya Jadi
  • 00:36:01
    aturan-aturan bisa itu
  • 00:36:04
    ikuti ya kemudian ada namanya data
  • 00:36:07
    anomali Jadi biasanya itu aja
  • 00:36:10
    kecenderungan data yang tidak tidak
  • 00:36:12
    tidak biasa gitu ya jadi ada misalnya ya
  • 00:36:15
    kebiasaan adat dari 10 orang itu 10 nya
  • 00:36:19
    itu mengikuti ke sebelah kanan tapi
  • 00:36:21
    ternyata ada yang tiba-tiba punya tips
  • 00:36:23
    beban tersendiri itu namanya datang
  • 00:36:26
    kemudian ya kalau bisa datang namanya
  • 00:36:28
    sedikit ya kemudian perlu dilihat Kenapa
  • 00:36:30
    dia terjadi anomali gitu ya terbiasa
  • 00:36:34
    peteg kejadian tidak biasanya dia Kenapa
  • 00:36:37
    itu perlu dilihat data normally
  • 00:36:40
    kemudian kristalivy artinya jelas ya
  • 00:36:44
    clear gitu Ya jelas nyatanya
  • 00:36:47
    kemudian tahun melihat Oh dia punya
  • 00:36:49
    tangan series didata itu kan bisanya
  • 00:36:51
    saya
  • 00:36:52
    sekarang ya mau memprediksi hari ini ke
  • 00:36:55
    ini tanggal 15 Mar 15 Nov gitu ya neng
  • 00:36:58
    gitu ya Nah kayak mau memprediksi Apakah
  • 00:37:01
    hari ini hujan atau tidak maka ada data
  • 00:37:03
    namanya Tengker resign gitu ya didata
  • 00:37:06
    yang kita kumpulkan dari tahun
  • 00:37:08
    2000-2002 satu
  • 00:37:10
    2020 bahwa di tanggal 15 sampai begitu
  • 00:37:14
    ya kalau sekarang kita lihat ya Google
  • 00:37:16
    itu kan menggunakan data time-series dia
  • 00:37:18
    Jadi kalau kita lihat hari ini Kalau
  • 00:37:20
    katanya itu hadir hari ini kalau
  • 00:37:22
    cuacanya itu
  • 00:37:23
    ujian Apa
  • 00:37:25
    lihat dulu mana nih cuaca
  • 00:37:30
    ya Ada dia
  • 00:37:32
    eh
  • 00:37:41
    kocak
  • 00:37:44
    jadi hari ini katanya hari ini hujan
  • 00:37:47
    dengan
  • 00:37:48
    besok badai petir Rabu hujan dengan itu
  • 00:37:53
    di kita bisa Hai sebelum beraktivitas
  • 00:37:55
    hari ini Uh hari ini akan hujan ringan
  • 00:37:57
    hatinya ya kecil Ngejek aja ini
  • 00:38:00
    Bagaimana Google bisa ya tadi
  • 00:38:02
    berdasarkan apa berdasarkan
  • 00:38:05
    data yang diinputkan secara Tan seri
  • 00:38:11
    kemudian Yusuf fullness artinya
  • 00:38:13
    kebergunaan
  • 00:38:16
    kemudian yang ke-13 mengikuti aturan
  • 00:38:19
    integrity rule integritas data tadi
  • 00:38:22
    country miliki kelinci gitu ya jika
  • 00:38:25
    misalnya di sana di-update yakni
  • 00:38:27
    terakhir itu-itu saja detik ini biasa
  • 00:38:31
    konsumsi database
  • 00:38:34
    nah kemudian keuntungan meningkatkan
  • 00:38:37
    kualitas peta yang jelas analysis with
  • 00:38:39
    Andy tadi siapa kita bisa melihat ya kan
  • 00:38:42
    secara periodik itu ya ya periskop dari
  • 00:38:46
    2000 tahun datawarehouse kan data yang
  • 00:38:50
    dikumpulkan di satu tempat gitu ya ke
  • 00:38:53
    gudang data di akan bukan data itu dari
  • 00:38:56
    periode tahun berapa sampai berapa kan
  • 00:38:57
    tanda tanya Mbak sangat besar sekali
  • 00:39:00
    gitu ya
  • 00:39:01
    itu yang menjadi basis dari data mining
  • 00:39:03
    jadi kita mainin itu
  • 00:39:07
    kita baru bisa melakukan data main itu
  • 00:39:09
    ketika misalnya datanya kita sudah
  • 00:39:11
    banyak kalau misalnya datanya 100 yang
  • 00:39:13
    yang belum bisa melakukan datanya ini
  • 00:39:15
    maka
  • 00:39:17
    keuntungan meningkatkan kualitas data
  • 00:39:19
    yaitu analysis with friendly kemudian
  • 00:39:21
    pelayanan pelanggan lebih baik salah
  • 00:39:23
    satunya kalau misalnya perusahaan yang
  • 00:39:25
    memberikan pelayanan yang baik Kalau
  • 00:39:27
    jadi kalau unsur yang memberikan
  • 00:39:28
    pelayanan ke dosen kemajuan ke folder
  • 00:39:31
    dengan baik berdasarkan apa data
  • 00:39:32
    masukanya tadi ya cuma kadang data yang
  • 00:39:36
    dimasukkan itu data yang tidak
  • 00:39:37
    berkualitas tadi tidak akurat tadi ya di
  • 00:39:40
    informasi yang keluar ya Informasi yang
  • 00:39:42
    tidak berat kalau misalnya datanya
  • 00:39:44
    akurat itu kan bisa dilihat pun ternyata
  • 00:39:46
    dosen Unsoed ya atau massa unsur gitu ya
  • 00:39:50
    pagi ya karena datanya kan tidak
  • 00:39:52
    dilakukan dengan benar yang
  • 00:39:54
    Hai di kalau di sistem formasi eksekutif
  • 00:39:57
    itu kan dia akan melihat tuh Factor bisa
  • 00:39:59
    melihat tuh Emas satu di masa tunggu
  • 00:40:03
    kemudian atau asal daerah yang mau Dian
  • 00:40:09
    orang tua misalnya gaji rata-rata orang
  • 00:40:12
    tua ngasiran orang tua tangan
  • 00:40:15
    ini bisa memberikan layanan atau jasa
  • 00:40:18
    yang lebih baik ke seekor dari orangtua
  • 00:40:21
    ke dosen-mahasiswa
  • 00:40:24
    lihat yang buat
  • 00:40:28
    nah masalah dalam kualitas data Iya ini
  • 00:40:33
    biasanya ada kalau kita mau misalnya
  • 00:40:36
    sistemnya saya pakai datanya Jambi nah
  • 00:40:38
    ini Gan jadi masalah ya jadi kadang itu
  • 00:40:42
    ada ada sistem yang menggoda menggunakan
  • 00:40:44
    data damai sedamai ya
  • 00:40:48
    kami pellu in field ini data yang Data
  • 00:40:51
    sementara Lex batas barangan yang
  • 00:40:53
    penting ada data
  • 00:40:54
    ceritanya kalau di web itu kita punya
  • 00:40:57
    errol lorem ipsum diametee Anita
  • 00:41:00
    data-data yang Jambi artinya pakai punya
  • 00:41:02
    teks Anda gitu ya kan dosa Kalau di ini
  • 00:41:06
    juga Tama ada data-data demi yang bisa
  • 00:41:09
    kita important gunakan gitu ya oleh juga
  • 00:41:11
    tapi hasilnya ketika kita menggunakan
  • 00:41:13
    data damai Yap ndak ngapalin nanti
  • 00:41:17
    artisnya Iya sama seperti kita melakukan
  • 00:41:20
    penelitian-penelitian boleh menggunakan
  • 00:41:22
    data dan dia baru saja lihat tapi data
  • 00:41:24
    dan itu digunakan hanya untuk sistem
  • 00:41:26
    tapi kalau misalnya untuk analisis tidak
  • 00:41:28
    tidak boleh dibiarkan apa ya data yang
  • 00:41:30
    dimasukkan harus data yang valid
  • 00:41:32
    kemudian nanti akan diuji ya Modelnya
  • 00:41:36
    akan diuji ditanyakan diuji
  • 00:41:39
    nilai data absen ya hanya data yang
  • 00:41:42
    dianggap penting yang ditekan tetap
  • 00:41:44
    menunggu lain seperti demografi kode pos
  • 00:41:46
    dan lain-lain tidak suka padahal mungkin
  • 00:41:49
    dibutuhkan gitu ya
  • 00:41:51
    penggunaan field yang tidak standar
  • 00:41:54
    Oh ya
  • 00:41:56
    biasanya komentar ada tambahan lain-lain
  • 00:42:00
    kemudian ada yang kontradiksi data
  • 00:42:03
    alamat Bekasi tetapi kode pos Ternate
  • 00:42:05
    Selatan ini kotanya
  • 00:42:07
    makan harusnya Harusnya diproses
  • 00:42:10
    akurasinya itu dan kita bisa membatasi
  • 00:42:12
    gitu ya ketika misalnya ya Eh
  • 00:42:16
    kecamatannya apa Purwokerto Barat ya
  • 00:42:18
    pasti provinsinya apa Jawa Tengah Jalan
  • 00:42:21
    itu sudah membatasi kadang kita misalnya
  • 00:42:24
    sana provinsi apa Jawa Tengah kemudian
  • 00:42:26
    pilih lagi Eh Kabupaten harus diapit
  • 00:42:30
    tamatan plus pilih lagi apa perubahan
  • 00:42:33
    terpilih lagi apa di bawahnya gitu Ya
  • 00:42:36
    tapi kan kalau misalnya kita dari awal
  • 00:42:38
    saja bisanya Pak Kelurahan sudah dapat
  • 00:42:40
    Kelurahan gimana perubahannya cover etos
  • 00:42:44
    sama Tantri Kecamatan mana Kecamatan
  • 00:42:46
    Purwokerto Barat otomatis nanti kita
  • 00:42:49
    tidak perlu lagi ngisi
  • 00:42:50
    provinsi tidak perlu isi lagi Kabupaten
  • 00:42:53
    atau kita gitu ya Kenapa otomatis
  • 00:42:56
    Purwokerto Barat ada dimana di Jawa
  • 00:42:58
    Tengah gitu ya di kabupaten apa Banyumas
  • 00:43:00
    itu kan itu adalah menjaga agar datanya
  • 00:43:04
    kita tetap akurat ya kan banyak yang
  • 00:43:07
    diperlakukan seperti itu ganti dalam
  • 00:43:08
    sistem yang kita kembangkan ya tidak
  • 00:43:10
    perlu lagi Mulyo kota kalau misalnya
  • 00:43:12
    Miss Miri otomatis kerennya hanya milik
  • 00:43:14
    provinsi provinsi Jawa tengah lautan
  • 00:43:16
    anda akan muncul semua daerah yang Mark
  • 00:43:18
    semua kabupaten yang ada di pilih
  • 00:43:21
    Banyumas Banyumas akan muncul semua
  • 00:43:23
    kecamatan yang ada di
  • 00:43:25
    ini harusnya itu kemudian ketika saya
  • 00:43:29
    memilih Purwokerto Barat otomatis Anda
  • 00:43:30
    tidak perlu memilih kode pos atau
  • 00:43:33
    misalnya saya memilih Desa otomatis
  • 00:43:35
    tidak perlu memilih kode oleh posay
  • 00:43:37
    karena otomatis itu sudah menyatu dengan
  • 00:43:39
    dengan desanya
  • 00:43:42
    Hai itu kontradiksi ini Kadang masalah
  • 00:43:45
    ini terjadi data damai gini tetap tidak
  • 00:43:48
    data yang aksen ini ternyata absen yang
  • 00:43:50
    tidak ada gitu ya Bukan aku kan absen
  • 00:43:53
    dan misteri ini maksudnya data yang
  • 00:43:54
    absen data yang tidak ada tidak dianggap
  • 00:43:57
    penting gitu ya Elsanya demografi
  • 00:44:00
    kemudian kontradiksi
  • 00:44:03
    pemaksaan aturan bisnis nyanyikan Adik
  • 00:44:06
    kerja pegawai Apakah 365 hari
  • 00:44:10
    kemudian rius paint Ricky kemudian nan
  • 00:44:14
    unit identifier kemudian inkonsisten
  • 00:44:18
    Nilai Salah multi-purpose kemudian
  • 00:44:22
    integrasi integrasi yang kita inginkan
  • 00:44:24
    semuanya berawal dari database yang
  • 00:44:25
    tidak semangka jadi data yang benar itu
  • 00:44:29
    ya tergantung dari databasenya kita
  • 00:44:31
    konsistensi kaos trend yang kita berikan
  • 00:44:33
    gitu ya kalau misalnya kita sudah
  • 00:44:35
    menerapkan tekanan serangan harus Jun
  • 00:44:37
    kemudian harus angka atau harus
  • 00:44:40
    alfanumerik atau harus Hi Ho alfabet
  • 00:44:44
    saja Nah itu kan konser ini kita berikan
  • 00:44:46
    jadi nanti akan menentukan menentukan
  • 00:44:49
    apa menentukan luaran dari
  • 00:44:52
    kapasitasnya kita Nah itu akan menjadi
  • 00:44:56
    output atau input bagi proses yang lain
  • 00:44:59
    gitu ya kalau misalnya data keluar dari
  • 00:45:01
    misalnya sistem formasi Academy Kanada
  • 00:45:04
    datanya Ini masukkan nilai dan lain
  • 00:45:05
    sebagainya output dari sistem pemakai
  • 00:45:08
    informasi akademik pasti akan menjadi
  • 00:45:10
    input bagi proses sebagai sistem yang
  • 00:45:12
    lagi sedih kenapa pipeline tadi ya gan
  • 00:45:15
    sistem sebuah sistem terintegrasi tekan
  • 00:45:17
    sumber datanya kan bisa berasal dari
  • 00:45:19
    berbagai sistem
  • 00:45:22
    itu kemudian pantangannya apa ya sistem
  • 00:45:26
    konversinya harus disediakan
  • 00:45:29
    kemudian data enjing Sayang lama gitu ya
  • 00:45:32
    Bagaimana sistem terintegrasi heterogen
  • 00:45:36
    ya potensi data corrupt ya desain
  • 00:45:39
    database yang kurang bagus Hani
  • 00:45:41
    kedatangan kita tangan bagi Ayo kita
  • 00:45:43
    mendesain tidak mengikuti udah tanya
  • 00:45:45
    termasuk Teteh itu bisa masuk ya tapi
  • 00:45:48
    tidak dilakukan yang namanya bisa in
  • 00:45:50
    database yang baik-baik logical nya
  • 00:45:52
    maupun fisik siapa jika yang salah ya
  • 00:45:54
    salah ya kemudian informasi entry data
  • 00:45:58
    tidak lengkap jadi ada beberapa kolom
  • 00:46:00
    yang boleh Kosong gitu ya
  • 00:46:04
    kemudian kesalahan dalam waktu
  • 00:46:06
    mendatangi batikan beli
  • 00:46:07
    operator-operator salah harusnya ada-ada
  • 00:46:10
    ketika operator itu salah harus ada
  • 00:46:13
    validasi dari kita ada verifikasi data
  • 00:46:15
    dari sistem
  • 00:46:17
    kemudian lingkup usaha semakin besar
  • 00:46:19
    dulu lokal menjadi kemudian menjadi
  • 00:46:22
    internet ini juga tantangan-tantangan
  • 00:46:24
    ketika misalnya eh sebuah perusahaan
  • 00:46:28
    yang dulunya lokal kemudian menjadi
  • 00:46:30
    internasional yang akan dipilih oleh
  • 00:46:32
    banyak orang ya yang dulunya dia hanya
  • 00:46:35
    meng-cover Indonesia hanya mencantumkan
  • 00:46:38
    mencantumkan al-fath misalnya data-data
  • 00:46:41
    provinsi ya sekarang dia harus
  • 00:46:44
    mencantumkan data negara
  • 00:46:47
    Nah kalau misalnya seperti itu kan
  • 00:46:49
    harusnya solusinya apa ya dari awal
  • 00:46:51
    desain awalnya itu kan harus melihat
  • 00:46:54
    bahwa kita akan melakukan scale-up
  • 00:46:55
    Jadinya apa tidak hanya di lingkup
  • 00:46:59
    internasional gitu ya Tapi bisa jadi
  • 00:47:01
    lingkup internasional maka Salatnya ya
  • 00:47:04
    harus menyimpan apa harus punya database
  • 00:47:07
    atau Nyi tabel-tabel negara it negara
  • 00:47:10
    ini
  • 00:47:12
    punya provinsi apa saja itu tantangan
  • 00:47:16
    terkait dengan data
  • 00:47:18
    ini validasi ya ini ini saja sih nih
  • 00:47:22
    kaitanya sama database Gita yang kalian
  • 00:47:24
    pelajari di
  • 00:47:25
    berkata ini akibat data yang kualitasnya
  • 00:47:29
    rendah gitu ya hebat dividen atau
  • 00:47:32
    keputusan yang jelek
  • 00:47:34
    kesempatan bisnis hilang jelas
  • 00:47:36
    bahwa Sekarang semua berbasis data es
  • 00:47:41
    tara-tara itu base nyata go-jek itu bisa
  • 00:47:44
    memberikan rekomendasi ketika Ya bosnya
  • 00:47:46
    data yang mereka punya data analysis
  • 00:47:48
    jadi data science sendiri gitu ya Nah
  • 00:47:51
    itu kan gajinya datang Saya sebesar
  • 00:47:54
    kepanikan dan ongkos yang tinggi itu ya
  • 00:47:57
    resmi
  • 00:47:58
    redundant yang tidak diperlukan laporan
  • 00:48:01
    yang tidak konsisten kemudian butuh
  • 00:48:03
    waktu untuk memperbaiki dia datanya
  • 00:48:06
    Butuh waktu
  • 00:48:07
    ini akibat kualitas data yang
  • 00:48:12
    Nah kita perlu yang namanya dua data
  • 00:48:15
    Quality Tools ya jadi penemuan data
  • 00:48:17
    error jadi harus ada mungkin ya tools
  • 00:48:20
    yang bisa digunakan untuk menangani
  • 00:48:22
    ketidak akurat yang dan
  • 00:48:24
    ketidakkonsistenan
  • 00:48:26
    kemudian penemuan data collection kau
  • 00:48:30
    menangis data yang korup ya di harus
  • 00:48:34
    bisa mengkoreksi datanya steroid
  • 00:48:36
    diperbaiki ya operasinya diperbaiki
  • 00:48:38
    tidak konsistennya diperbaiki itu
  • 00:48:41
    lihat ada Hai hai
  • 00:48:43
    itu terkait dengan data silakan ada
  • 00:48:46
    pertanyaan yg
  • 00:48:50
    Hai untuk COD kualitas data dari data
  • 00:48:54
    whose jadi eh sangat penting ya bahwa
  • 00:48:57
    kita harus punya data yang berkualitas
  • 00:48:59
    karena data itu akan menjadi sumber
  • 00:49:01
    utama dalam proses ketika atau dalam
  • 00:49:06
    kita mengambil sebuah
  • 00:49:09
    di Kenapa kita melakukan validasi di
  • 00:49:11
    awal pekerjaan awal itu berat tapi
  • 00:49:15
    ketika sudah dijalankan dia akan
  • 00:49:17
    menghasilkan informasi yang baik yang
  • 00:49:19
    benar yang akurat informalitas
  • 00:49:22
    ada enam kita males melakukan validasi
  • 00:49:24
    yang membuat validasi ya
  • 00:49:28
    Wih dengan kita membuat validasi di awal
  • 00:49:31
    pekerjaan selanjutnya terlebih
  • 00:49:34
    Indonesia baik ada pertanyaan
  • 00:49:38
    every anniv Indah Holy Michael jok masih
  • 00:49:45
    hadir semua ya
  • 00:49:46
    Sabrina
  • 00:49:48
    Hadir semua hadir Pak Terima kasih
  • 00:49:53
    hadir lebih luas yakni agrifina
  • 00:50:00
    Dirty akan
  • 00:50:02
    nyawa Bagas
  • 00:50:08
    Bagas Prasetya
  • 00:50:12
    Salma Arum
  • 00:50:13
    [Musik]
  • 00:50:14
    hadir Pak udah instan Naufal
  • 00:50:22
    akhir-akhir Pak Halo Ya
  • 00:50:27
    kita hadir bisa
  • 00:50:29
    hadir Pak Wildan
  • 00:50:34
    Wildan Adit
  • 00:50:37
    tadi tinggal saya berarti
  • 00:50:42
    rafiadi Rabi
  • 00:50:44
    hadir bak
  • 00:50:48
    Dahlia Dendi hadir Pak ya
  • 00:50:55
    Hai video bugil Andhika bisa Rustam
  • 00:50:58
    hadit
  • 00:50:59
    hadir Pak
  • 00:51:01
    Uni hadir demi
  • 00:51:04
    hadirat
  • 00:51:05
    Oke belakang jika ada pertanyaan terkait
  • 00:51:08
    dengan data yang berkualitas jadi
  • 00:51:12
    eh nanti kalau misalnya kalian belajar
  • 00:51:15
    explaining data maining gitu ya data itu
  • 00:51:17
    penting sekali atau kalian banget buat
  • 00:51:20
    pengembangan sistem sistem yang yang
  • 00:51:23
    kaitanya dengan data yang dilakukan
  • 00:51:25
    proses analisis itu penting sekali
  • 00:51:28
    data-data ya ada yang berkualitas data
  • 00:51:33
    yang akurat kalau misalnya kita sedang
  • 00:51:35
    melakukan validasi tidak jadi masalah
  • 00:51:37
    itu nama itu ya kolom-kolom yang wajib
  • 00:51:40
    diisi gitu ya
  • 00:51:41
    kemudian Lupa kode pos kode pos kan bisa
  • 00:51:45
    konflik mengikat gimana di sisanya tadi
  • 00:51:49
    biasanya kode pos itu apa Israel
  • 00:51:52
    Kelurahan Ya
  • 00:51:53
    udah hanya Hai yang kurang ini dipilih
  • 00:51:56
    otomatis kodoknya kok dia tidak fungsi
  • 00:51:58
    kode pos
  • 00:51:59
    baik Kalau tidak ada pertanyaan saya ini
  • 00:52:03
    bertanya Pak 85
  • 00:52:06
    terkait tadi yang mau bilang eh yang
  • 00:52:09
    perubahan-perubahan kemudian data aja
  • 00:52:11
    ingin bertanya Pak saya kita bikin
  • 00:52:13
    database yaitu dalam bentuk
  • 00:52:15
    bukan tabel gitu pakai bentuknya yang
  • 00:52:18
    naskia gitu seperti berada bentuk objek
  • 00:52:20
    atau misalnya dalam bentuk grafik lupa
  • 00:52:21
    nah itu apakah kita harus merubahnya
  • 00:52:24
    dari bentuk Eta diamkan dapat tabel dulu
  • 00:52:27
    atau bisa langsung diolah gitu untuk
  • 00:52:29
    didata Welas Asih oke nah Ini kan yang
  • 00:52:34
    jadi pertanyaan trainee Jadi apakah data
  • 00:52:37
    Warehouse itu sumber datanya selalu dari
  • 00:52:39
    tabel relasional jawabannya Kan tidak
  • 00:52:41
    bawa kemarin itu kita bisa berasal dari
  • 00:52:44
    Steve kemudian bisa berasal dari
  • 00:52:47
    database relasional Nikita dari mahecell
  • 00:52:50
    dan lain sebagainya kemudian juga ada
  • 00:52:52
    bisa dari kyaknya pak ya menggunakan
  • 00:52:55
    struktur normalisasi gitu Ya nah tapi
  • 00:52:58
    yang perlu kita lakukan paling
  • 00:53:00
    verifikasi awal itu terkait dengan
  • 00:53:02
    inputannya ikan jadi kalau itu kan hanya
  • 00:53:04
    sebagai strukturnya saja Nah sekarang
  • 00:53:06
    Dimas atau Bimas tinggal ini pasti saja
  • 00:53:10
    melakukan verifikasi terhadap
  • 00:53:12
    inputannya jadi ketika itu dimasukkan
  • 00:53:15
    kalau dia sebagai sebuah ekspresi text
  • 00:53:17
    editors Bagaimana caranya ya tinggal di
  • 00:53:19
    aplikasinya saja kalau misalnya Tinggal
  • 00:53:21
    di Konvensi saja kalau misalnya proses
  • 00:53:24
    konversi itu ya tidak nanti proses di
  • 00:53:27
    ininya saja detailnya itukan jadi ketika
  • 00:53:30
    kita melakukan ekstrak kemudian kita
  • 00:53:32
    lutfian untuk digunakan ya tapi di sana
  • 00:53:35
    kosnya kalau untuk pemurnian datanya
  • 00:53:37
    koreksi datanya ya tinggal di
  • 00:53:39
    aplikasinya kita saja memastikan bahwa
  • 00:53:41
    data yang dimasukkan ke dalam anus
  • 00:53:44
    skillnya kita atau ke dalam database
  • 00:53:46
    objects yaitu Bahwa data yang sudah
  • 00:53:49
    benar sudah valid
  • 00:53:51
    bisa begitu jawabannya Arizky jadi tidak
  • 00:53:55
    Lebih banget tidak perlu dikonversi
  • 00:53:57
    menjadi database relasional karena
  • 00:53:59
    konsepnya bukan database relasional gitu
  • 00:54:01
    karena kita memang gunakan
  • 00:54:03
    yang datanya yang masuk aja kalau map
  • 00:54:06
    itu saja ide komentar kemudian teks
  • 00:54:08
    keterangan dan lain sebagainya gitu ya
  • 00:54:10
    tapi yang perlu diverifikasi adalah
  • 00:54:13
    bahwa yang dimakan tidak typo tidak
  • 00:54:16
    eh harus atau collection Adya
  • 00:54:22
    ya
  • 00:54:22
    seperti itu kini baik terima kasih Pak
  • 00:54:27
    silakan jika ada lagi
  • 00:54:34
    HP ya udah deh kalau tidak ada rasa
  • 00:54:37
    cukup ketemuannya kita hari ini silakan
  • 00:54:40
    nanti jangan lupa untuk prevensi baiklah
  • 00:54:46
    Hai pasti ndak bisa kangen-kangenan
  • 00:54:50
    dibales
  • 00:55:00
    oke Saya rasa cukup
  • 00:55:03
    sekian untuk hari ini Terima kasih atas
  • 00:55:07
    kehadirannya di jangan lupa untuk
  • 00:55:08
    presensi kelas atas biaya saya kiri kita
  • 00:55:12
    ketemu lagi minggu depan di
  • 00:55:16
    Iya penemuan atau diperkuliahan yang
  • 00:55:20
    ke-13 Terima kasih saya kiri sama
  • 00:55:23
    alaikum warahmatullahi wabarakatuh
  • 00:55:25
    Waalaikumsalam
  • 00:55:27
    warahmatullah wabarakatuh Terima kasih
  • 00:55:29
    Mbak Maya
  • 00:55:35
    Indonesia
Tag
  • data quality
  • data warehousing
  • data accuracy
  • decision-making
  • data validation
  • data cleansing
  • business intelligence
  • data analysis
  • customer service
  • data management