Cara mengambil data dari toko online / marketplace (tokopedia, shopee, blibli) dengan web scraper

00:11:26
https://www.youtube.com/watch?v=mNyRLz92kkE

Resumo

TLDRVideo ini adalah tutorial tentang cara menggunakan ekstensi webscraper.io di Google Chrome untuk mengambil data dari situs web, khususnya blibli.com. Proses dimulai dengan membuka situs, membuat site map, dan menyusun selectors untuk data yang ingin diambil. Data yang dapat diambil termasuk nama produk, harga, dan alamat penjual. Pengguna harus memperhatikan pengaturan interval agar tidak kehilangan data, dan setelah proses selesai, hasil dapat diunduh dan disesuaikan.

Conclusões

  • 🛒 Webscraper.io membolehkan pengambilan data dari situs web secara otomatis.
  • 🔍 Proses dimulai dengan membuka situs dan mengatur elemen data yang diinginkan.
  • 📊 Site map dan selectors penting untuk mendapatkan data yang tepat.
  • 💻 Interval pengambilan data perlu disesuaikan untuk menghindari kehilangan informasi.
  • 📥 Hasil data dapat diunduh dalam format CSV untuk digunakan lebih lanjut.

Linha do tempo

  • 00:00:00 - 00:05:00

    Video ini membahas tentang teknik web scraping menggunakan ekstensi Google Chrome, webscraper.io, untuk mengambil data produk dari situs belanja online seperti blibli.com. Pengguna menunjukkan langkah-langkah untuk membuka situs, mengakses menu pengembang, dan menyusun peta situs (site map) untuk mengumpulkan data produk yang relevan, terutama makanan kucing. Data yang diambil termasuk harga, lokasi toko, dan nama produk. Proses ini melibatkan pemilihan elemen yang tepat di halaman web agar semua item produk dapat terambil secara menyeluruh dan tepat.

  • 00:05:00 - 00:11:26

    Setelah pengaturan site map selesai, pengguna menjelaskan cara menentukan jenis data yang akan diambil dari setiap item produk, termasuk nama, harga, dan informasi penjual. Pengguna memberikan penjelasan teknis mengenai penggunaan fungsi scroll untuk memastikan semua produk pada halaman web diambil. Setelah proses scraping selesai, pengguna dapat mengunduh hasil dalam bentuk file yang dapat diproses lebih lanjut, misalnya dikompresi ke dalam format Excel untuk kemudahan analisis. Akhir video mengajak penonton untuk mencoba teknik ini dan menyampaikan bahwa pengalaman akan mengurangi kemungkinan kegagalan dalam pengambilan data.

Mapa mental

Vídeo de perguntas e respostas

  • Apa itu webscraper.io?

    Webscraper.io adalah ekstensi di Google Chrome yang digunakan untuk mengambil data dari situs web secara otomatis.

  • Bagaimana cara menggunakan webscraper.io?

    Anda dapat menginstal ekstensi webscraper.io, membuka situs web yang diinginkan, dan mengikuti langkah-langkah untuk menyiapkan selector dan site map.

  • Apa saja data yang bisa diambil menggunakan webscraper.io?

    Anda bisa mengambil berbagai data seperti nama produk, harga, alamat penjual, dan informasi lainnya tergantung pada web yang diambil.

  • Berapa lama waktu yang dibutuhkan untuk mengambil data?

    Waktu pengambilan data tergantung pada banyaknya data yang diambil dan interval yang disetel, biasanya dengan interval yang lebih lambat untuk memastikan semua data tertangkap.

  • Apa yang harus dilakukan setelah data diambil?

    Setelah mengambil data, Anda bisa mengunduhnya dalam format CSV dan menyesuaikannya jika perlu.

Ver mais resumos de vídeos

Obtenha acesso instantâneo a resumos gratuitos de vídeos do YouTube com tecnologia de IA!
Legendas
id
Rolagem automática:
  • 00:00:00
    Halo assalamualaikum warahmatullahi
  • 00:00:05
    wabarakatuh baik kali ini saya mau coba
  • 00:00:09
    bank sharing Bagaimana manuskrip tingjat
  • 00:00:12
    atau mengambil data dari website atau
  • 00:00:17
    toko online dengan menggunakan website
  • 00:00:23
    eh disini saya menggunakan ekstensi di
  • 00:00:27
    Google Chrome webscraper.io bisa
  • 00:00:31
    download di Google Chrome
  • 00:00:36
    Hai Tayo
  • 00:00:44
    nge-rap
  • 00:00:46
    Hai ekstensinya dan bisa lebih Saputri
  • 00:00:53
    Google Chrome ini karena laptopnya sudah
  • 00:00:56
    diinstall kau jadi saudara websitenya
  • 00:01:00
    sekarang kita buka website Marquez siap
  • 00:01:05
    datanya pengen tampil contoh blibli.com
  • 00:01:13
    Hai di blibli.com misal kita mau tapi
  • 00:01:21
    Hai Rara mengambil daftar makanan kucing
  • 00:01:25
    contoh
  • 00:01:32
    Ayo kita pastikan ada banyak
  • 00:01:38
    produk-produk Riska dari berbagai macam
  • 00:01:41
    tokoh-tokoh tak mau ngambil data harga
  • 00:01:44
    atau lokasi tokonya 101 mungkin akan
  • 00:01:48
    memakan waktu yang cukup lama di nah
  • 00:01:51
    Bagaimana cara kita mengambil datanya
  • 00:01:54
    secara otomatis menggunakan website per
  • 00:01:58
    eh pertama kita buka websitenya dulu
  • 00:02:04
    dengan mengklik tombol F12
  • 00:02:09
    Hai di sini muncul menu webscraper.io
  • 00:02:16
    kulit aja
  • 00:02:18
    Hai dan untuk data-data item produk yang
  • 00:02:21
    pengen kita ambil datanya disini bet
  • 00:02:26
    diurut berdasarkan relevansi contoh kita
  • 00:02:29
    mau ngambil data berdasarkan produk
  • 00:02:31
    terlaris kita sortir berdasarkan produk
  • 00:02:33
    terlaris
  • 00:02:36
    Oh ya Ada macam-macam produk termasuk
  • 00:02:41
    live chat dengan keyboard Whiskas
  • 00:02:44
    meskipun judulnya nowish nanti disortir
  • 00:02:48
    aja kalo pengen ngambil yang contoh
  • 00:02:52
    untuk produk Whiskas aja pertama kita
  • 00:02:56
    buat site map dulu
  • 00:02:59
    Hai di sini saat namanya rendem aja ya
  • 00:03:04
    Hai Tante
  • 00:03:07
    Hai ini produknya lumayan banyak ada
  • 00:03:14
    sekitar 1371 produk ini yang diurut
  • 00:03:18
    berdasarkan yang terlaris di yang paling
  • 00:03:21
    laris ada 490 Oke kita copy alamat
  • 00:03:28
    websitenya yang senantiasa sebagai acuan
  • 00:03:33
    buat ngambil datanya screen site Map
  • 00:03:37
    Ayo kita di sini kita bikin skelen
  • 00:03:45
    school dulu scroll
  • 00:03:50
    hai hai
  • 00:03:58
    hai hai
  • 00:04:00
    Hai met sore
  • 00:04:03
    Hai terpilih
  • 00:04:07
    hai hai
  • 00:04:09
    Ayo kita pilih area yang mencakup
  • 00:04:15
    produk-produk dayang yang ada dalam satu
  • 00:04:17
    halaman tersebut sudah ke cover semua
  • 00:04:21
    Udin gender pilih kita Sweep selector
  • 00:04:26
    kita tambahkan new selector lagi
  • 00:04:31
    sebentar kita lihat
  • 00:04:36
    Hai di sini
  • 00:04:40
    model tanya kita sedih 8000 karena 2000
  • 00:04:45
    terlalu cepet jadi takutnya Enggak
  • 00:04:48
    kekejer semua di halaman 1 halaman
  • 00:04:51
    website tersebut jadi disini saya set di
  • 00:04:54
    8000 disini harga Hapus dulu kita
  • 00:04:59
    tambahkan selector baru sektor baru itu
  • 00:05:02
    Ling produk-produk disini tipenya kita
  • 00:05:08
    pilih link dan selektornya modenya
  • 00:05:11
    muvi.top selanjutnya kita pilih produk
  • 00:05:14
    yang datanya mau kita ambil Pastikan
  • 00:05:18
    semua item produk pada halamannya satu
  • 00:05:21
    saudara terpilih semua
  • 00:05:27
    Ya udah yang kita Asep telah kita mau
  • 00:05:31
    mengambil data dari masing-masing item
  • 00:05:33
    ini kita klik dulu yang produk selector
  • 00:05:37
    produk link kita buka salah satu
  • 00:05:40
    link-nya karena disboard modelnya setiap
  • 00:05:45
    detiknya step di linknya aku copy paste
  • 00:05:48
    aja kecap sebelumnya saat Yoga muncul eh
  • 00:06:09
    halaman untuk aku ngasih Kita
  • 00:06:13
    tentukan data yang mau diambil Namun
  • 00:06:15
    kita mau mengambil nama voda.com kita
  • 00:06:21
    pilih
  • 00:06:27
    Hai Mukti filenya nggak usah dicentang
  • 00:06:29
    seperti
  • 00:06:30
    Hai muncul pondoknya yang selanjutnya
  • 00:06:32
    kita pilih harga-harganya kita pilih
  • 00:06:39
    typenya semuanya text
  • 00:06:42
    Hai dengan kita pengen mengambil data
  • 00:06:50
    penjualannya juga informasi
  • 00:06:52
    Ayo kita pilih shoulder
  • 00:06:57
    Hai selanjutnya kita juga boleh
  • 00:07:06
    mengambil data nama toko
  • 00:07:11
    hai hai
  • 00:07:18
    hai hai
  • 00:07:20
    Hai kemudian kita ambil juga informasi
  • 00:07:25
    alamatnya address disini data previewnya
  • 00:07:40
    makanan kucing addressnya kota Jakarta
  • 00:07:45
    Barat semuanya sudah ada
  • 00:07:49
    Hai data review data capturenya dan kita
  • 00:07:55
    lihat selector grabnya dari alamat
  • 00:07:58
    halaman 1 tadi Dirut yang pertama kita
  • 00:08:02
    treatment dengan Scroll kita nge-review
  • 00:08:05
    satu halaman penuh ditambahkan fungsi
  • 00:08:08
    Scroll karena kalau enggak ada
  • 00:08:10
    ditambahkan fungsi Scroll dia hanya
  • 00:08:13
    mengkeb curling Link yang terdapat
  • 00:08:15
    dibagian atasnya aja yang di bawahnya
  • 00:08:18
    enggak bisa ke kecap Oleh karena itu
  • 00:08:21
    ditambahkan fungsi Scroll pada
  • 00:08:24
    Hai setelah itu baru dipilih link produk
  • 00:08:26
    dengan mode multiple jadi masing-masing
  • 00:08:29
    link produk akan diambil nama produknya
  • 00:08:33
    harga jumlah yang terjual nama tokonya
  • 00:08:36
    dan alamatnya di sini namanya saya
  • 00:08:39
    rendam aja Bikinnya singkat-singkat aja
  • 00:08:41
    dan kemudian kita pilih script-script
  • 00:08:48
    direquest intervalnya saya set di
  • 00:08:51
    Rp8.000 feat slotnya juga Rp8.000 karena
  • 00:08:55
    kalau diset di 2000 itu lotnya terlalu
  • 00:09:00
    cepet jadi patchnya belum Kelud secara
  • 00:09:04
    sempurna dia udah ganti kvit selanjutnya
  • 00:09:06
    jadi yang di PC itu enggak semua data
  • 00:09:10
    bakal ke kacer untuk Rp8.000 berdasarkan
  • 00:09:13
    experiences sudah cukup untuk mengecat
  • 00:09:16
    datanya dengan risiko kegagalan yang
  • 00:09:19
    lebih kecil Oke kita mulai striping aja
  • 00:09:24
    Hai diam keperakan homeset dulu yang
  • 00:09:31
    kata kunci Ustaz dengan sopir terlaris
  • 00:09:36
    untuk halaman pertama sudah sendal out
  • 00:09:44
    Hai sudah loading
  • 00:09:48
    our special mulai sekopol karena kita
  • 00:09:51
    ditambahkan fungsi scope
  • 00:09:55
    Hai untuk memastikan semua item produk
  • 00:09:57
    pada halaman shawbucker kecap mod
  • 00:10:12
    Hai selanjutnya dia mulai memotong buka
  • 00:10:15
    link kalau ndak satu persatu yang tadi
  • 00:10:20
    fakturnya diset tebal 8000 menyelesaikan
  • 00:10:27
    vasfmc kompasnya us udah kebuka sempurna
  • 00:10:31
    dia memang Secret minta itu paruh ganti
  • 00:10:37
    selanjutnya sampai Muara Saudara pada
  • 00:10:40
    halaman 1 keepshare semua Oke banget
  • 00:10:44
    bikin sporty putih ketika selesai kita
  • 00:10:47
    bisa download filenya dalam mode kyb
  • 00:10:50
    kalau teman-teman ke Jakarta Aku ingin
  • 00:10:57
    atas kesini cuma atau omsetnya ujung
  • 00:11:02
    twsbi capello jdinya bisa dikontrol dulu
  • 00:11:05
    kalau siulnya hasil CSB nya jelek Jadi
  • 00:11:10
    harus dikompres dulu ke Excel biar
  • 00:11:12
    Hai datanya jadi lebih diparut diskotik
  • 00:11:15
    oke sekian teman-teman tepatnya
  • 00:11:18
    peradapan kecelakaan Comment and check
  • 00:11:24
    out
Etiquetas
  • webscraping
  • data extraction
  • webscraper.io
  • Google Chrome
  • blibli.com
  • tutorial
  • data otomatis
  • CSV
  • nama produk
  • harga produk