Panduan Lengkap: Cara Mengekstrak Dataset CSV dengan PostgreSQL

Panduan Lengkap: Cara Mengekstrak Dataset CSV dengan PostgreSQL

Panduan Lengkap: Cara Mengekstrak Dataset CSV dengan PostgreSQL

CSV (Comma-Separated Values) adalah format data paling umum digunakan karena sederhana dan kompatibel dengan banyak aplikasi. Namun, ketika dataset berukuran besar digunakan untuk analisis—misalnya data e-commerce atau review produk—PostgreSQL menjadi pilihan ideal untuk menyimpan, mengelola, dan mengekstrak data dengan lebih efisien.

Langkah 1: Persiapan Awal

Sebelum mulai, pastikan:

  • PostgreSQL & PgAdmin sudah terinstal (versi ≥14 disarankan).
  • File CSV tersedia di folder yang mudah diakses.
  • Periksa delimiter CSV (;, ,, atau tab \t) menggunakan editor teks.

👉 Tips: Selalu cek encoding file (UTF‑8) agar tidak terjadi error saat impor.

Langkah 2: Membuat Tabel di PostgreSQL

Sebelum mengekstrak data, buat tabel sesuai struktur CSV dari dataset file yang ada. Pastikan antara nama tabel tidak menggunakan spasi. Kemudian untuk tipe datanya sesuaikan dengan jenis data yang digunakan. Contoh:

CREATE TABLE reviews (

    review_id SERIAL PRIMARY KEY,

    customer_name TEXT,

    product_name TEXT,

    rating INTEGER,

    review_date TIMESTAMP

);

Langkah 3: Mengimpor CSV ke PostgreSQL

Lakukan impor data untuk 7 file yang ada di dalam dataset. Jika terjadi error, cek kembali tipe data, parameter variabel, dan tipe delimiternya.

Langkah 4: Mengekstrak dan menampilkan data

Pada tutorial ini, kita akan menggabungkan beberapa data menjadi satu data yang siap kita upload ke Power BI Dashboard.

  • Gunakan LEFT JOIN antara tabel website_sessions dan orders.
  • Join dilakukan berdasarkan session_date dan order_date agar hasil paralel di kedua tabel.
  • Gunakan fungsi COALESCE untuk mengganti nilai NULL menjadi 0.

Langkah 5: Simpan hasil ekstraksi ke format data CSV

Setelah data selesai diekstrak maka kita simpan Kembali data ke dalam format CSV untuk kedepannya untuk diupload ke Power BI.

Langkah 6: Simpan query untuk penggunaan rutin

Agar proses ekstraksi bisa dilakukan secara berkala:

  • Simpan query di file .sql.
  • Gunakan script otomatis (misalnya cron job) untuk menjalankan query secara rutin.

Dengan mengikuti langkah-langkah di atas, kamu dapat mengekstrak dataset CSV menggunakan PostgreSQL secara efisien dan terstruktur. Mulai dari persiapan, pembuatan tabel, hingga ekspor hasil ke CSV—semua proses ini akan membantu kamu membangun pipeline data yang siap digunakan untuk analisis dan visualisasi di Power BI.

Comments

No comments yet. Why don’t you start the discussion?

Leave a Reply

Your email address will not be published. Required fields are marked *