Studi Kasus SQL ke DF

Ini hanya sebuah studi kasus latihan agar terbiasa menggunakan Data Frame. Kalau saya pribadi lebih menyukai SQL dibanding Data Frame karena kemudahannya. Pada Data Frame terlalu banyak model yang membuat pemula mudah lupa atau bingung.

1
2
3
4
5
SELECT Produk_Kategori, Jenis_Kelamin,   COUNT(ID) AS Jumlah
    FROM retail
    WHERE Usia >= 17 AND Kepuasan > 2
    GROUP BY Produk_Kategori, Jenis_Kelamin
    ORDER BY Produk_Kategori DESC, Jenis_Kelamin ASC

dan berikut data framenya

1
2
3
4
5
6
7
8
9
10
import pandas as pd
# Membaca data dari file CSV
df = pd.read_csv(data_csv)
# Melakukan filter berdasarkan kondisi Usia >= 17 dan Kepuasan > 2
df = df[(df['Usia'] >= 17) & (df['Kepuasan'] > 2)]
# Melakukan group by dan menghitung jumlah ID untuk setiap Produk_Kategori dan Jenis_Kelamin
result_df = df.groupby(['Produk_Kategori', 'Jenis_Kelamin']).agg(Jumlah=('ID', 'count')).reset_index()
# Mengurutkan berdasarkan Produk_Kategori secara descending dan Jenis_Kelamin secara ascending
result_df = result_df.sort_values(by=['Produk_Kategori', 'Jenis_Kelamin'], ascending=[False, True])
print(result_df)