Ini hanya sebuah studi kasus latihan agar terbiasa menggunakan Data Frame. Kalau saya pribadi lebih menyukai SQL dibanding Data Frame karena kemudahannya. Pada Data Frame terlalu banyak model yang membuat pemula mudah lupa atau bingung.
1 2 3 4 5 | SELECT Produk_Kategori, Jenis_Kelamin, COUNT(ID) AS Jumlah FROM retail WHERE Usia >= 17 AND Kepuasan > 2 GROUP BY Produk_Kategori, Jenis_Kelamin ORDER BY Produk_Kategori DESC, Jenis_Kelamin ASC |
dan berikut data framenya
1 2 3 4 5 6 7 8 9 10 | import pandas as pd # Membaca data dari file CSV df = pd.read_csv(data_csv) # Melakukan filter berdasarkan kondisi Usia >= 17 dan Kepuasan > 2 df = df[(df['Usia'] >= 17) & (df['Kepuasan'] > 2)] # Melakukan group by dan menghitung jumlah ID untuk setiap Produk_Kategori dan Jenis_Kelamin result_df = df.groupby(['Produk_Kategori', 'Jenis_Kelamin']).agg(Jumlah=('ID', 'count')).reset_index() # Mengurutkan berdasarkan Produk_Kategori secara descending dan Jenis_Kelamin secara ascending result_df = result_df.sort_values(by=['Produk_Kategori', 'Jenis_Kelamin'], ascending=[False, True]) print(result_df) |