Data Palsu (Fake Data) Buat Simulasi

Tadi saya minta tolong kepada ChatGPT untuk membuatkan data dummy yang isinya nama, nomor telp dan alamat. Namun saya malah dikasih contoh skrip Pythn untuk masalah ini.

Data dummy seperti ini bagi saya penting karena ketika kita ingin membuat simulasi, atau training, atau aplikasi kita membutuhkan data contoh.

import random
import faker
import pandas as pd

# Inisialisasi Faker
fake = faker.Faker('id_ID')

# Membuat 100 data acak
data_list = []
for _ in range(100):
    nama = fake.name()
    nomor_hp = fake.phone_number()        
    alamat = fake.address().replace("\n", " ")
    
    data_list.append({
        'Nama': nama,
        'Nomor HP': nomor_hp,
        'Alamat': alamat
    })

df = pd.DataFrame(data_list)
df.to_csv('alamat.csv')
print('Generate data selesai')

Hasilnya cukup bagus, sayangnya data antar kolom tidak berelasi, sehingga city() Surabaya namun state() Jawa Barat, Lah …

Tapi ya lumayanlah buat sekedar mainan.

Baca dokumentasinya disini. Atau tulisan tentang Faker disini .