Data Engineers, Data Scientist, Data Analyst dalam Sebuah Kisah

Di sebuah perusahaan besar yang bergerak di industri penjualan motor, ketiga tim yang berbeda bekerja bersama untuk mengoptimalkan kinerja bisnis mereka. Di kantor pusat yang sibuk, seorang data engineer bernama Ario duduk di depan layar komputernya, sibuk merancang dan mengelola infrastruktur data perusahaan. Dia memastikan bahwa semua data dari berbagai sumber – mulai dari transaksi penjualan hingga data pelanggan – mengalir dengan lancar ke dalam sistem mereka. Hari ini, dia sedang fokus memperbaiki masalah kinerja pada server basis data, memastikan bahwa tim data dapat mengakses data yang diperlukan dengan cepat dan efisien.

Sementara itu, di ruang rapat sebelah, seorang data scientist bernama Maya tengah terbenam dalam analisis data. Dikelilingi oleh grafik dan diagram, dia sedang mengeksplorasi tren penjualan motor dari tahun ke tahun. Maya berusaha untuk mengidentifikasi pola-pola yang dapat memberikan wawasan berharga kepada manajemen perusahaan. “Pada bulan lalu, penjualan model tertentu meningkat tajam di wilayah barat,” gumamnya sambil memeriksa grafiknya. “Apa yang menyebabkan lonjakan ini?” Dengan menggunakan teknik analisis data yang canggih, Maya mencoba memahami faktor-faktor yang mendorong perubahan ini, dengan harapan dapat memprediksi tren masa depan.

Sementara itu, di lantai yang lebih bawah, seorang data analyst bernama Rani sedang duduk di meja kerjanya, menyusun laporan harian tentang kinerja penjualan. Dia telah menyortir data transaksi untuk hari ini, mengidentifikasi penjualan terbesar dan tren pembelian pelanggan. Dengan cermat, dia memformat data dalam laporan yang mudah dimengerti, dengan grafik yang menarik dan tabel yang rapi. Rani tahu bahwa laporan ini akan menjadi dasar bagi manajemen perusahaan dalam pengambilan keputusan strategis.

Saat sore mulai menjelang, ketiga tim bertemu dalam ruang konferensi untuk berbagi hasil pekerjaan mereka. Ario menjelaskan perbaikan yang dia lakukan pada infrastruktur data, sementara Maya dan Rani berbagi wawasan baru yang mereka temukan dari analisis mereka. Bersama-sama, mereka membentuk tim yang kuat, bekerja untuk menyempurnakan penggunaan data dalam perusahaan mereka, dan pada gilirannya, meningkatkan kinerja dan keuntungan perusahaan secara keseluruhan. Dengan kolaborasi mereka, perusahaan penjualan motor ini siap menghadapi tantangan yang akan datang dan terus berkembang dalam pasar yang kompetitif. (oai)

Langkah-langkah Penggunaan Data Science: Studi Kasus Penjualan

Data Science bagaikan sebuah peta harta karun bagi tim penjualan. Dengan menganalisis data, tim penjualan dapat menemukan peluang baru, memahami perilaku pelanggan, dan meningkatkan strategi penjualan mereka. Berikut langkah-langkah penggunaan Data Science dalam kasus penjualan:

1. Mengumpulkan Data:

Langkah pertama adalah mengumpulkan data yang relevan dari berbagai sumber, seperti:

  • Data Transaksi: Riwayat pembelian, demografi pelanggan, dan nilai transaksi.
  • Data Interaksi: Interaksi pelanggan dengan website, email, dan media sosial.
  • Data Pasar: Tren pasar, data pesaing, dan kondisi ekonomi.

2. Membersihkan dan Mempersiapkan Data:

Data yang terkumpul mungkin tidak terstruktur dan berantakan. Oleh karena itu, perlu dibersihkan dan dipersiapkan untuk analisis. Proses ini meliputi:

  • Menangani data yang hilang: Mengisi data yang hilang dengan nilai yang tepat.
  • Menghapus data yang tidak akurat: Menghilangkan data yang tidak valid atau tidak relevan.
  • Menstandarkan format data: Mengubah data ke format yang konsisten.

3. Menganalisis Data – Exploratory Data Analysis (EDA) :

Setelah data siap, berbagai teknik Data Science dapat digunakan untuk menganalisisnya, seperti:

  • Analisis Demografi: Memahami profil pelanggan dan target pasar.
  • Segmentasi Pelanggan: Membagi pelanggan ke dalam kelompok berdasarkan minat dan perilaku.
  • Analisis Perilaku Pelanggan: Memahami pola pembelian dan preferensi pelanggan.
  • Prediksi Permintaan: Memperkirakan permintaan produk di masa depan.

4. Menarik Kesimpulan dan Bertindak:

Berdasarkan hasil analisis, tim penjualan dapat menarik kesimpulan dan mengambil tindakan untuk meningkatkan penjualan, seperti:

  • Mengembangkan strategi pemasaran yang ditargetkan: Menawarkan produk yang tepat kepada pelanggan yang tepat.
  • Meningkatkan pengalaman pelanggan: Memberikan layanan yang lebih personal dan efisien.
  • Membuat keputusan yang lebih cerdas: Mengoptimalkan strategi penjualan berdasarkan data.

Contoh Implementasi:

  • Perusahaan e-commerce menggunakan Data Science untuk merekomendasikan produk kepada pelanggan berdasarkan riwayat pembelian mereka.
  • Tim penjualan B2B menggunakan Data Science untuk mengidentifikasi prospek yang paling potensial.
  • Perusahaan telekomunikasi menggunakan Data Science untuk meningkatkan retensi pelanggan dengan menawarkan paket yang sesuai dengan kebutuhan mereka.

Kesimpulan:

Data Science adalah alat yang ampuh untuk meningkatkan penjualan. Dengan menganalisis data, tim penjualan dapat memahami pelanggan mereka dengan lebih baik, membuat strategi yang lebih efektif, dan meningkatkan profitabilitas. (gai)

Apa Itu Data Science?

Data Science bagaikan sebuah kotak ajaib yang menyimpan berbagai rahasia. Di balik tumpukan data, terdapat pola dan pengetahuan tersembunyi yang dapat digali untuk membantu kita dalam berbagai aspek kehidupan.

Apa itu Data Science?

Data Science adalah ilmu yang menggabungkan matematika, statistik, dan pemrograman untuk menganalisis data, menemukan pola, dan membuat prediksi. Data Science membantu kita untuk memahami dunia di sekitar kita dengan lebih baik dan mengambil keputusan yang lebih cerdas.

Contoh Implementasi Data Science:

  • Rekomendasi Produk: Data Science digunakan untuk merekomendasikan produk yang mungkin Anda sukai berdasarkan pembelian Anda sebelumnya.
  • Deteksi Penipuan: Data Science membantu bank untuk mendeteksi transaksi penipuan dengan menganalisis pola transaksi nasabah.
  • Perawatan Kesehatan: Data Science membantu dokter untuk mendiagnosis penyakit dengan lebih akurat dan merekomendasikan pengobatan yang tepat.

Bagaimana Memulai dengan Data Science?

Jika Anda tertarik dengan Data Science, berikut beberapa langkah yang dapat Anda lakukan:

  1. Pelajari Dasar-dasarnya: Pelajari matematika, statistik, dan pemrograman.
  2. Pilih Alat yang Tepat: Ada banyak alat yang tersedia untuk Data Science, seperti Python, R, dan SQL.
  3. Berlatih dengan Data: Banyak dataset yang tersedia secara online untuk Anda pelajari dan praktikkan.
  4. Bergabung dengan Komunitas: Ada banyak komunitas Data Science online dan offline yang dapat membantu Anda belajar dan berkembang.

Kesimpulan:

Data Science adalah bidang yang menarik dan berkembang pesat dengan banyak potensi untuk digunakan dalam berbagai bidang. Dengan mempelajari Data Science, Anda dapat membantu memecahkan masalah dunia dan membuat dunia menjadi tempat yang lebih baik. (gai)

Sumber Daya:

Analisis data Penjualan dengan SQL

Beberapa waktu lalu saya menjumpai sebuah situs analisis data penjualan yang menarik minat saya di sebuah blog di medium . Kemudian saya ketahui bahwa sumber utama blog itu ada ada di Youtube Keith gali ini.

Dalam tulisan ini, saya menggunakan  sources yang ada di sini https://github.com/KeithGalli/Pandas-Data-Science-Tasks , untuk menggenerasi data.

Saya ingin melakukan analisis serupa, tapi hanya menggunakan SQLite via SQLiteStudio.

Iseng iseng saya menggenerate kembali dataset yang digunakan dengan pendekatan ke-Indonesiaan, yaitu dengan memodifikasi kota dan mata uang yang digunakan.

Saya menyatukan data bulanan berbentuk CSV yang dihasilkan oleh data generator yg dibuat Om Keith Galli, dan membersihkan datanya dengan Python, walaupun  untuk urusan membersihkan data, dengan SQL bisa juga, dimana kita cari kolom yang NULL lalu kita hapus.

Ok kita mulai.

Data Set

Data Set berupa data penjualan simulasi yang sudah siap pakai yang saya generasi dari skrip Pythonnya Keith Galli dengan beberapa modifikasi.

Dari data set diatas saya melakukan ekstraksi pada kolom Order_Date dan Purchase_Address agar mudah dianalisis. Saya menggunakan bantuan Library Regex pada SQLean .

SELECT  *, 
        REGEXP_CAPTURE(Purchase_Address, '^Jalan .+, (\w+?), .+', 1) || ' ' || 
        REGEXP_CAPTURE(Purchase_Address, ' (\w+) \d+$', 1) AS City, 
        REGEXP_CAPTURE(Order_Date, '^(\d{2})/', 1) AS Month,
        REGEXP_CAPTURE(Order_Date, '^\d{2}/(\d{2})', 1) AS Date,
        REGEXP_CAPTURE(Order_Date, '(\d{2}):\d{2}$', 1) AS Hour   
FROM sales

Hasilnya menjadi seperti ini

Lalu saya menyimpannya di view dengan nama sales2. Lalu view ini saya jadikan basis Query. Namun SQLiteStudio mempunyai kelemahan karena tidak bisa langsung menggenerasi Chart.

SQLite manager yang mampu menggenerate Chart adalah SqliteViz, namun Library SQLiteStudio  tidak bisa berjalan di SQLiteViz.

Kalau ingin menggenerasi chart lewat SQLiteViz, maka cara yang mudah adalah dengan menggenerate view table sales2 menjadi tabel yang sebenarnya. Bisa menggunakan Export CSV pada SQLite Studio dan langsung Load di SQLiteViz.

SQLiteViz bisa membaca dan melakukan query langsung dari CSV sekaligus bisa mengkonversi format CSV ke format SQLite dengan lebih baik daripada SQLiteStudio.

 Penjualan Bulanan

SELECT Month,
SUM(Quantity_Ordered * Price_Each) AS Sales
FROM sales2
GROUP BY Month

Menghasilkan output sebagai berikut:

Dengan grafik seperti ini

Mencari kota dengan tingkat penjualan tertinggi

SELECT  City, SUM(Quantity_Ordered * Price_Each) AS Sales FROM Sales2
GROUP BY City

Hasilnya sebagai berikut:

Dengan grafik sebagai berikut:

 

Analisis Waktu Penjualan

SELECT Hour, SUM(Quantity_Ordered * Price_Each) AS Sales  FROM sales2
Group BY Hour

Hasilnya sebagai berikut:

Dan nampak dalam grafik sbb:

Mencari produk yang terjual secara bersamaan (10 tertinggi)

Produk yang terjual secara bersamaan bisa dicari menggunakan SQL berikut

SELECT a.Product AS Product1, b.Product AS Product2, COUNT(a.Order_ID) AS Jumlah
FROM sales a
JOIN sales b ON a.Order_ID = b.Order_ID
WHERE a.Product < b.Product
GROUP BY Product1, Product2
ORDER BY Jumlah DESC

Menghasilkan hasil sebagai berikut:

Produk dengan Penjualan Tertinggi

SELECT Product, SUM(Quantity_Ordered) AS Quantity_Ordered,
CAST(AVG(Price_Each) AS INTEGER) AS Price
FROM sales2
GROUP BY Product

Menghasilkan output berikut:

Grafiknya akan seperti ini

Demikian, btw ini masih berupa output  yang belum dikasih komentar ya, nanti kalau ada waktu akan kita update 🙂