Elemen-elemen dalam data Science

Data Science adalah bidang yang terkait dengan penggalian data, machine learning, dan big data. Tujuan dari Data Science adalah untuk mengekstrak pengetahuan dan wawasan dari berbagai data terstruktur dan tidak terstruktur.

Berikut adalah elemen dan contoh alat yang digunakan untuk mencapai tujuan itu.

Elemen Deskripsi Contoh Alat
Statistik Fondasi untuk analisis data, untuk mengidentifikasi pola R, SAS, SPSS
Machine Learning Algoritma untuk membuat prediksi atau klasifikasi scikit-learn, TensorFlow
Data Wrangling Membersihkan, menggabungkan, dan menyatukan data untuk analisis Pandas, Talend
Visualisasi Data Representasi grafis data Tableau, ggplot2
Pemrosesan Big Data Menangani pemrosesan data skala besar Hadoop, Spark
Pemrograman Menulis kode untuk menganalisis data dan membangun produk data Python, Java, Scala
Manajemen Database Menyimpan dan mengambil data dalam jumlah besar secara efisien SQL, NOSQL
Deep Learning Subbidang ML, berfokus pada algoritma yang terinspirasi oleh otak Keras, PyTorch
Etika Data Prinsip untuk mengatur penggunaan data yang bertanggung jawab N/A
Business Intelligence Mengubah data menjadi wawasan bisnis yang dapat ditindaklanjuti Power BI, Cognos

Kamu sudah menguasai yang mana? 🙂

Kapan Awal Puasa dan Hari Raya Idul Fitri 1445H?

Awal Puasa dan Hari Raya adalah hal yang paling ribet di indonesia ini. Ini karena masing-masing elemen muslim  mempunyai cara sendiri-sendiri dan tidak bisa disatukan. Mengapa saya kadang nyinyir soal ini? Karena mestinya hal seperti ini bisa direncanakan jauh hari sebelumnya.

Iya memang jaman Nabi harus dilihat dulu karena  belum ada Ilmu Astronomi yang maton, kalau sekarang sudah bisa dihitung secara presisi.

Sebenarnya pemerintah bisa menetapkan jauh hari sebelumnya. Kalau kriteria yang diambil adalah bulan bisa dilihat kasat mata, ya tinggal pakai Hisab Rukyatul Hilal. Kalau ada yang masih mau pakai tradisional ya biarin. Tapi dengan penentuan jauh hari artinya banyak orang yang dimudahkan karena bisa melakukan planing dengan lebih baik.

Okey karena gak jelas kapan Awal Ramadhan dan kapan Hari Raya , maka saya akan melakukan observasi sendiri untuk kebutuhan saya sendiri.

Kriteria

Saya menggunakan kriteria pemerintah dan menteri-menteri agama Asean. Kriteria baru MABIMS menetapkan bahwa secara astronomis, hilal dapat teramati jika bulan memiliki ketinggian minimal 3 derajat dan elongasinya minimal 6,4 derajat. Sudut elongasi yg dimaksud adalah sudut matahari-bulan dari pengamat di bumi.

Walaupun sebenarnya kalau saya pakai kriteria 2 derajat aja sebenarnya sdh manteb sebagai bentuk kompromi dengan wujudul hilal.

Perangkat Simulasi

Perangkat simulasi menggunakan Stelarium Web

Awal Ramadhan

Saya intip bulan pada tangagl 10 Maret 2024 saat Altitude Matahari 0°. Mengapa saya intip di tanggal itu? Karena itu dicurigai sebagai tanggal akhir Sya’ban.

  • Posisi pengamatan di tempat saya, Desa Malasan, Durenan, Trenggalek.
  • Posisi Altitude Matahari harus 0° atau masuk waktu Maghrib.

Posisi Matahari

Berikut posisi matahari pada tanggal 6

Berikut cara membaca gambar stellarium diatas

Magnitudo: -26,76

Magnitudo adalah ukuran kecerahan suatu benda langit. Semakin kecil magnitudonya, semakin cerah benda langit tersebut. Matahari memiliki magnitudo -26,76, yang membuatnya menjadi benda langit paling terang di langit malam.

Jarak: 0,99 AU

Jarak Matahari dari Bumi adalah 1 unit astronomi (AU). AU adalah satuan jarak yang setara dengan jarak rata-rata Bumi dari Matahari. Dalam gambar, jarak Matahari dari Bumi tertera 0,99 AU, yang berarti Matahari berada sedikit lebih dekat dengan Bumi daripada jarak rata-rata.

Radius: 696.000 Km

Radius Matahari adalah 696.000 kilometer. Ini berarti Matahari adalah bola raksasa dengan diameter sekitar 1,39 juta kilometer.

Ra/Dec: 23h 24m32.25 -03° 49′ 17.1″

Ra/Dec adalah singkatan dari Right Ascension dan Declination. Right Ascension adalah koordinat horizontal suatu benda langit di langit, sedangkan Declination adalah koordinat vertikal. Koordinat Ra/Dec pada gambar menunjukkan bahwa Matahari berada di konstelasi Pisces.

Az/Alt: 266° 04′ 06.5″ -00° 29’49.6″

Az/Alt adalah singkatan dari Azimuth dan Altitude. Azimuth adalah sudut horizontal suatu benda langit dari utara, sedangkan Altitude adalah ketinggiannya di atas ufuk. Koordinat Az/Alt pada gambar menunjukkan bahwa Matahari berada di azimuth 266° dan altitude -00°.

Visibilitas: Terbit: 05:40 Terbenam: 17:47

Visibilitas menunjukkan waktu Matahari terbit dan terbenam pada tanggal 10 Maret 2024 di Trenggalek, Jawa Timur, Indonesia. Matahari terbit pada pukul 05:40 dan terbenam pada pukul 17:47.

Posisi Bulan

Dari posisi bulan pada gambar saja sudah bisa kita lihat bahwa posisi bulan masih kurang dari satu derajat, atau umur bulan masih terlalu muda, belum memenuhi kriteria, sehingga tanggal 11 belum masuk Ramadhan.

Kesimpulannya 1 Ramadhan 1445 H jatuh pada Selasa, 12 Maret 2022.

1 Syawal

Posisi Matahari pada 9 April 2022 Magrib

Sedangkan posisi bulan pada saat magrib

Karena posisi bulan sudah tinggi (6°)  atau sudah jauh diatas 2° maka bisa dipastikan 1 Syawal jatuh pada hari  Rabu, 10 April 2024.

Jadi lama puasa Ramadhan 1445H ini adalah 29 hari.

Demikian, terimakasih …

Pilih-Pilih Software Office

Saya dulu pengguna MS Office Bajakan. Dulu… Namun seiring waktu saya meninggalkan dunia office bajakan.

Sekarang software office banyak dan trendnya menuju penggunaan office online. Setelah Google Office merilis penggunaan Office online tentu saja. Google Office  gratis. Namun, entah mengapa, ternyata saya masih merasa butuh menggunakan Office Offline.  Lebih enak aja, dan gak tergantung internet.

Karena MS Office mahal, dan saya bukan pengguna Software office kelas berat, akhirnya saya lari ke WPS Office. WPS Office saya anggap software yang paling mirip MS Officce. Nyaman digunakan.

Tapi setelah saya gunakan dalam keseharian, ternyata WPS Office ini kurang stabil. Saya bisa mengatakan yang seperti itu setelah saya menggunakannya bukan disatu komputer, namun beberapa.

Akhirnya saya kembali ke pengganti Office yang dulu pernah saya gunakan, dan bisa diperoleh secara gratis di internet. Libre Office. Dan nampaknya setelah release 7.5 versi open office melompat ke versi 24.

Saya hanya pengguna dan tidak tahu detil-detilnya. Tapi nampaknya saya memang harus beralih dari WPS Office ke Libre Office.

Tampilannya memang tidak senyaman WPS Office, namun ya.. di custom sedikit-sedikit biar terlihat agak nyaman 🙂

Terimakasih kepada orang-orang yang telah membantu membuat software yang sangat bermanfaat ini.

Library-library Data Science di Python

Untuk melakukan analisis data dari awal sampai akhir menggunakan Python, terdapat beberapa library yang umumnya digunakan oleh para data scientist dan data analyst. Berikut adalah beberapa library yang sering digunakan:

  1. Pandas: Pandas adalah library yang sangat populer untuk manipulasi dan analisis data. Dengan Pandas, Anda dapat membaca data dari berbagai sumber, seperti file CSV, Excel, atau database, dan melakukan operasi seperti filtering, grouping, dan agregasi.
    import pandas as pd
    
  2. NumPy: NumPy menyediakan struktur data array yang efisien dan fungsi matematika yang kuat. Ini sangat berguna untuk operasi numerik dan komputasi array.
    import numpy as np
    
  3. Matplotlib dan Seaborn: Matplotlib digunakan untuk membuat visualisasi data seperti grafik dan plot. Seaborn adalah tambahan yang menyediakan antarmuka yang lebih tinggi dan estetika visual yang lebih baik.
    import matplotlib.pyplot as plt
    import seaborn as sns
    
  4. Scikit-learn: Scikit-learn adalah library machine learning yang menyediakan algoritma umum untuk tugas-tugas seperti klasifikasi, regresi, clustering, dan lainnya.
    from sklearn.model_selection import train_test_split
    from sklearn.linear_model import LinearRegression
    
  5. Statsmodels: Statsmodels adalah library yang memberikan alat untuk melakukan analisis statistik. Ini sering digunakan untuk regresi statistik dan pengujian hipotesis.
    import statsmodels.api as sm
    
  6. Jupyter Notebooks: Meskipun bukan library, Jupyter Notebooks adalah lingkungan pengembangan interaktif yang sangat populer untuk analisis data dan pengembangan model. Anda dapat menggunakan Jupyter Notebooks untuk menggabungkan kode, teks, dan visualisasi dalam satu dokumen.

    Instal dengan:

    pip install jupyter
    

Setelah menginstal library di atas, Anda dapat menggunakan kombinasi ini untuk membaca, membersihkan, menganalisis, dan memvisualisasikan data, serta mengimplementasikan model machine learning jika diperlukan.

Data Engineers, Data Scientist, Data Analyst dalam Sebuah Kisah

Di sebuah perusahaan besar yang bergerak di industri penjualan motor, ketiga tim yang berbeda bekerja bersama untuk mengoptimalkan kinerja bisnis mereka. Di kantor pusat yang sibuk, seorang data engineer bernama Ario duduk di depan layar komputernya, sibuk merancang dan mengelola infrastruktur data perusahaan. Dia memastikan bahwa semua data dari berbagai sumber – mulai dari transaksi penjualan hingga data pelanggan – mengalir dengan lancar ke dalam sistem mereka. Hari ini, dia sedang fokus memperbaiki masalah kinerja pada server basis data, memastikan bahwa tim data dapat mengakses data yang diperlukan dengan cepat dan efisien.

Sementara itu, di ruang rapat sebelah, seorang data scientist bernama Maya tengah terbenam dalam analisis data. Dikelilingi oleh grafik dan diagram, dia sedang mengeksplorasi tren penjualan motor dari tahun ke tahun. Maya berusaha untuk mengidentifikasi pola-pola yang dapat memberikan wawasan berharga kepada manajemen perusahaan. “Pada bulan lalu, penjualan model tertentu meningkat tajam di wilayah barat,” gumamnya sambil memeriksa grafiknya. “Apa yang menyebabkan lonjakan ini?” Dengan menggunakan teknik analisis data yang canggih, Maya mencoba memahami faktor-faktor yang mendorong perubahan ini, dengan harapan dapat memprediksi tren masa depan.

Sementara itu, di lantai yang lebih bawah, seorang data analyst bernama Rani sedang duduk di meja kerjanya, menyusun laporan harian tentang kinerja penjualan. Dia telah menyortir data transaksi untuk hari ini, mengidentifikasi penjualan terbesar dan tren pembelian pelanggan. Dengan cermat, dia memformat data dalam laporan yang mudah dimengerti, dengan grafik yang menarik dan tabel yang rapi. Rani tahu bahwa laporan ini akan menjadi dasar bagi manajemen perusahaan dalam pengambilan keputusan strategis.

Saat sore mulai menjelang, ketiga tim bertemu dalam ruang konferensi untuk berbagi hasil pekerjaan mereka. Ario menjelaskan perbaikan yang dia lakukan pada infrastruktur data, sementara Maya dan Rani berbagi wawasan baru yang mereka temukan dari analisis mereka. Bersama-sama, mereka membentuk tim yang kuat, bekerja untuk menyempurnakan penggunaan data dalam perusahaan mereka, dan pada gilirannya, meningkatkan kinerja dan keuntungan perusahaan secara keseluruhan. Dengan kolaborasi mereka, perusahaan penjualan motor ini siap menghadapi tantangan yang akan datang dan terus berkembang dalam pasar yang kompetitif. (oai)