Install JupyterLab

Kalau tidak salah, saya sudah pernah install Jupyterlab, tapi dimana saya taruh? Parah ya, hehehe, akhirnya install lagi dah, sekalian saya taruh disini buat catatan.

Langkah pertama buat Virtual Environment dan dan install jupyterlab

PS D:\Python> cd .\Jupyterlab\
PS D:\Python\Jupyterlab> python -m venv jupyterlab
PS D:\Python\Jupyterlab> .\jupyterlab\Scripts\activate
(jupyterlab) PS D:\Python\Jupyterlab> pip install jupyterlab

Langkah kedua jalankan Jupyterlab

(jupyterlab) PS D:\Python\Jupyterlab> jupyter lab

Ternyata kita dihadang login


Okey, kita reset dulu …

(jupyterlab) PS D:\Python\Jupyterlab> jupyter notebook password

Dan taraa….

Terakhir jangan lupa jika kamu ingin mainan pandasql kamu harus melakukan instalasi library yang dibutuhkan.

PS C:\Users\ached> cd D:\Python\Jupyterlab\
PS D:\Python\Jupyterlab> .\jupyterlab\Scripts\activate
(jupyterlab) PS D:\Python\Jupyterlab> pip install pandasql
(jupyterlab) PS D:\Python\Jupyterlab> pip install openpyxl

Terimakasih …

Pandas SQL di Python

Terus terang saya tertarik dengan adopsi SQL pada Python. Selain karena saya sudah akrab dengan SQL, sintak pandas nemurut saya tidak mudah diingat sebagaimana SQL, sehingga ketika kita tidak sering menggunakannya, kita akan mudah lupa.

Berikut catatan saya tentang penggunaan Pandas-SQL

Setup Virtual Environment. 

Ini tidak harus sih, hanya kalau kita ingin sebuah environment khusus bagi project kita.

PS D:\Python> cd .\DataScience\
PS D:\Python\DataScience> python -m venv ds
PS D:\Python\DataScience> .\ds\Scripts\activate
(ds) PS D:\Python\DataScience> pip install pandas

Install Pandas

(ds) PS D:\Python\DataScience> pip install pandas

Install Pandasql

(ds) PS D:\Python\DataScience> pip install -U pandasql

Contoh Penggunaan

Query pada CSV

1
2
3
4
5
6
7
8
9
10
from pandasql import sqldf
import pandas as pd
 
file = "STUDI KASUS - DATA PENJUALAN_REV.csv"
df = pd.read_csv(file)
 
sql = "SELECT trim(kategori_pelanggan) as kategory_pelanggan, count(no) AS jumlah FROM df GROUP BY trim(kategori_pelanggan)"
 
data = sqldf(sql)
print(data)

Query pada Excel

Untuk istalasi pada Excel kita perlu install openyxl

(ds) PS D:\Python\DataScience> pip install openpyxl

Lalu kita kita gunakan fungsi read_excel() berikut:

1
2
3
4
5
6
7
8
9
10
from pandasql import sqldf
import pandas as pd
 
file = "STUDI KASUS - DATA PENJUALAN_REV.xlsx"
df = pd.read_excel(file, sheet_name=0)
 
sql = "SELECT trim(kategori_pelanggan) as kategory_pelanggan, count(no) AS jumlah FROM df GROUP BY trim(kategori_pelanggan)"
data = sqldf(sql)
 
print(data)

Query pada SQLite

1
2
3
4
5
6
7
8
import sqlite3
import pandas as pd
 
# Create and read your connection.
cnx = sqlite3.connect('latihan2.sqlite3')
df = pd.read_sql_query("SELECT * FROM penjualan", cnx)
 
print(df)

Mungkin kamu perlu membaca artikel “Ngoding Pandas dengan Skill SQL” untuk menambah wawasan tentang penggunaan SQL untuk menganalisis data.

Enjoy …

Virtual Environment di Python

Virtual Environment adalah lingkungan kerja python dengan library yang diinstall sesuai kebutuhan.

Verikut contoh penggunaaanya.

PS D:\Python> cd .\DataScience\
PS D:\Python\DataScience> python -m venv ds
PS D:\Python\DataScience> .\ds\Scripts\activate
(ds) PS D:\Python\DataScience> pip install pandas

Happy Coding 🙂

 

Data Analisis antara Python dan PHP

Akhir-akhir ini saya memang belajar tentang Data Analisis agak banyak. Karena dari berbagai teknologi yang saya pelajari, untuk saat ini bidang inilah yang mempunyai pasar dan lagi trending.

Dimulai dari data, sampai bagaimana menyajikan data dalam grafik, sehingga bisa dibaca dengan mudah.

Terakhir Python muncul dengan membawa berbagai library yang memudahkan data analis membuat analisa data sampai tahap visualisasi.

Untuk data dengan jumlah besar, dan analisis yang komplek, maka ini adalah solusi. Namun untuk aplikasi analisi data dengan interface, bagi saya yang basisnya programmer PHP, masih akan mengandalkan PHP – HighChart.  PHP adalah Web Scipting yang sudah matang, dan HighChart bisa diandalkan untuk data visualization.

PHP-Statistik

Kjta perlu library statistik untuk mengolah data. Dan nampaknya Project Al-Kashi, sebuah project  PHP-Statistik cukup bisa diandalkan. Nama Al-Kashi dimbil dari Amshid Al-Kashi, Ilmuan Besar Islam Bidang Matematika dan Astronomi.

Kamu juga bisa melihat project ini di GitHub dan PHP Classes

PHP-HighChart

HightChart adalah library javascript untuk visualisasi data. Dan agak repot juga jika kita melakukan manipulasi data langsung emlalui HighChart. Tadi saya berencara membuat library PHP untuk membungkus HighChart agar bisa di atur-atur menggunakan PHP. Tapi untunglah lagi-lagi ada orang baik yang sudah mengerjakannya.

PHP HighChart bisa kamu akses disini. Atau temukan Githubnya disini. Termasuk contoh kodenya disini.

PHP DataFrame (update 2024-01-07)

Menemukan  library Archon: PHP Data Analysis Library  untuk menangani analisis data berbasis CSV maupun XLSX, maupun database. Mirip-mirip Pandas di Pythonlah. Silahkan mengunjungi situs githubnya disini

Habis ini nampaknya harus dibuat aplikasi kecil sebagai basis aplikasi selanjutnya 🙂

Statistik Deskriptif

Sebenarnya ingin menulis tentang “Statistik  Deskriptif” sekedar untuk referensi. Eh ternyata sudah ada yang menulis. Ya jelas lah. Kita ini sudah sampai  pada banjir informasi.

Tinggal serach di Google aja sudah menemukan artikel yang mudah dibaca, walaupun ternyata mengadopsi dari artikel di Scibr. Tapi terjemahnya sangat bagus.

Artikel tentang statistik dasar yang harus dipahami. Silahkan meluncur disini

Ok, sedemikian aja dulu ..