Home » , » Sekilas tentang Pandas | JupyterNotebook

Sekilas tentang Pandas | JupyterNotebook

Written By SBlog on Thursday, June 13, 2019 | June 13, 2019

Panda merupakan paket Python yang menyediakan struktur data yang cepat, fleksibel, dan ekspresif yang dirancang untuk membuat pekerjaan yang dilakukan dengan data "relasional" atau "berlabel" lebih mudah dan intuitif. Jadi secara umum panda digunakan seperti membuat tabel, mengubah dimensi data, mengecek data, dan semacamnya. Python sudah dikenal sebelumnya dalam modifkasi data dengan tambahan panda kinerja python dalam mengolah data menjadi lebih powerfull.
Persiapan pertama install panda.

pip3 install pandas (untuk python3)
pip install pandas (untuk python2)


Selanjutnya sebagai sampel data diambil dari satu data indonesia (data.go.id)
https://data.go.id/dataset/proporsi-penduduk-yang-memiliki-telepon-seluler-di-daerah-perdesaan/resource/eacaa9c9-155c-4f68-9402-9c8159da295e

Untuk memulai/membaca file csv pada Pandas

import pandas as pd
df = pd.read_csv('proporsi-penduduk-yang-memiliki-telepon-seluler-di-daerah-perdesaan.csv', delimiter = ';', encoding = "ISO-8859-1")
df

df akan berisi sebuah Dataframe / array 2 dimensi yang akan bisa diolah/ubah ke series, contoh output seperti berikut :



Melihat list kolom

df.columns



kemudian kita filter untuk melihat wilayah yang ada di data

wilayah = df['wilayah'].unique()
print (wilayah)

Hasilnya :



Jika kita akan menghitung jumlah data untuk tiap wilayah dapat menggunakan fungsi berikut.

count_wilayah = df.groupby(['wilayah']).size().reset_index(name='counts')
print(count_wilayah)

hasil :



melakukan filter wilayah yang akan di lihat datanya

rt.loc[(rt['wilayah']=='Sumatera Selatan')]

hasil:


Sekian perkenalan dengan si panda, selamat mencoba


sumber:
https://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html
http://jefri-p.com/2018/09/belajar-pandas

0 comments:

Post a Comment

(^_^) [o_o] (^.^) (".") ($.$)