Panda merupakan paket Python yang menyediakan struktur data yang cepat, fleksibel, dan ekspresif yang dirancang untuk membuat pekerjaan yang dilakukan dengan data "relasional" atau "berlabel" lebih mudah dan intuitif. Jadi secara umum panda digunakan seperti membuat tabel, mengubah dimensi data, mengecek data, dan semacamnya. Python sudah dikenal sebelumnya dalam modifkasi data dengan tambahan panda kinerja python dalam mengolah data menjadi lebih powerfull.
Persiapan pertama install panda.
Selanjutnya sebagai sampel data diambil dari satu data indonesia (data.go.id)
https://data.go.id/dataset/proporsi-penduduk-yang-memiliki-telepon-seluler-di-daerah-perdesaan/resource/eacaa9c9-155c-4f68-9402-9c8159da295e
Untuk memulai/membaca file csv pada Pandas
import pandas as pd
df = pd.read_csv('proporsi-penduduk-yang-memiliki-telepon-seluler-di-daerah-perdesaan.csv', delimiter = ';', encoding = "ISO-8859-1")
df
df akan berisi sebuah Dataframe / array 2 dimensi yang akan bisa diolah/ubah ke series, contoh output seperti berikut :
Melihat list kolom
df.columns
kemudian kita filter untuk melihat wilayah yang ada di data
wilayah = df['wilayah'].unique()
print (wilayah)
Hasilnya :
Jika kita akan menghitung jumlah data untuk tiap wilayah dapat menggunakan fungsi berikut.
count_wilayah = df.groupby(['wilayah']).size().reset_index(name='counts')
print(count_wilayah)
hasil :
melakukan filter wilayah yang akan di lihat datanya
rt.loc[(rt['wilayah']=='Sumatera Selatan')]
hasil:
Sekian perkenalan dengan si panda, selamat mencoba
sumber:
https://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html
http://jefri-p.com/2018/09/belajar-pandas
Persiapan pertama install panda.
pip3 install pandas (untuk python3)
pip install pandas (untuk python2)
Selanjutnya sebagai sampel data diambil dari satu data indonesia (data.go.id)
https://data.go.id/dataset/proporsi-penduduk-yang-memiliki-telepon-seluler-di-daerah-perdesaan/resource/eacaa9c9-155c-4f68-9402-9c8159da295e
Untuk memulai/membaca file csv pada Pandas
import pandas as pd
df = pd.read_csv('proporsi-penduduk-yang-memiliki-telepon-seluler-di-daerah-perdesaan.csv', delimiter = ';', encoding = "ISO-8859-1")
df
df akan berisi sebuah Dataframe / array 2 dimensi yang akan bisa diolah/ubah ke series, contoh output seperti berikut :
Melihat list kolom
df.columns
kemudian kita filter untuk melihat wilayah yang ada di data
wilayah = df['wilayah'].unique()
print (wilayah)
Hasilnya :
Jika kita akan menghitung jumlah data untuk tiap wilayah dapat menggunakan fungsi berikut.
count_wilayah = df.groupby(['wilayah']).size().reset_index(name='counts')
print(count_wilayah)
hasil :
melakukan filter wilayah yang akan di lihat datanya
rt.loc[(rt['wilayah']=='Sumatera Selatan')]
hasil:
Sekian perkenalan dengan si panda, selamat mencoba
sumber:
https://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html
http://jefri-p.com/2018/09/belajar-pandas
0 comments:
Post a Comment