Python – Veri Bilimi için Pandas

python kullanımı

Pandas , yüksek performanslı, kullanımı kolay veri yapıları ve veri analiz araçları sağlayan en popüler kütüphanelerden biridir.

 

Pandas kütüphanesinin import edilmesi

İki veri yapısı vardır.

Pandas Series ( Tek boyutlu Dizi)

DataFrame ( İki boyutlu Dizi)

– Seriler(Series)

Seri, herhangi bir türdeki (integer, string, float, python nesneleri vb.) Verileri tutabilen tek boyutlu etiketli bir dizidir.

 

Serilerin genel kullanımı :

 

istenen veri seri içerisinde var mı kontrol ederek bize true veya false dönüşü yapar

bir index’e ait değere ulaşmak için list mantığındaki gibi index ismi veya index verilir.

Verilere erişmek için kullanılabilecek metodlar

loc ( label ismi)

iloc ( label sayısal indexi)

Veri İşlemleri (Ekle, Sil)

Dosya Okuma

Peki listeleri hep elimizle mi gireceğiz tabiki hayır. Biz dosya okuma ile veri alalım.
Cvs dosya okuma işlemi

head() methodu ile ilk 5 değeri listele

 

– DataFrame

DataFrame’leri farklı tipteki sütunlara ve satırlara sahip bir SQL tablosu olarak düşünebiliriz. DataFrame’ler veriyi daha kolay işleyebilmemizi sağlar.

DataFrame’lerin genel kullanımı

pandas dataframe ile ilgili görsel sonucu

  • Dictionary’lerden, serilerden veya listelerden oluşan bir dictionary,
  • 2 boyutlu numpy dizisi,
  • Başka bir DataFrame

-Dictionary kullanarak dataframe oluşturma

mesela yukarıdaki değerlerden birini göstermek istersek

Satırları göstermek

 

Not:String index ile yazdığınızda dahildir, rakamsal olarak son değer dahil değildir.

Aynı şekilde loc, iloc işlemleri bunda da geçerlidir.

loc() : Sütun isimlerini kullanarak verilere erişmenin mümkün olduğu yöntemdir.

iloc() : Sütun index veya index aralıklarını kullanarak verilere erişmenin mümkün olduğu yöntemdir.

Slicing işlemi

Matematiksel İşlemlerde eğer diyerek sınırlama yaparsak bize True False değerleri gelecek. bunların true olan değerlerine ulaşmak için dataframe içine alıyoruz.

 

 

head() methodu ile ilk 5 değeri listele

info() methodu

descripe fonksiyonu ile nümerik olan veriler analiz edilebilir. Aşağıdaki örnekte görebileceğiniz gibi isim hariç yaş ve maaş için minumum ve maximum verileri, medyan değerlerini bulabiliriz. İsim string bir veri olduğu için işlem yapılamaz.

dropna() ile Nan(Null value) olmayan değerleri getirebilirsiniz

iterrows() ile index ve column değerini atayabilirsiniz

isnull() Boş değer kontrolü yapmak için kullanılır. Boolen değer döndürür.

copy() ile datafrema i başka bir data frame üzerine kopyalayabilirsiniz.

shape() ile dataframe’inizin kaç satır ve kaç sütunu olduğunu öğrenin

ndim() ile dataframe’in boyutunu döndürür. tek boyutlu mu 2 boyutlu mu

Not: Daha birçok method vardır. Ufak bir araştırma ile bulabilirsiniz. Ben sizlere en çok kullanılanları anlatmaya çalıştım. Umarım faydalı olmuştur. Herkese iyi çalışmalar

İlk yorum yapan olun

Bir yanıt bırakın

E-posta hesabınız yayımlanmayacak.


*