Ma'lumotlarni guruhlash va yig'ish Buning uchun .groupby usuli qo'llaniladi, u ma'lumotlarning alohida guruhlarini tahlil qilish va ko'rsatkichlarni solishtirish imkonini beradi. Misol uchun, bizda bir nechta o'quv kurslari mavjud, ular haqida ma'lumotlar bitta jadvalda saqlanadi. Ularning har biri qancha daromad keltirishini tahlil qilishingiz kerak:
.groupby dan foydalaning va ustun sarlavhasini belgilang sarlavha , uning asosida Pandas barcha ma'lumotlarni birlashtiradi. Shundan so'ng biz .agregate usulidan foydalanamiz - bu matematik hisob-kitoblarni amalga oshirishga yordam beradi, ya'ni har bir guruh ichidagi xarajatlarni jamlaydi.
import qilish pandalarni sifatida pd
# Kurs ma'lumotlari bilan DataFrame yarating
ma'lumotlar = {
'sarlavha': ['A kursi' ;, 'B kursi', ' 39;C kursi', 'D kursi', < a i=11>'E kursi',
'daromad': [100, 150, 200, 120, 180
}
df = pd.DataFrame(ma'lumotlar)< /span>
# Ma'lumotlarni kurs nomi bo'yicha guruhlash va daromadlarni yig'ish
guruhlangan = df.guruh('title' , as_index=noto‘g‘ri).jamlama})'sum& #39;: 'daromad'({
guruhlangan
Eslatma as_index=False, kodning bu qismi guruhlash va hisoblash natijalarida raqamli indekslarni saqlash uchun javobgardir.
Pandalarda pivot jadvallari Ular o'rganilayotgan ob'ekt haqida to'plangan ma'lumotlarni umumlashtirish uchun ishlatiladi. Agar manba ma'lumotlari juda ko'p bo'lsa va ularning barchasi turli xil bo'lsa, jadvallarni yaratish ma'lumotlarni tartibga solishga yordam beradi. Python da pivot jadvallarini yaratish uchun ular Pandas kutubxonasidan, ya'ni .pivot_table. usulidan ham foydalanadilar.
Masalan, oddiy toifalar bir/ikki, kichik/katta va sonli qiymatlarga ega bo'lgan xayoliy ma'lumotlar to'plamini olaylik. A ustunida ikkita foo/bar toifalari dasturlashda belgi sifatida ishlatiladigan foobar so'ziga qo'shiladi. Bunday holda, u biz ma'lumotlarni aniqlanmagan mezon bo'yicha ikki guruhga ajratayotganimizni ko'rsatadi.
.pivot_table usulidan foydalanib, biz ushbu ma'lumotlarni jadvalga aylantiramiz va shartlarni qavs ichiga yozamiz.
jadval = pd.jadvalli_jadval(df, qiymatlar='D', indeks='A',]'B',
ustunlar=['C'], aggfunc=np.sum)
stol
Biz ma'lumotlarni ikkita toifaga ajratamiz: bar va foo, ularning har birida bir va ikki qiymatli kichik guruhlar bo'ladi, ular o'z navbatida kichik va katta bo'linadi. Pivot jadvalda biz har bir guruhda qancha ob'ekt bo'lishini hisoblaymiz. Buning uchun biz qiymatlar, indeks, ustunlar va aggfunc usullaridan foydalanamiz: