DataFrame
Pandas DataFrame Excel jadvali/varaqlariga oʻxshash ikki oʻlchovli massivdir (Aytgancha, Excel maʼlumotlarini buyrugʻi yordamida oʻqish mumkin. pandalar.read_excel('file.xls' )) Bu sizga ma'lumotlar bilan bir xil manipulyatsiyalarni amalga oshirishga imkon beradi: ularni guruhlarga birlashtirish, ma'lum bir mezon bo'yicha tartiblash va hisob-kitoblarni amalga oshirish. Har qanday jadval singari, dataframe ham ustunlar va satrlardan iborat bo'lib, ustunlar allaqachon ma'lum bo'lgan ob'ektlar bo'ladi - Series.
Seriyalar aslida dataframening bir qismi ekanligini tekshirish uchun jadvaldan istalgan ustunni ajratib olishingiz mumkin. Keling, bir nechta MDH davlatlari, ularning maydoni va aholisi haqida ma'lumotlar to'plamini olaylik va mamlakat ustunini tanlang:
df = pd.DataFrame({
'mamlakat': ['Qozog'iston' , 'Rossiya', ' Belarus', 'Ukraina' ,
'aholi': [17.04, 143,5, 9,5, 45,5],
'kvadrat': [2724902, 17125191, 207600, 603628
})
|
Natijada asl ma'lumotlar ramkasidagi kabi bir xil qator indekslarini saqlaydigan oddiy qator bo'ladi:
df['mamlakat'
turi(df['mamlakat& #39;])
Bundan tashqari, dataframe qo'lda o'rnatiladigan ustunlarda indekslarga ega. Kod yozishni osonlashtirish uchun keling, ikki belgili indekslardan foydalangan holda mamlakatlarni belgilaymiz: Qozog'iston - KZ, Rossiya - RU va boshqalar:
# Berilgan indekslar bilan dataframe yarating
df = pd.DataFrame({
'mamlakat': ['Qozog'iston' , 'Rossiya', ' Belarus', 'Ukraina' ,
'aholi': [17.04, 143,5, 9,5, 45,5],
'kvadrat': [2724902, 17125191, 207600, 603628
}, indeks=['KZ'< a i=4>, 'RU', 'BY'< /span>])'UA',
|
Natija:
# Indekslarni o'zgartirish
df.index = ['KZ', 'RU', 'BY', 'UA'
df.index.name = 'Mamlakat kodi'
|
Siz Series da boʻlgani kabi indekslar yordamida obʼyektlarni qidirishingiz va tanlov qilishingiz mumkin. Keling, bir xil dataframeni olamiz va .loc usuli yordamida KZ, RU indekslari va aholi ustunidan foydalanib tanlaymiz (.loc holatda biz kvadrat qavslardan foydalanamiz, boshqa usullarda bo'lgani kabi dumaloq qavslar emas ) ikki mamlakat aholisini solishtirish uchun:
df.loc[['KZ', 'RU'], 'aholi'
|
Anaconda quyidagilarni chiqaradi:
Country Code
KZ 17.04
RU 143.50
Name: population, dtype: float64
|
Matematik hisoblar ham DataFrame da bajariladi. Masalan, dataframemizda har bir mamlakat aholisi zichligini hisoblab chiqamiz. Biz aholi ustunidagi ma'lumotlarni kvadratga (maydon) ajratamiz va aholi zichligini ko'rsatadigan zichlik ustunida yangi ma'lumotlarni olamiz:
# Aholi zichligini hisoblang
df['zichlik'] = df['aholi'] / df['kvadrat'] * < /span>1000000
|
Dostları ilə paylaş: |