In [ ]:
#Import Python Libraries import numpy as np
import scipy as sp
import pandas as pd
import matplotlib as mpl
import seaborn as sns
Yupiter katakchasini bajarish uchun Shift+Enter tugmalarini bosing
Pandalar yordamida ma'lumotlarni o'qish
In [ ]:
#Read csv file df = pd.read_csv("http://rcs.bu.edu/examples/python/data_analysis/Salaries.csv")
Boshqa ma'lumotlar formatlarini o'qish uchun bir qator panda buyruqlari mavjud:
pd.read_excel('myfile.xlsx',sheet_name='Sheet1', index_col=None, na_values=['NA'])
pd.read_stata('myfile.dta')
pd.read_sas('myfile.sas7bdat')
pd.read_hdf('myfile.h5','df')
Izoh: Yuqoridagi buyruqda ma'lumotlarni import qilish jarayonini nozik sozlash uchun ko'plab ixtiyoriy argumentlar mavjud.
Eng umumiy d turi. Agar ustun aralash turlarga ega bo'lsa (raqamlar va satrlar) ustuningizga tayinlanadi.
int64
int
Raqamli belgilar. 64 bu belgini ushlab turish uchun ajratilgan xotiraga ishora qiladi.
float64
float
O'nli kasrli raqamli belgilar. Agar ustunda raqamlar va NaNlar bo'lsa (pastga qarang), agar etishmayotgan qiymatingizda kasr bo'lsa, pandalar sukut bo'yicha float64 ga o'tadi.
datetime64, timedelta[ns]
N/A (but see the datetime module in Python’s standard library)
Qiymatlar vaqt ma'lumotlarini saqlash uchun mo'ljallangan. Vaqt seriyali tajribalar uchun ularni ko'rib chiqing.