Python muhitida keras paketidan foydalanib neyron tarmoq qurish (1)
Ma'lumotlarni tahlil qilish Ma'lumotlarni tahlil qilish uchun pandas kutubxonasi yordamida ma'lumotlarni yuklab olishimiz mumkin. pandas kutubxonasidan yaratgan DataFrame obyekti ma'lumotlarimizni o'z ichiga oladi va ularga qulay operatsiyalar bajarishga imkon beradi.
Quyidagi kodda pandas kutubxonasi yordamida Iris nomli ma'lumotlarni yuklab olamiz:
import pandas as pd
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"
names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']
dataset = pd.read_csv(url, names=names)
Yuklab olingan ma'lumotlar dataset o'zgaruvchisida saqlanadi. head() metodini ishlatib ma'lumotlarning bir nechta birinchi qatorini ko'rishimiz mumkin:
print(dataset.head())
Natija:
sepal-length sepal-width petal-length petal-width class
0 5.1 3.5 1.4 0.2 Iris-setosa
1 4.9 3.0 1.4 0.2 Iris-setosa
2 4.7 3.2 1.3 0.2 Iris-setosa
3 4.6 3.1 1.5 0.2 Iris-setosa
4 5.0 3.6 1.4 0.2 Iris-setosa
Ma'lumotlarda sepal-length, sepal-width, petal-length, petal-width va class sifatida 5 ta ustun bor. Ular bilan neural network modellari tuzilganda, class ustunining qiymatlarini ma'lumotlarning to'plamiga qo'shish orqali modellarning sinov uchun foydalaniladi.
Ma'lumotlar tahlil qilinishida, ulardagi xatoliklar aniqlanishi, ma'lumotlar orasidagi aloqalar chiqarilishi va ma'lumotlar orasida asosiy o'zgaruvchilarni aniqlash uchun ko'plab metodlar mavjud.
Ma'lumotlarimizda "Outcome" nomli bir o'zgaruvchi mavjud. Bu o'zgaruvchi qiymati 0 yoki 1 bo'lgan binar belgidir. Bunda, 0 xolati bolaning yolg'on emasligini, 1 xolati esa bolaning yolg'onligini ko'rsatadi. Bizning vazifamiz ma'lumotlarimizni barcha boshqa o'zgaruvchilarning qiymatlarini foydalanib, Outcome o'zgaruvchisining qiymatlariga mos maqsadli bo'lgan bir neyron tarmoqini tayyorlashdir.
Bu maqsadga erishish uchun, Outcome o'zgaruvchisini asosiy maqsadimiz sifatida qabul qilamiz va qolgan barcha o'zgaruvchilarni tayyorlashimiz kerak. Biz "Outcome" o'zgaruvchisini natijalar yig'indisidan ajratib, "Y" nomli yangi o'zgaruvchiga saqlaymiz va qolgan o'zgaruvchilar "X" nomli o'zgaruvchida saqlanadi.
Natijalar yig'indisini yaratish uchun, "Pandas" kutubidan foydalanamiz. "Outcome" o'zgaruvchisini yig'indidan ajratib, "Y" o'zgaruvchiga yuklash uchun esa "NumPy" kutubidan foydalanamiz.
Kodlar quyidagicha bo'ladi:
import pandas as pd
import numpy as np
# Ma'lumotlar yuklanadi
data = pd.read_csv('ma\'lumotlar.csv')
# Ma'lumotlar tahlil qilinadi
X = data.drop('Outcome', axis=1).values
Y = data['Outcome'].values