Veri Madenciliği



Yüklə 435,46 Kb.
Pdf görüntüsü
səhifə5/7
tarix28.08.2023
ölçüsü435,46 Kb.
#140807
1   2   3   4   5   6   7
veri madenciliği

Regresyon Analizi
Yaygın kullanılan bir modelleme tekniğidir. Doğrusal, doğrusal olmayan ve lojistik modelleme 
alternatifleri imkanı vardır. Bağımsız değişken olarak anılan tahminedici değişkenlerin; bağımlı değişken 
denilen tahmin edilecek değişken değerini belirleyecek ağırlıklandırmaları içerecek bir bağımsız 
değişkenler birleşimidir.
K-En Yakın Komşuluk
Özellikle büyük veri tabanlarında kullanılan bir sınıflandırma tekniğidir. Sınıflandırılmak istenen nesnenin 
ait olduğu kümeyi, en yakınında yer alan K birim nesneden en fazla birime ait olanla aynı kümede 
sınıflandırması mantığına dayanmaktadır.
K-Ortalamalar Kümeleme Analizi
Segmentasyon, gruplama ve sınıflandırma yöntemidir. N birim nesnenin, K gruba ayrılması mantığına 
dayanır. Sınıf aralıkları belli olmadığında; bir benzerlik veya benzemezlik ölçütüne (metriğine) dayalı 
olarak, grup içinde homojen, gruplar arasında heterojen K adet küme yaratır.
Aşamalı (Hierarchical) Kümeleme Yöntemleri 
K-ortalamalar kümeleme analizi gibi sınıf aralıklarının belli olmadığı durumlarda, kullanılan bir 
segmentasyon yöntemidir. K-ortalamalar Kümeleme Analizi’yle arasındaki en büyük fark, hiyerarşik 
kümeleme analizinde küme sayısının, uygulayıcı müdahalesi olmadan, gözlem değerlerinin farklılıklarına 
göre kendiliğinden oluşmasıdır. Dolayısıyla, küme sayısı analize başlarken belirlenememekte; analiz 
sonucunda belirlenebilmektedir. Analizin çıktısı olarak elde edilebilen Dendogram denilen şekiller de
analizi görsel olarak desteklemekte ve daha anlaşılır kılmaktadır.
Karar Ağaçları 
Veri madenciliği denildiğinde, sinir ağları ile birlikte ilk akla gelen yöntemlerden olan karar ağaçları, yeni 
jenerasyon veri madenciliği yöntemlerindendir. Bir ağaç diyagramı biçiminde, her bir dal ve yaprağı bir 
sınıflandırma sorgusu olacak biçimde dallanan yöntem; nitel, nicel, sürekli, kesikli tüm değişkenlere 
uygulabilen algoritmaları, ağaç diyagramı şeklindeki görsel desteği, SQL sorgusuna kolay dönüştürülebilir 
yapısıyla en popüler segmentasyon yöntemlerinden birisidir. C 4.5, C5.0, C&RT ve CHAID en popüler 
yöntemlerdir. 
Sinir Ağları 
İnsan beyninin hesaplama mantığı baz alınarak oluşturulmuş (yapay) sinir ağları, karar ağaçları gibi 
yeni jenerasyon veri madenciliği yöntemlerindendir. Girdi ve çıktı arasında, küçük hesaplama 



birimlerinden elde edilen sonuçları birleştirerek sonuçlandıran bir modelleme yöntemidir. Karar ağaçları 
uygulama, anlama ve yorumlama açısından ne kadar kolaysa, sinir ağları da o derece zordur. Yalnızca 
model oluşturma, sonuçları yorumlama aşamasının ötesinde; doğru bir model kurabilmek için ağın 
eğitimindeki dengenin önemi oldukça büyüktür. Fazla eğitilmiş bir ağ, önceden gözlenmemiş bir gözleme 
yönelik tahmin kabiliyetini yitirirken; az eğitilmiş bir ağ ise yanlış tahmin verebilmektedir.

Yüklə 435,46 Kb.

Dostları ilə paylaş:
1   2   3   4   5   6   7




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin