Veri Madenciliği


VERİ MADENCİLİĞİ YÖNTEMLERİ



Yüklə 435,46 Kb.
Pdf görüntüsü
səhifə4/7
tarix28.08.2023
ölçüsü435,46 Kb.
#140807
1   2   3   4   5   6   7
veri madenciliği

VERİ MADENCİLİĞİ YÖNTEMLERİ 
Veri Madenciliği yöntemlerini denetimli ve denetimsiz olmak üzere iki ana kategoriye ayırmak 
mümkündür. Veri Madenciliğinde iyi tanımlanmış veya kesin bir hedef olduğunda denetimli (supervised) 
ifadesi kullanılır. Elde edilmesi istenen sonuç için özel bir tanımlama yapılmamışsa veya belirsizlik söz 
konusu ise denetimsiz (unsupervised) ifadesi kullanılır [9]. Denetimli ve denetimsiz ifadeleri birbirinin 
tersine karşılık gelmektedir. Denetimli ve denetimsiz yöntemleri sürecin bütünü açısından 
değerlendirmek gerekirse;



• Denetimsiz yöntemler daha çok veriyi anlamaya, tanımaya, keşfetmeye yönelik olarak kullanılan ve 
sonraki uygulanacak yöntemler için fikir vermeyi amaçlamaktadır,
• Denetimli yöntemler ise veriden bilgi ve sonuç çıkarmaya yönelik kullanılmaktadır, denilebilir. Bu 
nedenle denetimsiz bir yöntemle elde edilen bir bilgi veya sonucu, eğer mümkünse denetimli bir 
yöntemle teyit etmek, elde edilen bulguların doğruluğu ve geçerliliği açısından önem taşımaktadır. 
Denetimli (Supervised) Veri Madenciliği yöntemleri:
• En yakın k komşuluk (k-Nearest-Neighbor)
• K-ortalamalar kümeleme (K-means clustering)
• Regresyon modelleri (Regression models)
• Kural çıkarımı (Rule induction) • Karar ağaçları (Decision trees) 
• Sinir ağları (Neural networks) Denetimsiz (Unsupervised) Veri Madenciliği yöntemleri: 
• Aşamalı kümeleme ( Hierarchical clustering)
• Kendi kendini düzenleyen haritalar (Self organized maps) olarak sınıflandırılabilir [9, 12]. Veri 
Madenciliği ile ilgili kullanılan pek çok yöntemin yanına hemen her geçen gün yeni yöntem ve 
algoritmalar eklenmektedir. Bunlardan bir kısmı onlarca yıldır kullanılan klasik teknikler diyebileceğimiz 
ağırlıklı olarak istatistiksel yöntemlerdir. Diğer yöntemler de genellikle istatistiği temel alan ama daha 
çok makine öğrenimi ve yapay zekâ destekli yeni nesil yöntemlerdir. Veri Madenciliğinde kullanılan klasik 
yöntemlerin başlıcaları; 
• Regresyon,
• K - En Yakın Komşuluk,
• Kümeleme olarak sayılabilir. Yeni nesil yöntemlerin başlıcaları ise;
• Karar Ağaçları, 
• Birliktelik Kuralları,
• Sinir Ağları, olarak sıralanabilir [8]. Ayrıca diğer Veri Madenciliği yöntemlerinin başlıcaları da;
• Temel Bileşenler Analizi,
• Diskriminant Analizi,
• Faktör Analizi,
• Kohonen Ağları,
• Bulanık Mantığa Dayalı Yöntemler,
• Genetik Algoritmalar,
• Bayesci Ağlar,



• Pürüzlü (Rough) Küme Teorisine Dayalı yöntemler, olarak sıralanabilir [13]. Yukarıda sayılan 
yöntemlerin dışında birden fazla tekniği içine alan hibrid yöntemler ve zaman serilerine dayalı 
yöntemlerden de Veri Madenciliği yöntemi olarak faydalanılmaktadır [14]. Özet olarak, bilgi keşfine 
yarayan her yöntem Veri Madenciliği yöntemi olarak kullanılabilmektedir. Aşağıda yaygın kullanıma sahip 
başlıca veri madenciliği yöntemleri ve kısa tanımları verilmektedir. 

Yüklə 435,46 Kb.

Dostları ilə paylaş:
1   2   3   4   5   6   7




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin