9.4.5. Google sisteminin web-axtarış spamları ilə
mübarizəsi
Saytların indeksləşdirilməsi zamanı axtarış sistemləri
tərəfindən yalnız saytın relevantlığı, nüfuzluluğu, etibarlığı
260
və digər keyfiyyət göstəriciləri deyil, eləcə də spamlılıq
dərəcəsi nəzərə alınır. İnformasiya axtarışının təşkili üzrə
Google şirkətində müxtəlif qruplar fəaliyyət göstərir. Bu
qruplardan biri axtarışın və onun nəticəsinin keyfiyyətinin
təmin olunması ilə məşğul olur. Bu qrup tərəfindən 2011-ci
ildə işlənib hazırlanmış “Panda” alqoritmi axtarışın keyfiy-
yətinin yüksəldilməsinə xidmət edir.
Digər bir qrup axtarış spamları ilə mübarizə üzrə fəa-
liyyət göstərir. 2012-ci ildə bu qrup tərəfindən hazırlanmış
“Penguin” alqoritmi web-spamlarla mübarizə məqsədilə
yaradılmışdır.
Hər gün internetdə spamları olan milyonlarla web-sə-
hifə peyda olur. Google-da bu spamların istifadəçilərə ma-
ne olmaması üçün saytların avtomatik və əllə yoxlanması
üçün effektiv üsullardan istifadə edilir. Özündə spam sax-
layan web-səhifələr fırıldaqçılıq yolu (açar sözlərin süni
şəkildə çoxlu sayda təkrarlanması, yüksək PageRank ve-
rən istinadların alınması, görünməz, gizli mətnlərin istifa-
dəsi və s.) ilə yüksək reytinq qazanmağa və axtarışların
nəticələrində yuxarı yerlərə (sətirlərə) qalxmağa çalışırlar.
Nəticədə həqiqi faydalı saytlar axtarışın nəticəsi siyahısı-
nın sonuna doğru sıxışdırılır, lazımi məlumatların tapılma-
sı çətinləşir və axtarışın effektivliyini aşağı düşür.
Web-saytlarda müxtəlif növ web-spamlardan istifadə
olunur. Lakin Google-un alqoritmləri web-spamların əksər
növlərini identifikasiya etməyə (tanımağa) imkan verir.
Qalan (avtomatik aşkar olunmayan) web-spamları Google-
un əməkdaşları “əllə” müəyyənləşdirirlər. Google web-spam
aşkar olunmuş saytların reytinqini avtomatik olaraq aşağı
salır. Web-səhifələrdən web-spamların təmizlənməsi üçün
Google müxtəlif alqoritmlərdən istifadə edir. Onlardan əsas
ikisi Google Panda və Google Penguin alqoritmləridir.
|