Microsoft Word Qasimov-ias docx


  Zipfin I qanunu – “ranq-tezlik” asılılığı



Yüklə 1,74 Mb.
Pdf görüntüsü
səhifə59/177
tarix01.01.2022
ölçüsü1,74 Mb.
#50803
növüDərs
1   ...   55   56   57   58   59   60   61   62   ...   177
N 406

2.5.1.  Zipfin I qanunu – “ranq-tezlik” asılılığı 
Zipfin I qanunun mahiyyəti aşağıdakından ibarətdir. Sənə-
din mətninin statistik təhlili aparılır. Mətndə rast gəlinən bü-
tün sözlərin sənədə daxilolma tezlikləri (sözlərin mətndə rast-
gəlinmələrinin sayı) müəyyən edilir. Aydındır ki, bir sıra söz-
lər eyni tezliyə malik ola bilərlər. Sözlər mətndə rastgəlinmə 


83 
tezliklərinə görə qruplaşdırılır. Tezlikləri eyni olan sözlərin 
hamısı bir qrupda birləşdirilir. Bütün qruplar onlara daxil 
olan sözlərin tezliklərinin qiymətinə görə azalan sıra ilə dü-
zülür və ardıcıl olaraq nömrələnirlər. Qrupların sıra nömrəsi 
onların ranqı adlanır. Belə ki, ən çox rast gəlinən sözlər qru-
punun ranqı 1, ondan sonrakı 2 və s. olur.  
Zipf sübut etmişdir ki, sənədə daxil olan sözlərin ranqları 
ilə onların rastgəlinmə tezlikləri arasında asılılıq mövcuddur.  
Tutaq ki, 
j
f
 –  j sözünün sənədin mətninə daxilolma 
tezliyi, 
d
f
 – sənədin mətnindəki sözlərin ümumi sayıdır. 
Onda sözün mətndə rast gəlinməsi ehtimalı  aşağıdakı 
kimi olar: 
d
j
j
f
f
p

.  
Zipf “ranq-tezlik” asılılığını  aşağıdakı  şəkildə ifadə 
etmişdir: sözlərin mətndə rastgəlinmə ehtimalı onların 
ranqları ilə düz mütənasibdir. Başqa sözlə, sözlərin 
mətndə rast gəlinmə ehtimalının onların ranqına hasili 
nəticəsində alınan qiymət təxminən sabit qalır: 
d
j
j
j
j
f
r
f
r
p
c





Burada 
j
r
 –  j  sözünün ranqı,  c – empirik sabitdir. Bu
sabit müxtəlif dillər üçün fərqli ola birər, lakin onlar təx-
minə yaxın olur. Məsələn, bu sabit ingilis dili üçün 0.1, 
rus dili üçün 0.06-0.07, Azərbaycan dili üçün təxminən 
0,09 qiymətlərini alır. 
Zipfin I qanununa əsasən, sözlərin rastgəlinmə tez-
likləri ilə ranqları arasındakı asılılıq hiperbola şəklində 


84 
olur və sənəd üçün daha çox məna kəsb edən, yəni termin 
kimi qəbul oluna biləcək sözlər qrafikin orta hissəsində 
yerləşir (şək.2.4).  
Daha çox rast gəlinən (rastgəlinmə tezliyi daha böyük 
olan) sözlər  əsasən  əvəzliklər, bağlayıcı  və s. kimi xidməti 
sözlərdir. Ən az rast gəlinən sözlər isə fellər və digər xidmə-
ti, eləcə də təsadüfi istifadə olunan sözlər olur. Ona görə də 
həddən artıq çox və həddən artıq az rast gəlinən sözlər, adə-
tən, mətnin məzmununa yaxınlıq baxımından  əhəmiyyət 
kəsb etmirlər. Açar sözlərə  və terminlərə isə,  əsasən, orta 
rastgəlmə tezliyinə malik olan sözlər aid olurlar. 
Burada hər şey sözlərin rastgəlinmə tezliyi intervalının 
necə seçilməsindən asılı olur. Belə ki, bu interval çox 

Yüklə 1,74 Mb.

Dostları ilə paylaş:
1   ...   55   56   57   58   59   60   61   62   ...   177




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin