İnformasiya texnologiyaları problemləri, 2015, №1, 70-79
70 www.jpit.az
UOT 004.891.2
Ələkbərova İ.Y.
AMEA İnformasiya Texnologiyaları İnstitutu, Bakı, Azərbaycan
airada.09@gmail.com
VİKİ-MÜHİTDƏ İNFORMASİYA TƏSİRİNİN İNTELLEKTUAL ANALİZİ
SİSTEMİNİN İŞ PRİNSİPİ VƏ ELMİ AKTUALLIĞI
Məqalədə viki-mühitdə reallaşdırılan informasiya müharibəsi texnologiyalarının analizini
həyata keçirmək məqsədi ilə işlənmiş informasiya təsirinin intellektual analizi sisteminin
strukturu və iş prinsipi göstərilmişdir. Sistem gizli sosial şəbəkələrin təyini, multimedia
resurslarından effektli istifadə və bir sıra məsələlərin həlli üçün nəzərdə tutulmuşdur. Sistemin
işi Microsoft SQL proqramlaşdırma dili, Firebird və Delphi proqram paketləri əsasında
reallaşdırılmışdır.
Açar sözlər: informasiya müharibəsi, Vikipediya, multimedia resursları, sosial şəbəkə, Firebird,
OLAP, Data Mining.
Giriş
İnternet istifadəçilərinin sayının sürətli artımı və cəmiyyətin siyasi aktivliyi virtual
məkanda yeni fəaliyyət sahəsinin – informasiya hücumlarının və qarşıdurmalarının çoxalmasına
səbəb olmuşdur. Belə ki, ictimai rəyin formalaşdırılması və ya dəyişdirilməsində, siyasi, iqtisadi
və hərbi qərarların qəbulunda, qarşı tərəfin informasiya resurslarına təsirdə, dezinformasiyanın
yayılmasında açıq İnternet-texnologiyalara aid olan viki-texnologiyaları (wiki technologies)
geniş imkanlara malikdir [1, 2].
Viki-texnologiyaların əsas funksiyasını veb-səhifələrdəki informasiyanın birbaşa brauzerdə
yaradılması və strukturunun dəyişdirilməsi kimi imkanlara malik olması təşkil edir. Səhifəyə
daxil edilən, dəyişdirilən və hətta silinən məlumatların istənilən variantının İnternet istifadəçisi
tərəfindən yenidən bərpa edilməsi viki-texnologiyaları digər İnternet-texnologiyalarından
fərqləndirən əsas xüsusiyyətdir [3, 4].
Uord Kenninqhem (Ward Cunningham) tərəfindən 1995-ci ildə yaradılmış viki
konsepsiyası virtual məkanda toplanan kontentə yeni münasibətlərin gətirilməsinə təkan
verməklə sosial münasibətlərdə və biliyin paylanmasında inqilab etdi. Viki konsepsiyası Web 2.0
texnologiyasının bir istiqamətidir və bu texnologiya istifadəçilərin əməkdaşlığını, şəbəkə
vasitəsilə koordinasiyasını və real həyatın sosial aspektlərini özündə əks etdirən infrastrukturu
xarakterizə edir [2, 5].
Viki-texnologiyaları əsasında yaradılan və idarə edilən Vikipediya (Wikipedia) virtual
ensiklopediyası İnternet mühitindəki digər layihələrdən tamamilə fərqli olan, dünyanın ən
nəhəng on-line ensiklopediyasıdır [6]. Vikipediyanın populyarlaşmasının əsas səbəbi onun
dinamik və daima yenilənən olmasıdır. Son illər Vikipediya və onun layihələrinin yaratdığı viki-
mühit İnternet mühiti daxilində informasiya toplanması və ötürülməsi əməliyyatlarından daha
irəliyə gedərək, xüsusi bir sosial şəbəkə, biliklərin toplandığı nəhəng baza, dünyada baş verən
siyasi, mədəni, iqtisadi və digər proseslərin davamı olmaqla yanaşı, informasiya müharibəsi
meydanına çevrilmişdir [7].
İnternet şəbəkəsində baş verən və günbəgün genişlənən informasiya qarşıdurmasına
qadağa qoymaq və ölkələrin qlobal informasiya fəzasında fəaliyyətlərini məhdudlaşdırmaq
mümkün deyildir. Bununla belə, İnternet məkanında öz informasiya fəzasını müdafiə etməyə
çalışan hər bir dövlət informasiya müharibəsi texnologiyalarının analizini həyata keçirən müasir
sistemlərlə təmin olunmalıdır. Məqalədə əsas diqqət belə sistemlərdən biri kimi viki-mühitdə baş
verən informasiya müharibəsi fonunda gizli sosial şəbəkələrin aşkarlanması, multimedia
resurslarından informasiya qarşıdurmasında effektli istifadə edilməsi və s. məsələlərin həlli üçün
nəzərdə tutulan informasiya təsirinin intellektual analizi sisteminin işlənməsinə verilmişdir.
İnformasiya texnologiyaları problemləri, 2015, №1, 70-79
www.jpit.az 71
İnformasiya təsirinin intellektual analizi sisteminin strukturu
Viki-mühitdə toplanan verilənlər əsasında intellektual analiz üçün informasiya təsirinin
analizi sistemi (İTAS) nəzərdə tutulmuşdur. İTAS-ın fəaliyyəti ümumi halda 4 mərhələdən
ibarətdir: verilənlərin yığılması, verilənlərin saxlanması, verilənlərin analitik və intellektual
emalı, verilənlərin təsviri (şəkil 1).
Şəkil 1. İnformasiya təsirinin intellektual analizi sisteminin strukturu
Sistemdə məntiqi olaraq növbəti əsas elementlər nəzərə alınır: verilənlər xəzinəsi (DW),
verilənlərin analitik emalı sistemi (OLAP), verilənlərin intellektual analizi sistemi (Data Mining)
və verilənlərin təsviri sistemi [8]. DW (Data Warehouse) idarəedici qərarların qəbul edilməsi
prosesini dəstəkləyən, sahə təmayüllü, zamandan asılı olub, dəyişməyən və istiqamətləndirici
verilənlər yığımı üçün nəzərdə tutulmuşdur. Odur ki, Vikipediyadakı səhifələr haqqında və
istifadəçilərin fəaliyyəti ilə bağlı ilkin məlumatların saxlandığı yer kimi DW istifadə
olunmuşdur. Sistemdə toplanan verilənlər rəqəm, zaman, məntiqi və mətn tipli ola bilərlər.
Viki-mühitdə tətbiq olunan informasiya müharibəsi texnologiyalarını analiz edərkən
Vikipediya və onun layihələrini idarə edən Vikimedia Fondunun (WMF) verilənlər bazasında
(VB) saxlanılan statistik verilənlərdən, viki-səhifələrin loq-fayllarında və viki-istifadəçilərin
fəaliyyət statistikasında (user contributions page), şəxsi səhifələrində (user page), müzakirə
Vikimedia Fondunun VB ilə
birbaşa əlaqəsi olan saytlar
Vikipediya virtual
ensiklopediyası
Vikimedia Fonduna
aid VB
İnformasiyanın xarici mənbələrdən toplanması
İlkin mənbələrdən verilənlərin yığılması, təmizlənməsi, razılaşdırılması
Verilənlər xəzinəsi
Verilənlər
köşkü
Verilənlərin təsviri
İnformasiya axtarış
sistemləri, sorğular
generatoru
Verilənlərin operativ
analitik emalı sistemi
(OLAP)
Verilənlərin intellektual
analizi sistemi
(Data Mining)
Verilənlər
köşkü
İnformasiya texnologiyaları problemləri, 2015, №1, 70-79
72 www.jpit.az
səhifələrində (discussion page) saxlanılan verilənlərdən istifadə etmək məqsədəuyğundur.
WMF-in VB-da hər bir istifadəçi və onun viki-mühitin layihələrində fəaliyyəti haqqında ümumi
və ya verilən zaman intervalında statistik məlumatlar da saxlanılır. Nəzərə almaq lazımdır ki,
viki-mühitdə informasiya təsiri və qarşıdurmasının analizi viki-səhifələrdə və onların müzakirə
səhifələrində reallaşdırılan mümkün dəyişikliklərin proqnostik təyininə əsaslanır [7, 9]. Emal
üçün nəzərdə tutulan verilənləri eyni zamanda WMF-in VB-na birbaşa çıxışı olan müxtəlif
saytlardan da əldə etmək mümkündür [10].
İstifadə olunan verilənlərin toplanması və təşkili işində müəyyən ardıcıllığın gözlənilməsi
vacibdir. Sistemdə ensiklopedik məqalələrin adları, yaranma tarixi, həcmi, səhifənin
redaktəsində iştirak edən istifadəçilərin adı və sayı, səhifədəki multimedia fayllarının adı və izahı
verilən mətn, daxil edilən və ya silinən informasiyanın həcmi və əməliyyatların sayı, məqaləyə
aid olan müzakirə səhifəsində adı göstərilən istifadəçilər və s. kimi verilənlər toplanır və
strukturlaşdırılır. Analiz üçün WMF-in veb-səhifələrindən əldə olunan statistik məlumatlardan
da istifadə etmək məqsədəuyğundur.
Tədqiqat işində müxtəlif mənbələrdən toplanmış verilənlər DW-yə gətirilməzdən öncə
ümumi formata gətirilir, təmizlənir və birləşdirilir. Detal verilənləri verilənlər köşkündə
saxlanılır. Detal verilənləri dedikdə, xarici sistemlərdən gətirilmiş, ümumiləşdirilməyən,
aqreqatlaşmaya və digər dəyişmələrə məruz qalmayan verilənlər nəzərdə tutulur. Yəni, verilən öz
semantikasını dəyişmir. Verilənlər köşkü konkret funksional sahədə analitik məsələlərin həllini
təmin edən verilənlər strukturunu əks etdirir. Verilənlər köşkünə hər hansı konkret məsələlərin
informasiya təminatını yerinə yetirən kiçik VB kimi də baxmaq olar [8, 11]. Analizdə istifadə
olunacaq verilənlərin hazırlanması texnologiyası bir-biri ilə əlaqəli üç mərhələdən ibarətdir:
1.
Verilənlərin yığılması ( Data Acquisition);
2.
Verilənlərin təmizlənməsi ( Data Cleaninq);
3.
Verilənlərin aqreqatlaşdırılması ( Data Consolidation).
Verilənlərin yığılması dedikdə, xarici mənbələrdən verilənlərin ötürülməsinin təşkili başa
düşülür. Tədqiqat işində bu proses qismən avtomatlaşdırılmışdır. Verilənlər bir neçə bazadan
gətirildiyindən, onları birləşdirmək lazım gəlir.
Verilənlərin təmizlənməsi dedikdə, sistemə gətirilən verilənlərin modifikasiyası prosesi
başa düşülür, yəni “çirkli” verilənlərin ləğvi, lazımsız dublikatların kənarlaşdırılması, nəzərdən
qaçırılmış verilənlərin bərpa edilməsi, verilənlərin eyni formata gətirilməsi, lazımsız simvolların
silinməsi və verilənlərin tipinin unifikasiyası, onların tamlığının yoxlanılması nəzərdə tutulur.
Verilənlərin
aqreqatlaşdırılması dedikdə, mövcud sahələr əsasında müxtəlif
münasibətlərin, intervalların, qiymətlərin (min, max, orta) ümumiləşdirilərək daxil edilməsi
nəzərdə tutulur. Bazanın aqreqatlaşmış verilənlərlə doldurulması zamanı verilənlərin
tranzaksiyalı verilənlər bazasından və metaverilənlərin müvafiq olaraq digər mənbələrdən
seçilməsi təmin edilir.
OLAP və Data Mining sistemlərinin qərarların qəbul ediməsi prosesinin iki əsas hissəsi
olduğu nəzərə alınaraq, bu konsepsiyalardan İTAS-in daxili arxitekturunun işlənməsində və
proqram əhatəsinin səmərəli işində istifadə edilmişdir. OLAP konsepsiyasının əsasını
verilənlərin çoxölçülü təsviri prinsipi təşkil edir. OLAP sisteminin köməyi ilə VB-da yığılmış
verilənləri analiz etməklə, qısa müddətdə istənilən sayda hesabat almaq və həmin hesabatları
müqaisə etmək, verilənləri kompüterin ekranında cədvəl, qrafik və ya diaqramlar şəklində
göstərmək mümkündür.
Gizli münasibətlərin, informasiya təsirlərinin aşkarlanması, başqa sözlə, biliklərin idarə
edilməsi məqsədi ilə verilənlərin intellektual analizindən (Data Mining) istifadə etməklə xam
verilənlərin emalı əsasında əvvəl müəyyən olunmayan, lakin aktual və qərarların qəbul edilməsi
üçün lazım olan bilikləri üzə çıxarmaq mümkündür.
Data Mining sistemlərində verilənlərin intellektual analizi əsas üç mərhələdən ibarətdir [12]:
–
mövcud qanunauyğunluqların aşkar edilməsi (müstəqil axtarış);
İnformasiya texnologiyaları problemləri, 2015, №1, 70-79
www.jpit.az 73
–
aşkarlanmış qanunauyğunluqlardan naməlum qiymətlərin qabaqcadan söylənməsi üçün
istifadə edilməsi (proqnoz modelləşdirmə);
–
aşkarlanmış qanunauyğunluqlar əsasında anomaliyanın tapılması və izah edilməsi üçün
istisnalar analizi.
Nəzərə almaq lazımdır ki, Data Mining böyük bazaların analizində istifadə olunur və
klasterləşmə alqoritmlərinin üzərinə qoyulan tələbləri uğurla yerinə yetirdiyi üçün bu sistemdən
viki-mühitdə toplanmış çox böyük həcmdə verilənlərin analizində istifadə olunması daha
məqsədəuyğundur [11, 12].
Data Mining metodlarında biliklərin aşkarlanması və analizinə imkan verən beş standart
tipli qanunauyğunluqlardan istifadə olunur: assosiasiya, ardıcıllıq, təsnifat, klasterləşdirmə və
proqnozlaşdırma (reqressiya). İTAS sistemində iki vektor arasındakı yaxınlığı hesablamaq üçün
kosinus metrikasından, klasterləşdirmə məsələlərinin həlli üçün isə tf-idf (term frequency –
inverse document frequency), “Fuzzy c-means” və “c-means” alqoritmlərindən istifadə
olunmuşdur [13–15].
Optimallaşma məsələsinin həlli üçün isə uyğunlaşdırılmış koqnitiv və sosial parametrləri
nəzərə alınaraq PSO (Particle Swarm Optimization) adaptiv alqoritmi istifadə olunmuşdur [16].
PSO alqoritmi bir çox üstünlüklərə malikdir: paralel emal, davamlılıq və yüksək hesablama
effektivliyi kimi xüsusiyyətlər optimallaşmanın müxtəlif mürəkkəb məsələlərində bu
alqoritmdən müvəffəqiyyətlə istifadə olunmasına səbəb olmuşdur.
Alqoritmin məqsədi çoxagentli sistemlərdə agentlərin hərəkətlərini optimal vəziyyətə
istiqamətləndirməkdir [17]. İstifadə olunan alqoritmlər sistemdəki verilənlərdə hər hansı gizli
sosial şəbəkələrin və hadisələrin axtarışını öz üzərilərinə götürərək, analitikləri qərar qəbul
etmək məqsədi ilə uyğun sorğuların düşünülməsi və proqramlaşdırılması işindən azad edirlər.
Bu yanaşma, xüsusən əhəmiyyətlı miqdarda gizli qanunauyğunluqlara malik olan, həddən
artıq çox informasiyanı özündə toplayan böyük VB-nin tədqiqində daha qiymətlidir. Belə ki,
ilkin verilənlərin birbaşa sorğu yolu ilə axtarışı zamanı bu qanunauyğunluqların çoxu nəzərə
alınmaya bilər. Müstəqil axtarış mərhələsi, bir qayda olaraq, özünə yalnız qanunauyğunluqların
generasiyasını deyil, həm də onların dəyişdirilməsi zamanı hesaba alınmayan verilənlərin
yoxlanılması və qruplaşdırılmasını da daxil edir.
Təklif olunan metod və alqoritmlər Delphi və Firebird proqram təminatlarında realizə
olunmuşdur. Firebird böyük həcmli VB-də saxlanılan verilənləri çoxölçülü kəsiklərdə emal
etmək üçün nəzərdə tutulan verilənlər bazasının idarəetmə sistemidir (VBİS). Proqram azaddır,
Linux, Microsoft Windows və Unix əməliyyat sistemlərini dəstəkləyir. Firebird proqramından
istifadə edilməsinin əsas səbəbi bu sistemin çox böyük həcmdə VB-ləri dəstəkləməsidir. Bu
zaman istifadə olunan VB-lərin həcmi yalnız əməliyyat sistemindən və sərt diskin həcmindən
asılı olur. Firebird proqramının VB-lərı müxtəlif fayllarda da yerləşə bilər. Firebird proqram
təminatı, həm də VB-nın serveri kimi istifadə oluna bilər. Bu proqramın əsas üstün cəhətləri:
effektivliyi, etibarlılığı, triggerlər üçün rahatlığı və Microsoft SQL Server proqramında yaradılan
VB-ləri özünün bir obyekti kimi qəbul etməsidir [18].
İntellektual analiz sisteminin işlənməsində Microsoft SQL Server proqramından istifadə
olunmasına səbəb onun əlavələrinin (Analysis Services, PivotTable Servies və Data
Transformation Services) lazımi tələbatlara cavab verməsidir. Microsoft SQL Server yalnız
relyasiya strukturlu VBİS deyil. O, həm də təkmilləşdirilmiş VB və tədqiqat aləti olmaqla, böyük
həcmli verilənlərin yüksəkeffektli emalı texnologiyasına malikdir. Proqramdan mürəkkəb
sorğuların köməyi ilə müxtəlif tip məsələlərin həllində istifadə olunur: çoxölçülü analiz
üsullarından istifadə etməklə qərarların qəbulu funksiyasını dəstəkləyən verilənlər xəsinəsinin
yaradılmasında, qanunauyğunluqların axtarışında və s. [19].
İnformasiya texnologiyaları problemləri, 2015, №1, 70-79
74 www.jpit.az
Sistemin ümumi iş prinsipi və potensial imkanları
Verilənlər toplandıqdan və aqreqatlaşdırıldıqdan sonra onların analizi həyata keçirilir. İlk
növbədə konfliktli viki-səhifələr müəyyən olunur. Bunun üçün viki-səhifələrin loq-fayllarında
toplanan verilənlərdən istifadə olunur. Belə ki, viki-səhifələrin həcmi və səhifədə edilən
dəyişikliklərin xarakteri loq-faylda göstərilir.
Viki-mühitdə informasiya qarşıdurmasına səbəb olan məqalələrin təyini üçün hər bir
məqalədə "silib-bərpa etmə" əməliyyatlarının sayı, məqalənin və müzakirə səhifəsinin həcmi
nəzərə alınmalıdır. Belə ki, informasiya qarşıdurmasına səbəb olan məqalələrdə:
1.
müzakirə səhifəsinin həcmi (twp
n
) məqalənin öz həcmindən (wp
n
) daha böyük olur
( twp
n
> wp
n
);
2.
"silib-bərpa etmə" əməliyyatı həyata keçirilir (rwp
n
).
Tədqiqat zamanı məqalədə rwp
n
>3 olduqda, bu vəziyyət artıq anomaliya hesab
ediləcəkdir. Belə ki, Vikipediyanın ümumi qaydalarına əsasən, informasiya qarşıdurmalarının
qarşısını almaq üçün məqalədə bir gündə 3 və daha çox "silib-bərpa etmə" əməliyyatı keçirilsə,
həmin məqalə administratorlar tərəfindən nəzarətə götürülür və “3 redaktə” qaydasını (The three-
revert rule) pozan istifadəçinin fəaliyyəti məhdudlaşdırılır (qeydiyyat adı bloklanır) [20, 21].
Yuxarıda göstərilən şərtlərdən heç olmasa biri baş verərsə (twp
v
> wp
v
və ya
rwp
r
>3),
məqalə konfliktli məqalə hesab olunaraq, informasiya qarşıdurmasına səbəb olan məqalələr
siyahısına daxil edilir və növbəti analiz üçün xüsusi cədvəldə (verilənlər köşkündə) toplanır.
Sistem aşkar etdiyi viki-səhifələrin siyahısını diaqram şəklində göstərməklə, daha yüksək
konfliktlik indeksinə malik olan səhifələri təyin etmək imkanına malikdir (şəkil 2).
Şəkil 2. Konfliktli viki-səhifələrin müəyyən edilməsi nəticəsində alınan diaqram
Sistem analitik verilənləri çoxölçülü kub şəklində təşkil etməklə, onların müxtəlif
kəsiklərdə, istənilən zaman intervalında sadə, anlamlı modelini alır. Çoxölçülü analiz dedikdə, üç
və daha artıq ölçüyə görə aparılan analiz üsulları nəzərdə tutulur. Sistemdə ölçü kimi tədqiq
olunan proses və ya hadisə, xanalarda isə aqreqatlaşdırılmış verilənlər saxlanılır (şəkil 3).
Şəkildən göründüyü kimi, axtarışın mətndəki açar sözə görə aparılması yalnız konfliktli
viki-səhifələrin deyil, digər müxtəlif mövzulu viki-səhifələrin və onları nəzarətdə saxlayan sosial
qrupların da təyin olunmasına imkan verir.
İnformasiya texnologiyaları problemləri, 2015, №1, 70-79
www.jpit.az 75
Şəkil 3. Verilmiş parametrlərə görə sosial qrupun aşkarlanması
Aparılan analizin ən maraqlı və mürəkkəb imkanlarından birinin proqnozlaşdırma və gizli
tendensiyaların üzə çıxarılması olduğunu nəzərə alaraq, verilənlərin müxtəlif kəsiklərdə analizini
aparmaqla informasiya müharibəsi çərçivəsində viki-mühitdə yaranan anomal hadisələri aşkar
etmək mümkündür. Sistemin Microsoft Excel proqramını dəstəkləməsi isə nəticənin həm
elektron cədvəl, həm də müxtəlif növ diaqramlar şəklində əldə olunmasına imkan verir.
Sistem həm də sosial qrupun ayrı-ayrı üzvlərinin fəaliyyətini zamana, daxil etdiyi və ya
sildiyi informasiyanın həcminə, mətndəki sözlərə və bir sıra digər əlamətlərə görə analiz etməyə
qadirdir. Məsələn, zaman intervalını göstərməklə hər bir viki-istifadəçinin verilən klasterdəki
fəaliyyəti haqqında informasiya əldə etmək mümkündür (şəkil 4).
Şəkil 4. İstifadəçinin müəyyən zaman intervalında nəzarətdə saxladığı konfliktli məqalələrin
siyahısı
Viki-səhifələrin informasiya təsirini artırmaq məqsədi ilə multimedia resurslarının düzgün
seçilməsi və effektli istifadəsi tələb olunur. Eyni zamanda, informasiya təsirində istifadə olunan
dezinformasiya xarakterli media-faylların da aşkarlanması qoyulan əsas məsələlərdəndir. Bunun
üçün media-fayllar məzmuna görə qruplaşdırılır. Açar sözə görə aparılan klasterləşmənin
keyfiyyəti təyin edilmiş kriteriyalarla qiymətləndirilir və viki-səhifələrlə media-faylların
saxlandığı klasterlər arasında əlaqə təyin edilir [16, 21].
İnformasiya texnologiyaları problemləri, 2015, №1, 70-79
76 www.jpit.az
Lazım olan media-faylın təyin olunması üçün faylın izahat sətrində (Description) verilən
mətn və faylın adındakı terminlərdən istifadə olunmaqla, viki-səhifəyə semantik cəhətdən daha
yaxın olan klaster (fayllar çoxluğu) seçilir. Sonrakı mərhələlərdə klasterin içərisindən kontentə
görə viki-səhifəyə daha uyğun gələn media-fayl təyin edilir (şəkil 5).
Şəkil 5. Multimedia resurslarının viki-səhifələrdə məzmuna uyğun paylanması
Sistem, yazıldığı dildən asılı olmayaraq, Vikipediyada toplanan bütün səhifələrin analizi
üçün nəzərdə tutulmuşdur. Sorğuda açar söz və ya söz birləşməsi hansı dildə daxil edilirsə,
sistem avtomatik olaraq həmin mətn üzrə analiz aparmağa başlayır.
Şəkil 6. Kontent haqqında əsas məlumatların toplandığı baza
İnformasiya texnologiyaları problemləri, 2015, №1, 70-79
www.jpit.az 77
Şərti bir neçə media-fayl ödəyirsə, o zaman sistem uyğun faylların seçilməsini analitikin
öhdəsinə buraxır. Sistem viki-istifadəçilər tərəfindən daha çox istifadə olunan faylı avtomatik
olaraq seçmək imkanına malikdir. Bu zaman media-faylda göstərilən istinadların sayından
istifadə etmək də mümkündür. Nəzərə almaq lazımdır ki, media-faylın populyarlığının təyinində
müxtəlif parametrlərdən: fayla daxil edilmiş şablonların xüsusiyyətləri, mənbə, hiperistinadların
sayından istifadə olunur.
Sistemin əsas müsbət cəhəti ondan ibarətdir ki, viki-istifadəçilərin davranışları və kontent
haqqında bütün məlumatlar (metaverilənlər) DW-da toplanır və istənilən zaman intervalı üçün
emal edilir (şəkil 6).
Verilənləri analiz etməklə viki-səhifələrdə kontentin daxil edilməsi və dəyişdirilməsi ilə
bağlı müəyyən təhlükələri aşkar etmək mümkündür. Sistemdən viki-mühitdə reallaşdırılan
vandalizm hallarının və vandalizmlə məşğul olan gizli qrupların təyin edilməsi və digər anomal
hadisələrlə bağlı məsələlərin həllində də istifadə etmək olar. Viki-mühitdə vandalizm iki tipdə
olur: təsadüfi (ehtiyatsızlıqdan) və qəsdən (bilərəkdən). Təsadüfi vandalizm hallarına
istifadəçinin buraxdığı texniki xətalar və ya sistemin normal işinin pozulması daxildir. Sistemin
mənfi cəhəti ondadır ki, İTAS bu halda da vəziyyəti anomal hadisə kimi qiymətləndirir. Odur ki,
sonuncu mərhələdə, yəni nəticədə sistem həm təsadüfi, həm də qəsdən edilmiş vandalizm
hallarını ümumiləşdirərək təqdim edir.
İTAS-ın funksionallığı toplanmış verilənlərinin dinamik, çoxölçülü analizini təmin edir və
tədqiqatçıların aşağıda göstərilən fəaliyyətlərini dəstəkləmək üçün istiqamətlənmişdir:
–
bazada yerləşdirilmiş və strukturlaşdırılmış göstəricilərin zaman tendensiyalarının analizi;
–
bazadakı konkret elementlərə və ya verilənlər yığımına tətbiq olunmuş hesablama və
modelləşdirmə;
–
verilənlərin analizi prosesində daha dərin detallaşdırmaya keçid;
–
analizin daha effektli aparılması üçün və verilənləri kompüter ekranında müxtəlif şəkildə
göstərmək məqsədi ilə ölçülərin dəyişdirilməsi imkanının olması.
Nəticə
İnformasiya təsirində istifadə olunan kontentin analizi, həmçinin viki-səhifələrlə müəyyən
qruplar arasında gizli əlaqələrin müəyyən edilməsi çoxlu sayda müxtəlif tipli verilənlərdən
istifadə etməyi tələb edir. Müxtəlif tipli çoxölçülü verilənlərin saxlanması üçün nəzərdə tutulan
DW və verilənlər köşkü ilə işləyən sistem klasterləşmə metodlarından istifadə etməklə, viki-
mühitdə müxtəlif tipli informasiya təsirlərini və anomal vəziyyətləri aşkar etməyə qadirdir. Belə
analiz analitiklərə müxtəlif verilənlərə fərqli formada baxmağa və vəziyyətdən asılı olaraq qərar
qəbul etməyə şərait yaradır.
Aparılan tədqiqatlar bir daha sübut etdi ki, dövlətdə informasiya müharibəsi
texnologiyaları ilə bağlı problemləri yalnız informasiya sisteminin və ya kompüter şəbəkəsinin
təhlükəsizliyini gücləndirməklə həll etmək mümkün deyil. İnformasiya cəmiyyəti quruculuğunda
istənilən informasiya şəbəkəsi və ya açıq İnternet layihəsi yaradarkən, artıq sabah onun
informasiya əməliyyatları meydanına çevriləcəyini nəzərə almaq lazımdır. İnformasiya
təcavüzünün qarşısını almaq, informasiya qarşıdurmasında uğur əldə etmək üçün isə ilk növbədə
informasiya müharibəsi texnologiyalarını analiz etmək, onlara qarşı qabaqlayıcı tədbirlər görmək
lazımdır.
Ədəbiyyat
1.
Ələkbərova İ.Y. Viki-mühitdə reallaşdirilan bəzi informasiya müharibəsi texnologiyalarinin
analizi // İnformasiya cəmiyyəti problemləri, 2011, №2(4), səh. 18–28.
2.
Ələkbərova İ.Y. Vikimetrik tədqiqatlarin informasiya təhlükəsizliyində rolu / İnformasiya
təhlükəsizliyi problemləri üzrə I Respublika elmi-praktiki konfransı, 2013, səh. 109–112.
İnformasiya texnologiyaları problemləri, 2015, №1, 70-79
78 www.jpit.az
3.
Christian W. Wiki: A technology for conversational knowledge management and group
collaboration // Journal of the Communications of the Association for Information Systems,
2004, vol.13, no.2, pp.265–289.
4.
Ələkbərova İ.Y. Vikimetrik tədqiqatların analizi və viki-mühitdə informasiya təhlükəsizliyi
problemləri haqqında // İnformasiya texnologiyaları problemləri, 2013, №1(7), səh. 58–66.
5.
Leuf B., Cunningham W. The Wiki Way: quick collaboration on the Web, Laflin, PA:
Addison-Wesley, 2001, 200 p.
6.
http://wikipedia.org/
7.
Yasseri T., Sumi R., Rung A., Kornai A., Kertész J. Dynamics of conflicts in Wikipedia //
PLoS ONE, 2012, vol 7, no 6: e38869, http://arxiv.org/pdf/1202.3643v2.pdf
8.
Алгулиев, Р.М., Касумова Р.Т., Алекперова И.Я. Об одном подходе выполнения
сложных запросов на основе технологии OLAP // Информационные технологии
моделирования и управления, 2006, №6, стр.728–731.
9.
Milne D., Witten I. An effective, low-cost measure of semantic relatedness obtained from
wikipedia links / Proceedings of the Wikipedia and AI workshop at the AAAI-08 Conference,
2008, pp.25–30.
10.
Alakbarova I.Y. Some Approaches to the Development of Information Influence and Hidden
Communications Detection Systems in Wiki-Environment / Proceedings of the IV
International Conference “Problems of Cybernetics and Informatics”, 2012, pp. 119–120.
11.
Спирли Э. Корпоративные хранилища данных. Планирование, разработка, реализация.
М: «Вильямс», 2001, т. 1, 400 с.
12.
Əliquliyev R.M., Qasımova R.T., Ələkbərova İ.Y. Qərarların qəbul edilməsini dəstəkləyən
müasir konsepsiyalar haqqında // AMEA Xəbərləri. Fizika-riyaziyyat və texnika elmləri
seriyası, 2005, №2, səh. 70–74.
13.
Grabmeier J., Rudolph A. Techniques of cluster algorithms in data mining // Data Mining and
Knowledge Discovery, 2002, vol.6, no.4, pp.303–360.
14.
Jain A., Murty M., Flynn P. Data clustering: a review // ACM Computing Surveys, 1999,
vol.31, no.3, pp.264–323.
15.
Aliguliyev R.M. Automatic document summarization by sentence extraction // Computational
Technologies, 2007, vol.12, no.5, pp.5–15.
16.
Alguliev R.M., Aliguliyev R.M., Alekperova I.Ya. Cluster approach to the efficient use of
multimedia resources in information warfare in Wikimedia // Automatic Control and
Computer Sciences, 2014, vol.48, no.2, pp. 97–108.
17.
Kennedy J, Eberhart R. Particle Swarm Optimization // Proceedings of the IEEE International
Conference on Neural Network, Perth, Australia, 1995, pp.1942
–
1948.
18.
Borrie H. The Firebird Book: A Reference for Database Developers, 2004, Apress, NY, 1128 pp.
19.
Алгулиев Р.М., Алекперова И.Я., Касумова Р.Т. Многомерная модель данных в MS
SQL Server 2000 // Материалы 10-й юбилейной международной научной конференции
«Теория и техника передачи, приема и обработки информации», Харьков-Туапсе, 2004,
часть 2, cтр.28
–
29.
20.
https://en.wikipedia.org/wiki/Wikipedia:Edit_warring
21.
Алгулиев Р.М., Алекперова И.Я. О методах выявления информационного противостояния
в вики-среде // İnformasiya cəmiyyəti problemləri, 2013, №1(7), səh. 39–48.
İnformasiya texnologiyaları problemləri, 2015, №1, 70-79
www.jpit.az 79
УДК 004.891.2
Алекперова Ирада Я.
Институт Информационных Технологий НАНА, Баку, Азербайджан
airada.09@gmail.com
Принцип работы и научная актуальность системы интеллектуального анализа
информационного воздействия в вики-среде
В статье показаны структура и принцип работы системы интеллектуального анализа
информационного воздействия, разработанного с целью исследования технологий
информационной войны в вики-среде. Cистема предназначена для определения скрытых
социальных сетей, эффективного использования мультимедийных ресурсов и решения
ряда задач. Работа системы реализуется на основе среды Microsoft SQL, программных
пакетов Delphi и Firebird.
Ключевые слова: информационная война, Wikipedia,
мультимедийные ресурсы,
социальная сеть, Firebird, OLAP, Data Mining.
Irada Y. Alakbarova
Institute of Information Technology of ANAS, Baku, Azerbaijan
airada.09@gmail.com
The article describes the structure and operation of the information influence analysis system
developed to investigate technologies of information warfare in a wiki environment. The system
is designed to determine the hidden social networks, effective use of multimedia resources and to
solve a number of related issues. The system is implemented in a programming framework based
on the Microsoft SQL, software packages Delphi and Firebird.
Keywords: information warfare, Wikipedia, multimedia resources, social network, Firebird,
OLAP, Data Mining.
Dostları ilə paylaş: |