Big data texnologiyalari paylanmış fayl sistemləri



Yüklə 72,79 Kb.
səhifə4/4
tarix02.01.2022
ölçüsü72,79 Kb.
#41075
1   2   3   4
C fakepathmuh 6

HCatalog ‒ Hadoop-da yaradılmış verilənlər üçün cədvəllərin və saxlancların idarə edilməsi servisi təmin edir. HCatalog ortaq sxem və verilənlərin tipi mexanizmi, cədvəl abstraksiyası kimi özəlliklər təklif edir, bunlar Hadoop-un Pig, MapReduce, Streaming və Hive kimi komponentlərinin dayanıqlı işləməsini dəstəkləyir.

HBase (Hadoop DataBase) ‒ paylanmış, sütunvari verilənlər bazasıdır (Google-un BigTable-dən qaynaqlanır), saxlanma məqsədləri üçün HDFS-dən istifadə edir. Bir tərəfdən, MapReduce istifadə etməklə paket rejimində hesablamaları, digər tərəfdən isə, nöqtə sorğularını (ing. random reads) idarə edir.

Zookeeper ‒ Hadoop ekosisteminin başqa bir əhəmiyyətli komponentidir. Onun əsas funksiyası koordinasiya məlumatlarını saxlamaq, adlandırma, paylanmış sinxronlaşdırmanı və qrup servislərini təmin etməkdir, bunlar müxtəlif paylanmış sistemlər üçün olduqca vacibdir. Əslində, HBase-in işləməsi ZooKeeper-dən asılıdır.

Mahout ‒ maşın təlimi üçün proqram təminatıdır, klassifikasiya, klasterizasiya, tövsiyə və paketli kolloborativ süzgəc kimi əsas alqoritmlər daxildir. Əsas alqoritmlər Hadoop-un yuxarı səviyyəsində Map/Reduce paradiqması ilə reallaşdırılıb, lakin onu Hadoop-dan kənarda da xətti cəbr və statistikaya hədəflənmiş proqram kitabxanası kimi istifadə etmək olar.

Ekosistemə daxil olan SqoopFlume verilənləri Hadoop-klasterlərə və əksinə köçürmək üçün istifadə edilir.
Yüklə 72,79 Kb.

Dostları ilə paylaş:
1   2   3   4




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin