Big data texnologiyalari paylanmış fayl sistemləri



Yüklə 72,79 Kb.
səhifə2/4
tarix02.01.2022
ölçüsü72,79 Kb.
#41075
1   2   3   4
C fakepathmuh 6

Hadoop ekosistemi:

Hazırda Hadoop ekosistemi (Şəkil 1) Big Data üçün sinonim hesab edilir. Hadoop-da verilənlərin avtomatik paralelləşdirilməsini və onların klasterlərdə emalını təmin edən MapReduce texnologiyası reallaşdırılıb (2005-ci ildə Doug Cutting və Mike Cafarella tərəfindən yaradılıb, Hadoop adı Cutting-in kiçikyaşlı oğlunun oyuncaq filinin adından götürülüb). Hadoop-un komponentlərinin çoxu müxtəlif Apache layihələrində yaradılmış açıq kodlu proqram təminatıdır. Aşağıda Hadoop ekosisteminə daxil olan bəzi komponentlərin qısa təsviri verilir:



Şəkil 1. Hadoop ekosistemi


HDFS (Hadoop Distributed File System) ‒ Hadoop-un nüvəsini təşkil edir, həcmi bir neçə terabaytdan petabayta qədər olan verilənlər anbarlarının saxlanması və idarə edilməsi üçün paylanmış fayl sistemidir. HDFS giriş verilənlərini bloklara bölür və blokların hər biri serverlər çoxluğunda onlara ayrılmış yerlərdə yerləşdirilir. Kommunikasiya üçün TCP/IP səviyyəsi istifadə edilir. HDFS imtinalara dayanıqlıdır, komponentlərdən hər hansı biri sıradan çıxsa, bu sistemin ümumi işinə təsir etmir. HDFS tətbiqi proqramlara minlərlə qovşaq və petabaytlarla verilənlər miqyasında işləməyə imkan verir. Məsələn, HDFS sistemi Yahoo!-da təxminən 40 Petabayt veriləni idarə edir.


Yüklə 72,79 Kb.

Dostları ilə paylaş:
1   2   3   4




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin