Hadoop – bu katta hajmdagi ma'lumotlarni taqsimlangan shaklda saqlaydigan va nusxalash imkonini beradigan Big Data Freamwork hisoblanadi…
HPPC (DAS)
HPPC (High-Performance Computing Cluster) (DAS - Data Analytics Supercomputer) – real vaqt rejimida ma'lumotlarni qayta ishlashga qodir superkompyuter. Bu LexisNexis Risk Solutions tomonidan amalga oshirilgan.
STORM
Storm - bu real vaqt rejimidagi ma'lumotlar bilan ishlash uchun mo'ljallangan Big Data tizimi. Clojure dasturlash tilida ishlab chiqilgan.
DataLake
DataLake - saqlash funktsiyasidan tashqari, u dasturiy platformani (masalan, Hadoop kabi) o'z ichiga oladi, shuningdek, ma'lumotlarni to'ldirish manbalari va usullarini, ma'lumotlarni saqlash va qayta ishlash tugunlari klasterlarini, boshqaruv va o'qitish vositalarini belgilaydi. DataLake kerak bo'lganda klasterni to'xtatmasdan yuzlab tugunlarni kengaytiradi.
Katta malumotlar (Big Data) talimdagi o‘rni
Big Data
Big Data – bu katta hajm, ishlov berishning tezkorlikdarajasi, ma’lumotlarning turli xilligi va ularni ishonchlilik bilan boshqariladigan ma’lumotlar va texnologiylar to’plamidir.
Quantitative analysis
Miqdoriy tahlil
Qualitative analysis
Miqdoriy bo‘lmagan
tahlil
Statistical analysis
Statistik tahlil.
Miqdoriy tahlil (Quantitative analysis)
Miqdoriy ma'lumotlar - bu raqamlarga asoslangan ma'lumotlar. Katta ma'lumotlarda miqdoriy tahlil – bu miqdoriy ma'lumotlarni tahlil qilishdir. Ushbu turdagi statistik tahlilning asosiy maqsadi miqdorni aniqlashdir.
Miqdoriy bo‘lmagan tahlil (Qualitative Analysis)
Katta ma'lumotlarning miqdoriy bo‘lmagan tahlili - bu ma'lumotlarni tabiiy holatda tahlil qilish. Miqdoriy bo‘lmagan ma'lumotlarni raqam ko‘rinishida tasfirlash qiyin. Hikoyalar, maqolalar, so'rov sharhlari, transkripsiyalar, suhbatlar, musiqa, grafiklar, san'at va rasmlar - bularning barchasi miqdoriy bo‘lmagan ma'lumotlardir. Miqdoriy bo‘lmagan tahlil asosan “qanday”, “nima uchun” va “nima” savollariga javob beradi.