Hadoop xususiyatlari: 1. Masshtabli Hadoop - bu juda kengaytiriladigan saqlash platformasi, chunki u juda katta ma'lumotlar to'plamlarini parallel ravishda ishlaydigan yuzlab arzon serverlarda saqlashi va tarqatishi mumkin. Katta hajmdagi ma'lumotlarni qayta ishlashga imkon bermaydigan an'anaviy relyatsion ma'lumotlar bazasi tizimlaridan (RDBMS) farqli o'laroq, Hadoop korxonalarga minglab terabayt ma'lumotlarni o'z ichiga olgan minglab tugunlarda ilovalarni ishga tushirish imkonini beradi.
2. Tejamkorlik Hadoop shuningdek, korxonalarning portlovchi ma'lumotlar to'plamlari uchun tejamkor saqlash echimini taklif qiladi. An'anaviy relyatsion ma'lumotlar bazasini boshqarish tizimlari bilan bog'liq muammo shundaki, bunday katta hajmdagi ma'lumotlarni qayta ishlash uchun bunday darajaga o'tkazish juda qimmatga tushadi. Xarajatlarni kamaytirish maqsadida, o'tmishdagi ko'plab kompaniyalar ma'lumotlarning namunalarini qisqartirishlari va qaysi ma'lumotlar eng qimmatli ekanligi haqidagi ma'lum taxminlar asosida tasniflashlari kerak edi. Xom ma'lumotlar o'chiriladi, chunki ularni saqlash juda qimmatga tushadi. Ushbu yondashuv qisqa muddatda ishlagan bo'lsa-da, bu biznes ustuvorliklari o'zgarganda, to'liq xom ma'lumotlar to'plami mavjud emasligini anglatadi, chunki uni saqlash juda qimmat edi.
3. Moslashuvchan Hadoop korxonalarga yangi ma'lumotlar manbalariga osongina kirish va ushbu ma'lumotlardan qiymat yaratish uchun har xil turdagi ma'lumotlardan (ham tuzilgan, ham tuzilmagan) foydalanish imkonini beradi. Bu shuni anglatadiki, korxonalar ijtimoiy media, elektron pochta suhbatlari kabi ma'lumotlar manbalaridan qimmatli biznes tushunchalarini olish uchun Hadoop-dan foydalanishlari mumkin. Hadoop jurnalni qayta ishlash, tavsiyalar tizimlari, ma'lumotlarni saqlash, bozor kampaniyasini tahlil qilish va firibgarlikni aniqlash kabi turli xil maqsadlarda ishlatilishi mumkin.
4. Tez Hadoop-ning noyob saqlash usuli taqsimlangan fayl tizimiga asoslangan bo'lib, u asosan ma'lumotlarni klasterda joylashgan joyda "xarita qiladi". Ma'lumotlarni qayta ishlash vositalari ko'pincha ma'lumotlar joylashgan serverlarda bo'ladi, bu esa ma'lumotlarni tezroq qayta ishlashga olib keladi. Agar siz katta hajmdagi tuzilmagan ma'lumotlar bilan ishlayotgan bo'lsangiz, Hadoop bir necha daqiqada terabaytlar va soatlarda petabaytlarni samarali qayta ishlashga qodir.