Page 32
Bu ilg'or va tezkor tahlillar uchun mo'ljallangan xotiradagi ma'lumotlarni qayta
ishlash mexanizmi. U pastdan yuqoriga stsenariydan unumdorlikni oshirish uchun
ishlatiladi. Xotiradagi hisoblash va boshqa yaxshilanishlar tufayli Spark, ayniqsa, katta
hajmdagi ma'lumotlarni qayta ishlash uchun Hadoop'dan 100 marta tezroq ishlaydi.
Ma'lumotlar diskda saqlanganida, Apache Spark ham tez ishlaydi. Endi u keng
miqyosda diskda tartiblash bo'yicha jahon rekordini saqlab turibdi. Spark katta
ma'lumotlar muhitida bajarish uchun joriy o'quv vazifalarini qayta bajaradigan umumiy
o'rta dastur qatlamini taqdim etadi. Bu kabi o'rta dastur qatlami odatda o'rganishning
turli vazifalari uchun foydali bo'lgan umumiy operatsiyalar va primitivlarni o'z ichiga
oladi.
Bu real vaqtda taqsimlangan hisoblash imkonini beruvchi dastur. O'rnatish va
ishlatish oson. U bilan har qanday dasturlash tilidan foydalanish mumkin. U
nosozliklarga chidamli va kengaytirilishi mumkin.
Qsimlangan va yuqori unumli hisoblash uchun oqim dizayni d uchun ishlov berish
mexanizmi . Kech kelgan ma'lumotlar bilan ham, u aniq ishlaydi. Ajoyib kechikish va
o'tkazish qobiliyatini saqlab qolgan holda minglab tugunlarga o'lchash oson .
H2O xotiradagi ma'lumotlarni qayta ishlash uchun eng tezkor vosita bo'lib, u katta
ma'lumotlarning prognozini tahlil qilish uchun ishlatiladi. U bir nechta tugunlarda
ishlashi mumkin bo'lgan taqsimlangan, kengaytiriladigan va ochiq kodli dasturiy
ta'minotdir.
Ushbu vositalarni baholashda qo'llab-quvvatlanadigan til, ijro modeli, tegishli
mashinani o'rganish vositalari, xatolarga chidamlilik va kechikish hisobga olinadi.
Katta ma'lumotlar turli sohalarda mavjudligini his qildi. U ommaviy axborot
vositalari, o'yin-kulgi, aloqa, sog'liqni saqlash, davlat xizmati, ta'lim, sug'urta, ulgurji
savdo, marketing, transport, kommunal xizmatlar, energetika, tabiiy resurslar va ishlab
chiqarish va boshqa sohalarda qo'llanilgan.
Katta ma'lumotlar tibbiy yordamda tibbiy ma'lumotlarni samarali saqlash, qayta
ishlash, so'rash va tahlil qilish uchun ishlatiladi. Sog'liqni saqlash sanoati tibbiy katta
ma'lumotlar ilovalari tomonidan sezilarli darajada ta'sirlanadi. Bu klinik sinov
ma'lumotlarini tahlil qilish, kasallik namunalarini tahlil qilish, bemorlarni parvarish
qilish tahlili va sifati, dori-darmonlarni tadqiq qilish va ishlab chiqish va boshqalar
bo'lishi mumkin.
Masalan, Nyu-Yorkdagi Sinay tog'idagi tibbiyot markazi Ayasdining katta
ma'lumotlar vositalaridan ba'zi bakteriyalar turlarining antibiotiklarga chidamliligini
aniqlash uchun barcha ichak tayoqchasi genetik ketma-ketliklarini, shu jumladan
millionga yaqin DNK o'zgarishlarini o'rganish uchun foydalanadi. Ma'lumotlar
xususiyatlarini tahlil qilish uchun Ayasdi topologik ma'lumotlar tahlilini, yangi
matematik tadqiqot yondashuvini qo'llaydi.