R-ning analitik kuchi + Hadoop-ning saqlash va qayta ishlash quvvati = Katta ma'lumotlarni tahlil qilish uchun ideal echim
R - bu modellar bo'yicha statistik ma'lumotlarni tahlil qilish va tahlil natijalarini rangli grafikalarga aylantirish uchun ajoyib ma'lumotlar fanini dasturlash vositasi. Hech shubha yo'qki, R statistiklar, ma'lumotlar olimlari, ma'lumotlar tahlilchilari uchun eng ko'p afzal qilingan dasturlash vositasidir.va ma'lumotlar arxitektorlari, lekin katta ma'lumotlar to'plamlari bilan ishlashda u qisqaradi. R dasturlash tilining asosiy kamchiliklaridan biri shundaki, barcha ob'ektlar bitta mashinaning asosiy xotirasiga yuklanadi. RAM xotirasiga petabayt o'lchamdagi katta ma'lumotlar to'plamini yuklab bo'lmaydi; Hadoop R tili bilan integratsiyalashganda ideal yechim bo'ladi. R dasturlash tilining xotiradagi, yagona mashina cheklanishiga moslashish uchun ma'lumotlar olimlari o'zlarining ma'lumotlar tahlilini katta ma'lumotlar to'plamidagi ma'lumotlar namunasi bilan cheklashlari kerak. R dasturlash tilining bu cheklanishi katta ma'lumotlar bilan ishlashda katta to'siq bo'lib keladi. R juda keng ko'lamli emasligi sababli, yadro R dvigateli faqat cheklangan miqdordagi ma'lumotlarni qayta ishlay oladi.
Aksincha, Hadoop kabi taqsimlangan ishlov berish tizimlari katta ma'lumotlar to'plamidagi (petabayt diapazoni) murakkab operatsiyalar va vazifalar uchun kengaytirilishi mumkin, ammo kuchli statistik tahliliy qobiliyatlarga ega emas. Hadoop katta ma'lumotlarni qayta ishlash uchun mashhur ramka bo'lganligi sababli, R-ni Hadoop bilan integratsiya qilish keyingi mantiqiy qadamdir. Hadoop-da R-dan foydalanish ma'lumotlar to'plamining o'lchamiga qarab kengaytirilishi mumkin bo'lgan yuqori darajada kengaytiriladigan ma'lumotlar tahlili platformasini taqdim etadi. Hadoop-ni R bilan integratsiyalash ma'lumotlar olimlariga R-ni katta ma'lumotlar to'plamida parallel ravishda ishlatish imkonini beradi, chunki R tilidagi ma'lumotlar fanlari kutubxonalarining hech biri uning xotirasidan kattaroq ma'lumotlar to'plamida ishlamaydi. R va Hadoop bilan Big Data analitikasi vertikal masshtablash uchun tovar apparat klasteri tomonidan taklif qilingan xarajat qiymati daromadi bilan raqobatlashadi.