4) RHIVE - R-ni ish stantsiyalariga o'rnating va Hadoop-da ma'lumotlarga ulaning
Agar siz Hive so'rovlarini R interfeysidan ishga tushirishni istasangiz, RHIVE - bu Apache Hive'dan ma'lumotlar bazasi nomlari, ustun nomlari va jadval nomlari kabi metama'lumotlarni olish funksiyalariga ega bo'lgan to'plam. RHIVE HiveQL-ni R tili funksiyalari bilan kengaytirish orqali Hadoop-da saqlangan ma'lumotlarga R dasturlash tilida mavjud bo'lgan boy statistik kutubxonalar va algoritmlarni taqdim etadi. RHIVE funktsiyalari foydalanuvchilarga Apache Hive yordamida kataloglangan Hadoop klasterida saqlangan ma'lumotlarga R statistik o'rganish modellarini qo'llash imkonini beradi . Hadoop R integratsiyasi uchun RHIVE-dan foydalanishning afzalligi shundaki, u operatsiyalarni parallellashtiradi va ma'lumotlar harakatining oldini oladi, chunki ma'lumotlar operatsiyalari Hadoop-ga tushiriladi.
ORCH oracle bo'lmagan Hadoop klasterlarida yoki har qanday boshqa Oracle katta qurilmalarida ishlatilishi mumkin. Mappers va Reducers R dasturlash tilida yozilgan va MapReduce vazifalari R muhitidan yuqori darajadagi interfeys orqali amalga oshiriladi. ORCH for R Hadoop integratsiyasi bilan R dasturchilari Hadoop Cluster apparat yoki dasturiy ta'minoti kabi Hadoop muhiti tafsilotlarini bilish uchun Java kabi yangi dasturlash tilini o'rganishlari shart emas. ORCH ulagichi, shuningdek, foydalanuvchilarga MapReduce dasturlarini Hadoop klasteriga o'rnatilishidan ancha oldin bir xil funktsiya chaqiruvi orqali mahalliy darajada sinab ko'rish imkonini beradi.
R va Hadoop yordamida katta ma'lumotlar tahlilini amalga oshirish uchun ochiq manba variantlari soni doimiy ravishda kengayib bormoqda, ammo oddiy Hadoop MapReduce ishlari uchun R va Hadoop Streaming hali ham eng yaxshi yechim bo'lib qolmoqda. R va Hadoop kombinatsiyasi sizga kerak bo'lgan unumdorlik, kengayish va moslashuvchanlik bilan birgalikda tezkor, bashoratli tahlillarni yaratish uchun katta ma'lumotlar bilan ishlaydigan mutaxassislar uchun zarur vositalar to'plamidir.