BIG DATA
Iqtisodiyotda axborot-kommunikatsion texnologiyalar va tizimlar
Ro'zmamatov Abdulaziz
KB-61
Reja:
1)
Big data nima?
2)
Big dataning asosiy 8 atamasi
3)
Big dataning tafsiflanishi
BIG DATA
Big data(katta ma'lumotlar) - juda katta hajmdagi bir jinsli
bo'lmagan va tez tushadigan raqamli ma'lumotlar bo'lib, ularni
odatiy usullar bilan qayta ishlab bo'lmaydi. Ba'zi hollarda, katta
ma'lumotlar tushunchasi bilan birga shu ma'lumotlarni qayta
ishlash ham tushuniladi. Asosan, analiz obyekti katta
ma'lumotlar deb ataladi.
Big data atamasi 2008-yilda dunyoga kelgan. Nature jurnali muharriri
Klifford Linch dunyo ma'lumotlar hajmining juda tez sur'atda o'sishiga
bag'ishlangan maxsus sonida big data atamasini qo'llagan. Biroq, katta
ma'lumotlar avval ham bo'lgan. Mutaxassislarning fikricha, kuniga 100 gb
dan ko'p ma'lumot tushadigan oqimlarga big data deb aytilar ekan.
«Katta ma’lumotlar» tushunchasi o‘zi nisbatan yangi bo‘lsa-da, aslida uning
kelib chiqishi birinchi ma’lumotlar markazlari va relyasion ma’lumotlar
bazalarini ishlab chiqish boshlangan 1960-1970-yillarga to‘g‘ri keladi.
Katta ma'lumotlarni analiz qilish, inson his etish
imkoniyatidan tashqarida bo'lgan qonuniylatlarni
aniqlashda yordam beradi. Bu esa kundalik
hayotimizdagi barcha sohalar, hukumatni
boshqarish, tibbiyot, telekommunikatsiya, moliya,
transport, ishlab chiqarish va boshqa sohalarni
yanada yaxshilash, ularning imkoniyatlarini
oshirish, muommolarga muqobil yechimlar izlab
topish imkonini yaratadi.
BIG DATAning asosiy 8 atamasi
1.
Data lake(ma'lumotlar ko'li) - qayta ishlanmagan katta ma'lumotlar
ombori.
2. Data science(ma'lumotlar haqidagi fan) - analiz muommolarini ,
ma'lumotlarni qayta ishlash va ularni raqamli ko'rinishda taqdim etishni
o'rganadigan fan.
3. Data mining(ma'lumotlarni topish) - biron qonuniyatni topish maqsadida
ma'lumotlarni intellektual analiz qilishga aytiladi. Isroillik matematik
Grigoriy Pyatetskiy-Shapiro 1989-yilda bu atamani fanga kiritgan.
4. Machine learning(mashinali o'qitish) - o'zi o'rganadigan dasturlar yaratish
amaliyoti va nazariyasi, sun'iy intellektning katta qismi.
5. Deep learning(chuqur o'qitish) - yanada murakkab va yanada mustaqil bo'lgan o'zi o'qidigan dasturlar
yaratadigan mashinali o'qitish turi. Oddiy mashinali o'qitish hollarida boshqariladigan malaka yordamida
kompyuter bilimlarni aniqlab oladi: dasturchi algoritmga ma'lum misollarni ko'rsatadi, xatolarni qo'lda
to'g'rilaydi. Deep learningda esa, tizim o'zi o'z funksiyalarini loyihalaydi, ko'p darajali hisob-kitoblar amalga
oshiradi va atrof-muhit haqida xulosalar qiladi.
6. Sun'iy neyron tarmog'i - oddiy protsessorlar(sun'iy neyronlar) birlashtirilgan tizimi bo'lib, insonning nerv
tizimini imitatsiya qiladi. Bunday struktura evaziga, neyron tarmoqlari dasturlanmaydi, ular o'qitishadi.
Huddi haqiqiy neyronlar kabi, protsessorlar signallarni oddiygina qabul qilishadi va boshqa
protsessorlarga o'zatishadi. Shu bilan birga, boshqa butun tizim algoritmlar bajara olmaydigan murakkab
topshiriqlarni bajaradi.
7. Business intelligence(biznes-analitika) - aniq strukturaga ega bo'lmagan juda katta hajmdagi
ma'lumotlarni qayta ishlash natijasida muqobil biznes yechimlar izlashga aytiladi.
8. Big data(katta ma'lumotlar) - juda katta hajmdagi bir jinsli bo'lmagan va tez tushadigan raqamli
ma'lumotlar bo'lib, ularni odatiy usullar bilan qayta ishlab bo'lmaydi.
Barcha yig‘ilgan Big Data ma’lumotlari olingan manbalarga qarab
tasniflanishi mumkin. AQShning Gartner kompaniyasi «katta
ma’lumotlar»ga kiritilgan ma’lumotlarning quyidagi tasnifini taklif qiladi:
1.
Operatsion ma’lumotlar. Bu onlayn tranzaksiyalarni qayta ishlash
jarayonida mavjud bo‘lgan yoki onlayn tahliliy ma’lumotlar bazasidan
olingan mijozlar, yetkazib beruvchilar, hamkorlar va xodimlar
to‘g‘risidagi ma’lumotlar.
2.
«Qorong‘i» ma’lumotlar. Tashkilotlar tomonidan ataylab
saqlanmaydigan yoki to‘planmagan, lekin biznesni yuritish yoki tarmoq
xizmatlari bilan ishlash jarayonida tasodifiy (yo‘lda) yaratilgan va
Internet arxivlarida qoladigan ma’lumotlar.
3. Tijorat ma’lumotlari. Katta ma’lumotlar texnologiyasi
imkoniyatlari paydo bo‘lishidan oldin, turli sohalarda qimmatli
tijorat ma’lumotlarining agregatorlari mavjud edi.
4. Rasmiy ma’lumotlar. Davlat organlari tomonidan tarqatiladigan
ma’lumotlar (bayonotlar, press-relizlar, ob-havo prognozlari,
munitsipal rivojlanish rejalari to‘g‘risidagi ma’lumotlar), ochiq davlat
registrlari, e’lon qilingan normativ-huquqiy hujjatlar (shu jumladan,
ularning loyihalari) eng ishonchli va eng ko‘p tuzilgan hisoblanadi.
5. Ijtimoiy tarmoqlar va xizmatlardan olingan ma’lumotlar. Yirik
ijtimoiy tarmoqlarning (Facebook, Twitter, Instagram va boshqalar)
funksiyalari, biznes, bozor munosabatlarida jismoniy shaxslarning
ishtiroki, yangi va istiqbolli mahsulotlar, xizmatlar, kompaniyalar
haqida yana bir ma’lumot manbasini yaratdi.
Tahlil qilishning to‘rtta asosiy usuli
mavjud:
1.
Tavsiflovchi tahlil (descriptive analytics)
2.
Bashoratli tahlil (predictive analytics)
3.
Retseptiv tahlil (prescriptive analytics)
4.
Tashxisli tahlil (diagnostic analytics)
E'TIBORINGIZ UCHUN RAXMAT
Document Outline - Слайд 1, BIG DATA
- Слайд 2, Reja:
- Слайд 3, BIG DATA
- Слайд 4
- Слайд 5
- Слайд 6, BIG DATAning asosiy 8 atamasi
- Слайд 7
- Слайд 8
- Слайд 9
- Слайд 10, Tahlil qilishning to‘rtta asosiy usuli mavjud:
- Слайд 11, E'TIBORINGIZ UCHUN RAXMAT
Dostları ilə paylaş: |