Ko’poqimli tizimlar - bu ko'rsatmalar darajasidagi parallelizmdan foydalanadigan bir vaqtning o'zida ip darajasidagi parallelizmdan foydalanish uchun ko'p sonli, dinamik ravishda rejalashtirilgan quvurli protsessor resurslaridan foydalanadigan apparatli ko'p ish zarralarining o'zgarishi. Ko’poqimlikni rag'batlantiradigan asosiy tushuncha shundan iboratki, ko'p sonli protsessorlar ko'pincha bitta ish zarrachasidan samarali foydalanishga qaraganda ko'proq funktsional birlik parallelligiga ega. Bundan tashqari, registr nomini o'zgartirish va dinamik rejalashtirish bilan ular orasidagi bog'liqlikdan qat'i nazar, mustaqil oqimlardan bir nechta ko'rsatmalar berilishi mumkin; bog'liqliklarni hal qilish dinamik rejalashtirish qobiliyati bilan amalga oshirilishi mumkin.
Ko’poqimlikni mavjud dinamik mexanizmlarga tayanganligi sababli, u har bir tsiklda resurslarni almashtirmaydi. Buning o'rniga, Ko’poqimlik har doim bir nechta ish zarralaridagi ko'rsatmalarni bajaradi va ko'rsatmalar uyalarini va qayta nomlangan registrlarni tegishli iplari bilan bog'lashni apparatga qoldirib ketadi. kontseptual ravishda protsessorning quyidagi protsessor konfiguratsiyalari uchun superskalyar resurslardan foydalanish qobiliyatidagi farqlarni ko'rsatadi. Yuqori qism ko'rsatiladi
Superskalar protsessorning muammoli slotlarini turli yondashuvlarda to'rtta ip qanday ishlatadi. Yuqoridagi to'rtta ip standart superskalar protsessorda ko'p ish zarralarini qo'llab-quvvatlamasdan qanday qilib yolg'iz ishlashni ko'rsatadi. Pastki qismidagi uchta misol uchta ko'p ish lab chiqarish variantida birgalikda ishlashni qanday bajarishini ko'rsatadi. Gorizontal o'lcham har bir soat siklida ko'rsatmalar berish qobiliyatini ifodalaydi. Vertikal o'lcham soat sikllari ketma-ketligini ifodalaydi. Bo'sh (oq) quti ushbu soat siklida tegishli muammo uyasi ishlatilmaganligini bildiradi. Kulrang va rangning ohanglari ko'p tarmoqli protsessorlarda to'rt xil ipga mos keladi. Ushbu rasmda ko'rsatilmagan qo'pol ko'p tarmoqli uchun quvur liniyasini ishga tushirishning qo'shimcha effektlari qo'pol ko'p ish zarralari uchun o'tkazuvchanlikning yanada yo'qolishiga olib keladi.
Qanday qilib to'rtta ip ko'p ish zarralarini qo'llab-quvvatlamaydigan superskalyarda mustaqil ravishda ishlaydi. Pastki qismda protsessorda uchta ko'p qirrali opsiyadan foydalangan holda samaraliroq ishlash uchun to'rtta ipni qanday qilib birlashtirish mumkinligi ko'rsatilgan:
■ Dag'al ko'p qirrali super skalar
■ Aniq zarrachali ko'p qirrali super scalar
■ Bir vaqtning o'zida ko'p qirrali super skalar. superscalar apparat
multithreading qo'llab-quvvatlash holda, masala uyasi foydalanish ko'rsatmalar darajasida parallelizm yo'qligi bilan cheklangan. Bundan tashqari, ko'rsatmalar keshini o'tkazib yuborish kabi katta to'xtash butun protsessorni bo'sh qoldirishi mumkin. Dag'al donali ko'p tarmoqli superskalarda uzun stendlar protsessor resurslaridan foydalanadigan boshqa ipga o'tish orqali qisman yashiringan.
Garchi bu to'liq bo'sh soat sikllari sonini kamaytirsa-da, quvur liniyasining ishga tushirilishi hali ham bo'sh turish davrlariga olib keladi va ILP uchun cheklovlar barcha emissiya slotlaridan foydalanilmasligini anglatadi. Noto'g'ri holatda, iplarning bir-biriga qo'shilishi, asosan, bo'sh soat sikllarini yo'q qiladi. Ma'lum bir soat siklida faqat bitta ip ko'rsatmalar berganligi sababli, ko'rsatmalar darajasidagi parallelizmdagi cheklovlar hali ham ba'zi soat sikllari ichida bo'sh tirqishlarga olib keladi.
2-rasm
SMT holatida ip darajasidagi parallelizm va ko'rsatmalar darajasidagi parallelizm ikkalasi ham bir vaqtning o'zida bir nechta ish zarrachalari muammoli slotlardan foydalanadi. Ideal holda, muammo uyasidan foydalanish resurslarga bo'lgan ehtiyojdagi nomutanosiblik va bir nechta oqimlar bo'yicha manba mavjudligi bilan cheklangan. Amalda, boshqa omillar qancha uyalar ishlatilishini cheklashi mumkin. ushbu protsessorlarning haqiqiy ishlashini sezilarli darajada soddalashtirgan bo'lsa-da, u umuman ko'p tarmoqli va xususan SMTning potentsial ishlash afzalliklarini ko'rsatadi.
2-rasmda ikkita ip uchun apparat ta'minotiga ega bo'lgan Intel Core i7 960 ning bitta protsessorida ko'p ish zarralarini o'tkazishning unumdorligi va energiya afzalliklari tasvirlangan. O'rtacha tezlik 1,31 ni tashkil qiladi, bu apparatli ko'p ish zarralari uchun oddiy qo'shimcha resurslarni hisobga olgan holda yomon emas. Energiya samaradorligining o'rtacha yaxshilanishi 1,07 ni tashkil etadi, bu juda yaxshi. Umuman olganda, siz energiya neytral bo'lgan ishlash tezligidan mamnun bo'lasiz.
Endi biz bir nechta iplar bitta protsessor resurslaridan qanday samaraliroq foydalanishini ko'rganimizdan so'ng, biz ularni bir nechta protsessorlardan foydalanish uchun qanday ishlatishni ko'rsatamiz.
1. To'g'ri yoki noto'g'ri: ko'p ish zarralari ham, ko'p yadroli ham chipdan ko'proq samaradorlikni olish uchun parallelizmga tayanadi.
2. To'g'ri yoki noto'g'ri: Bir vaqtning o'zida ko'p ish zarralari (SMT) dinamik ravishda rejalashtirilgan, tartibsiz protsessorning resurslardan foydalanishni yaxshilash uchun iplardan foydalanadi.
Dostları ilə paylaş: |