28-ma’ruza
Superkompyuterlar va klasterli ishlov berish tizimlari
Reja:
1.Superkompyuterlar
2.Klaster tizimlari
1.Superkompyuterlar
Hozirgi vaqtda bu sinfga mansub hisoblash tizimlariga aniq ta'rif berish
qiyin. Agar o'tgan asrning oxirida bunday kompyuterlar Cray va shunga o'xshash
tizimlar deb atalgan bo'lsa, bu asrning boshlarida klasterlarni hisoblash uchun
"superkompyuter" atamasi ishlatilgan.
Kompyuterni superkompyuter deb tasniflash mezoni haqida ham turlicha
fikrlar mavjud. Vikipediyada ta'rif quyidagicha shakllantirilgan: "Superkompyuter
- bu texnik parametrlari bo'yicha mavjud kompyuterlarning ko'pchiligidan sezilarli
darajada ustun bo'lgan kompyuter". Biroq, bu juda arzimas taklif, bunga baribir
rozi bo'lish mumkin.
Ba'zi ekspertlarning fikricha, agar tizim og'irligi bir tonnadan oshsa yoki
quvvati bir MVt dan oshsa yoki uning ishlashi ma'lum miqdordagi PFlop / s1 dan
ortiq bo'lsa, superkompyuterlar sinfiga kiradi. Hisoblash klasteriga birlashtirilgan,
lekin bu ko'rsatkichlarga etib bormagan kompyuterlarni yuqori samarali hisoblash
deb tasniflash mumkin.
Superkompyuterlar milliy boylik hisoblanadi va ularning rivojlanishi davlat
texnik siyosatining ustuvor yo'nalishlaridan biridir. Superkompyuterlar quyidagi
asosiy xususiyatlarga ega:
- juda yuqori ishlash;
- vektorli protsessorlar va registrlardan foydalanish;
- suzuvchi nuqtali operatsiyalarni tez bajarilishiga e'tibor qaratish;
- yuqori narx (ba'zida bu xususiyat asosiy hisoblanadi, u bir necha million
dollarlik bo'lishi kerak).
An'anaviy ravishda superkompyuterlar quyidagi sohalarda qo'llaniladi:
- ilmiy tadqiqotlar (kvant fizikasi, kimyo, issiqlik va gaz dinamikasi,
yadroviy tadqiqotlar);
- texnologiya (aerokosmik, avtomobilsozlik, atom energiyasi, geologik
qidiruv);
- mudofaa kompleksi (ommaviy qirg'in qurollarini ishlab chiqish, harbiy
texnikaning dizayni va boshqalar);
- tijorat ilovalari - eng zamonaviy maydon (o'ta katta ma'lumotlar bazalari,
axborot logistikasi va boshqalar).
Superkompyuterlar, qoida tariqasida, ko'p protsessorli dizaynda ishlab
chiqariladi va odatda bir -biriga mahkam bog'langan MCMD tizimlari hisoblanadi.
Ular bir qator Amerika va Yaponiya firmalari tomonidan ishlab chiqariladi:
- Silicon Graphic and Cray Research - turli xil Cray modellari ( Cray T 3 E ,
T 90, Origin 2000);
- NEC - Yaponiya (NEC SX -5);
- Fujitsu - Yaponiya (Fujitsu VPP);
- IBM (IBM RS / 6000 SP, No''mon - Q 2000, TeraGrid kuni asosida Intel
Itanium) va boshqalar .
Klassik misollar - Cray Research va nCube superkompyuter firmalarining
rivojlanishi . Bu sinfdagi mahalliy o'zgarishlar MVK "Elbrus-2" ko'p protsessorli
hisoblash tizimlarini o'z ichiga oladi (1985).
Cray superkompyuterlari
Asosiy model
Cray superkompyuterlarining asosiy modeli-bu umumiy xotirali tizimga
birlashtirilgan 16 protsessorni (CPU) o'z ichiga olgan Cray Y-MP C90 vektor-
konveyerli kompyuter [2]. Fig. 16.1da ushbu kompyuterning blok -diagrammasi
ko'rsatilgan [53].
Bu erda, CPU 0 blokining o'ng tomonida, protsessorning ichki tuzilishi
ko’rsatilgan.
Tasodifiy kirish xotirasi (Xotira) protsessorlar va kirish -chiqish bo'limi
o'rtasida taqsimlanadi. U 80 bitli so'zlardan foydalanadi:
64-bit ma'lumot va 16 - xatolarni tuzatish uchun. Namuna olish tezligini
oshirish uchun xotira 8 ta bo'limga bo'linadi, ularning har birida 8 ta bo'lim,
ikkinchisida - 16 ta bank. Jismoniy manzillar bir -biriga bog'langan bo'lib, bir
nechta banklarga parallel kirish imkoniyati mavjud.
I / U bo'limi uchta kanalni boshqaradigan uchta bo'limni o'z ichiga oladi:
- LOSP - past tezlik;
- HISP - yuqori tezlik;
- VHISP - juda yuqori tezlik.
Protsessorlararo aloqa bo'limi (Interprocessor
Aloqa)
protsessorlar
o'rtasida
nazorat
ma'lumotlarini
almashishni
ta'minlaydi. U quyidagilarni o'z ichiga oladi:
a) registrlar:
- vektor (V);
- manzil (A);
- skalyar (S);
- yordamchi (B - manzil, T - skalyar);
- vektor uzunligi va vektor niqobi;
b) funktsional qurilmalar (4 guruh):
- manzil (ikkita);
- skalyar (to'rtta);
- vektor (beshdan ettigacha);
- suzuvchi nuqta (uchta);
c) buyruq buferlarini o'z ichiga olgan boshqaruv bo'limi.
Vektorli va suzuvchi nuqtali qurilmalar takrorlanadi. Vektorli registrlar juft
va toq bo'linadi. Ulardan olingan ma'lumotlar bir vaqtning o'zida ikkita quvur
liniyasi (nol va birinchi) orqali qayta ishlanadi. Natijalar, shuningdek, chiqish
registrining juft va toq pozitsiyalariga yoziladi. Funktsional qurilmalar
truboprovodlarida bosqichlar soni har xil, lekin bosqichning bajarilish vaqti 1 tsikl.
Buyruq uzunligi: 16 bitli 1, 2 yoki 3 ta paket. So'zning uzunligi 64 bit, ya'ni 4 ta
paket. Dasturning maksimal uzunligi bitta Gigaslovo.
1-расм. Cray Y-MP C90 superkompyuterining tuzilishi:
CPU 0- CPU 15 -protsessorlar;
Protsessorlararo aloqa - protsessorlararo aloqa bo'limi ;
I / U bo'limi - kirish -chiqish qismi;
FU - funktsional birliklar
Barcha asosiy operatsiyalar: xotiraga kirish, buyruqlarning bajarilishi va
ularning parolini hal qilish quvurlar orqali amalga oshiriladi. Funktsional birliklar
mustaqil ishlaydi va yopiq parallellikni ta'minlaydi. Masalan, a:
(b
c)
d
e
ifodasini baholashda qo'shish va ko'paytirish bir vaqtning o'zida bajariladi.
Vektorli ishlov berish massivning tezlashtirilgan operatsiyalarini ta'minlaydi.
Misol uchun , bir yilda Loop
I uchun: = 1 dan ngacha
a [i]: = b [i] + c [i];
b va c massivlari deyarli bir vaqtning o'zida yoki bir soat aylanishiga siljish
bilan vektor registrlariga (to'liq yoki qismlarga) yuklanadi. Katta massivlar uchun
bu operatsiya bir necha marta takrorlanadi.
Qatorlar qanchalik uzun bo'lsa, quvurning dastlabki to'ldirilishining pastadir
va butun dasturning bajarilish vaqtiga ta'siri shunchalik kam bo'ladi.
Hosildorlikni
oshirish
uchun
funktsional
qurilmalarning
vektorli
uzatmalaridan foydalaniladi. Bunda natijalar reestri quyidagi operatsiyalar uchun
kiritiladi: chiqish darhol kirishga beriladi. Ishlash chuqurligi har qanday bo'lishi
mumkin, masalan, quyidagi operatsiyalar uchun:
- o'qish vektorlari;
- qo'shimcha;
- ko'paytirish;
- yozish vektorlari.
Cray Y-MP C90 ning eng yuqori ko'rsatkichlari quyidagicha aniqlanadi. Ikki
quvurli quvurlar 2 natija / tsiklni, qo'shish va ko'paytirish aloqasini - 4 ops / tsiklni
beradi. 16 protsessorning bir vaqtning o'zida ishlashi 16 GFlops tezligiga olib
keladi.
Cray T3D kabi juda parallel kompyuterlar
Bu kompyuterlar quyidagi xususiyatlar bilan ajralib turadi:
- kuchli mikroprotsessorlardan foydalanish;
- to'rtburchaklar panjara, kalit yoki ko'p o'lchovli torusga asoslangan
protsessorlararo aloqa tarmog'ini qo'llash;
- tarqatilgan xotira;
- asosiy kompyuterning mavjudligi (master yoki master).
Masalan, Cray T3D kompyuteri 32 dan 2048 gacha protsessorni o'z ichiga
oladi, ularning har biri har qanday xotira moduliga kirish imkoniyatiga ega.
U Cray Y-MP C90 bo'lishi mumkin bo'lgan asosiy kompyuterga ulanadi.
Asosiy kompyuter dasturlarni oldindan qayta ishlashni amalga oshiradi (masalan,
kompilyatsiya).
Cray T3D kabi ulkan parallel kompyuter uchta asosiy komponentni o'z
ichiga oladi:
- hisoblash tugunlari;
- protsessorlararo aloqa tarmog'i;
- kirish-chiqish tugunlari.
Hisoblash tuguni ikkita ishlov berish elementidan (PE), tarmoq interfeysi va
blokli uzatish boshqaruvchisidan iborat. PE tarkibiga mahalliy va kesh xotirasi
bilan jihozlangan DEC Alpha mikroprotsessori kiradi. Ikkala ishlov berish
elementi ham bir -biridan mustaqil ishlashi mumkin. Tarmoq interfeysi ular
orasidagi xabarlarni shakllantirish, uzatish va qabul qilishni ta'minlaydi. Blok
uzatish boshqaruvchisi xotiraga to'g'ridan -to'g'ri kirishni va ishlov berish
elementlari o'rtasida ma'lumotlarni tarqatishni qo'llab -quvvatlaydi.
Protsessorlararo aloqa tarmog'i hisoblash tugunlari va kirish -chiqish
tugunlari o'rtasidagi aloqani ta'minlaydi. Bu rasmda ko'rsatilgan ikki tomonlama
uch o'lchovli torus. 16.2 va quyidagi xususiyatlarga ega:
- aloqa tarmog'ining diametri bo'yicha baholanadigan minimal uzunlik;
- shikastlanganda aylanma yo'lni tanlash imkoniyati.
2-rasm. Minimal uzunlik (diametr) ni ta'minlaydigan protsessorlararo aloqa
tarmog'i konfiguratsiyasi
A aloqa tarmog'ining diametri d - uning tugunlari orasidagi maksimal
masofa. Shunday qilib, ikki o'lchovli panjara uchun n ga mutanosib, bu erda n-
saytlar soni.
Ko'p sonli tugunli tizimlar uchun eng istiqbolli-n o'lchovli giperkubaning
arxitekturasi. Bu arxitektura 2n tugunni o'z ichiga oladi va 2n ishlov berish
elementlarini bog'laydi. Uning diametri d ln (n) ga proportsionaldir. N = 2 (ikki
o'lchovli giperkub) uchun tarmoq to'rtburchaklar; n = 3 (uch o'lchovli) - oddiy kub;
n = 4 - kubdagi kub va boshqalar.
Masalan, 128 ta ishlov berish elementlari uchun d diametri 6 ga, 2048 ta
ishlov berish elementlari uchun d - 12 ga teng. Minimal uzunlik aloqa tarmog'ining
mos konfiguratsiyasi va tugun raqamlarining o'zaro bog'lanishi bilan ta'minlanadi.
16.2.
Ma'lumot almashish tartibi marshrutizatorlar tomonidan tanlanadi va uchta
o'q bo'ylab harakatlanish mumkin: X, Y va Z va ofset ijobiy yoki salbiy bo'lishi
mumkin.
Har bir protsessor elementiga uning jismoniy holatini aniqlaydigan yagona
jismoniy raqam beriladi.
Bundan tashqari, tizim mantiqiy tuzilishdagi o'rnini (uch o'lchovli torus)
aniqlaydigan mantiqiy PE raqamlaridan foydalanadi.
Bu raqam faqat faol elementlarga beriladi. Masalan, 512 protsessorli Cray
T3D konfiguratsiyasi 520 ta jismoniy PEni o'z ichiga oladi, ulardan 8 tasi ortiqcha.
Tizimning eng samarali ishlashi barcha pe -ning bir xil yuklanishi bilan
ta'minlanadi, masalan, to'rtburchaklar qoliplarni qayta ishlashda. Protsessorlar
o'rtasida xabarlar almashinuvi hisoblash jarayonining kechikishiga olib keladi. U
ikkita komponentdan iborat:
- xabarni ishga tushirish vaqti;
- uni yuborish vaqti.
Xabar qancha uzoq bo'lsa, birinchi komponentning ta'siri shunchalik kam
bo'ladi.
Dostları ilə paylaş: |