Оқулық Қазақстан Республикасы Білім және ғылым министрлігі бекіткен Алматы, 2011


§1.3.3 Ортақ жадылы параллель компьютерлер



Pdf көрінісі
бет48/121
Дата31.08.2022
өлшемі2,81 Mb.
#38343
түріОқулық
1   ...   44   45   46   47   48   49   50   51   ...   121
Байланысты:
duisembiev-parallel-esep

§1.3.3 Ортақ жадылы параллель компьютерлер 


83 
 
Ортақ жадылы параллель компьютерлерді пайдаланушылардың оларға 
деген қатынасы әрқашанда бірмәнді болмады. Бір жағынан, компьютерлердің 
бұл класын бағдарламалау таратылған жадылы есептеу кластерін 
бағдарламалауға қарағанда едәуір қарапайым болып табылады. Бұл 
жағдайда, массивтердің таратылуын ойлап қажеті жоқ, бағдарламалардың 
ішкі параллельділігі жеңіл сипатталады, жӛндеу процесі тезірек жүреді. 
Екінші жағынан, бұл компьютерлер класының классикалық түрлерінің екі 
кемшілігі бар: процессорлар саны аз және олардың бағасы ӛте жоғары. 
Бірыңғай адрестік кеңістікте жұмыс істеуін сақтай отырып, процессорлар 
санын кӛбейту үшін әртүрлі шешімдер ұсынылды. Соның бірі соңғы 
жылдары кең тараған нұсқа ссNUMA (cache coherent Non Uniform Memory 
Access) архитектурасы негізіндегі шешім. Мұндай архитектурада 
компьютердің жадысы физикалық тұрғыдан таратылған (бӛлінген), ол оның 
масштабталу потенциалын едәуір арттырады. Сонымен қатар мұнда жады 
логикалық тұрғыдын ортақ болып қалады. Бұл SMP компьютерлері үшін 
жасалған программалау әдістері мен барлық технологияларды пайдалануға 
мүмкіндік береді. Мұндай архитектурада жекелеген процессорлардың кэш-
жадысының мазмұны аппаратура деңгейінде жедел жады мазмұнымен 
үйлеседі (кэштің когеренттілік мәселесі шешіледі, cache coherence problem). 
SMP компьютерлерімен салыстырғанда процессорлар санын едәуір арттыра 
отырып, ссNUMA архитектурасы ортақ жадылы компьютерлерге тән емес 
қосымша ерекшеліктерді ұсынды. Жадыға қатынау уақыты бұл қатынастың 
түріне, яғни жергілікті немесе қашықтағы жадыға екеніне байланысты. 
Бағдарламаны жазу процесі ӛзгермей қалады, және жадының физикалық 
таратылуы бағдарламашыға кӛрінбейді. Бірақ-та, бағдарламаның тиімділігі 
жадыға қатынаудың «біртекті еместік» дәрежесіне тікелей байланысты 
екендігі түсінікті болуы анық. 
Осы класқа жататын компьютерлер архитектурасын зерттеуді Hewlett 
Packard Superdome есептеу жүйесін мысалға ала отырып жүргізіп кӛрейік. 
Компьютер 2000 жылы пайда болды, ал 2001 жылы қараша айында ӛткен Тор 
500 тізімінде олар 147 позицияны иеленіп үлгерді. Стандартты комплектіде, 
Hewlett Packard Superdome компьютері жүйені одан ары кеңейтуге мүмкіндік 
бере отырып, 2-ден 64 процессорларға дейін біріктіре алады. Барлық 
процессорлар ссNUMA архитектурасына сәйкес ұйымдастырылған ортақ 
жадыға қатынай алады. Бұл біріншіден, барлық процестер дәстүрлі оқу/жазу 
операциялары арқылы кезкелген жады байтын адрестей отырып, бірыңғай 
адрестік кеңістікте жұмыс істей алады дегенді білдіреді. Екіншіден, 
жойылған жадыға қатынауға қарағанда, жүйедегі жергілікті (локальді) 
жадыға қатынау біршама тезірек жүреді. Үшіншіден, процессорлардың кэш-
жадысында туындайтын деректердің мүмкін сәйкессіздіктері мәселелері 
аппаратура деңгейінде шешілген. Максималды конфигурацияда Superdome 
компьютерінде жедел жады 256 Гбайт-қа дейін болуы мүмкін. Компанияның 


84 
жақын келешектегі жоспарының бірі - компьютер жадысын 1 Тбайтқа дейін 
жеткізу. 
Hewlett Packard Superdome компьютерінің архитектурасы, онда 
микропроцессорлардың бірнеше түрін (типін) пайдалана алатындай етіп 
жобаланған. Бұл әрине, HP Superdome есептеу жүйесі үшін дәстүрлі РА 
ұрпағындағы процессорлар: РА-8600 және РА-8700. Сонымен қатар, есептеу 
жүйесі НР және Intel компаниялары бірігіп құрастырған процессорлардың 
IA-64 архитектуралы келесі ұрпағын да пайдалануға толық дайындалған.
HP 
Superdome 
компьютері 
архитектурасының 
негізін 
айырып/қосқыштардың иерархиялық жүйесімен байланысқан есептеу 
ұяшықтары (cells) құрайды. Әрбір ұяшық, барлық қажетті компоненттері бар 
бір тақшада жүзеге асырылатын симметриялық мультипроцессор болып 
табылады (28 - сурет): 
•процессорлар (4-ке дейін); 
•оперативті жады ( 16 Гбайтқа дейін); 
•ұяшық бақылаушысы; 
•қорек кӛзін түрлендірушілер; 
• енгізу/шығару жүйесімен байланыс. 
Hewlett Packard Superdome ұяшықтары жаңа заманғы ссNUMA 
компьютерлерінің архитектуралық элементтерімен кӛп ұқсас болып келеді. 
Hewlett Packard Superdome компьютерінде мұндай элемент болып ұяшық, 
SGI Origin 3x00 типті машиналарында торап (node), ал Compad Alphaserver 
GS320 сериялы компьютерлерде - QBB (Quad Building Block) болады. Барлық 
жүйелерде әрбір элемент 4 процессордан тұрады. 
28 сурет. Hewlett Packard Superdome компьютері
ұяшықтарының құрылымы

Superdom компьютерінің ұяшық архитектурасында басты орынды 
ұяшық бақылаушысы (контроллер) алады. Бақылаушы - құрамында 24 
миллион транзисторы бар күрделі құрылғы. Ұяшықтың әрбір процессоры 
жады 
жады 
РА-8700 
РА-8700 
Ра-8700 
РА-8700 
Ұяшық 
бақылаушысы 
Е
нгізу
/шыға
ру
бақ
ылау
шы
сы
коммутаторға 


85 
үшін бақылаушыда ӛзінің арнайы порттары бар. Әрбір процессор мен 
контроллер арасындағы деректермен алмасу жылдамдығы 2 Гбай/с. 
Ұяшықтың жадысы 2 - 16 Гбайт құрайды. Ол әрқайсысының ұяшық 
бақылаушысында ӛз порты бар 2 банкаға бӛлінген. Контроллер мен әрбір 
банк арасындағы ақпаратты (деректерді) алмасу жылдамдығы 2 Гбайт/с.
Ұяшық бақылаушысының бір порты әрқашан сыртқы коммутатормен 
байланысқан. Ол ұяшық процессорларын жүйедегі басқа процессорлармен 
алмастыру үшін қажет. Бұл порттың жұмысының жылдамдығы 8 Гбайт/с. 
Процессор, жады басқа ұяшықтар және сыртқы орта арасындағы 
интерфейстік функцияларын (қызметтерін) орындай отырып, ұяшық 
контроллері процессорлардың кэш жадысының когеренттігіне де жауап 
береді. 
Ұяшық – бұл компьютердің тӛрт процессорлық базалық блогы. 
Superdome компьютерінің 64 процессорлы конфигурациясы әрбірінде 32 
процессоры бар 2 бағаннан тұрады (29 сурет). 
1 Баған 2 Баған 
29 сурет. Hewlett Packard Superdome компьютерінің 
жалпы құрылымы. 
Әрбір бағанның құрамында 2-ден сегізпортты бұғаттамайтын 
коммутаторлар бар. Коммутаторлардың барлық порттары 8 Гбайт/с 
жылдамдықпен жұмыс істейді. Әрбір коммутаторға тӛрт ұяшықтан қосылады 
(жалғанады). Коммутатордың 3 порты жүйедегі басқа коммутаторлармен 
байланысын іске асырады (біреуі осы бағанда, екі коммутатор келесіде). 
Қалған порты Hewlett Packard Superdome компьютерінің басқа жүйелерімен 
байланыс жасау үшін сақталып қойылған, яғни бұл компьютердің 
процессорларының жалпы саны 64-тен кӛп болатын кӛпторапты 
конфигурациясын құрастыру мүмкіндігін береді деген сӛз. 
ұяшық 
ұяшық 
ұяшық 
ұяшық 
ұяшық 
ұяшық 
ком
м
утатор
ұяшық 
ұяшық 
ком
м
утатор
ұяшық 
ұяшық 
ұяшық 
ұяшық 
ұяшық 
ұяшық 
ком
м
утатор
ұяшық 
ұяшық 
ком
м
утатор


86 
ссNUMA архитектуралы кезкелген есептеу жүйесінің басты 
сұрақтарының бірі, процессордың жергілікті және қашықтағы жадыға 
қатынасы кезіндегі уақыт айырмашылығы болып табылады. Әрине, SMP – 
компьютеріндегі сияқты бұл айырмашылықтың мүлде болмағаны дұрыс 
болар еді. Бірақ бұл жағдайда жүйе нашар масштабталатын болады. HP 
Superdome компьютерінде процессордың жадыға қатынасы кезінде үш түрлі 
бӛгелістер болуы мүмкін: 

процессор және жады бір ұяшықта орналасады; бұл жағдайда бӛгеліс 
минималды; 

процессор және жады әртүрлі ұяшықтарда орналасады, бірақ бұл екі 
ұяшық та бір коммутаторға жалғастырылған; 

процессор және жады әртүрлі ұяшықтарда орналасады, және бұл екі 
ұяшық әртүрлі коммутаторларға жалғастырылған; бұл жағдайда 
сұраныс екі коммутатор арқылы ӛтуі тиіс және бӛгелістер 
максималды болады. 
Әрине, бұл жерде, бӛгеліс шамасы тек қана процессор мен жадының 
ӛзара орналасуына ғана емес, сонымен қатар процессорлар санына да 
байланысты екені түсінікті. Есептеу жүктемесінің сипаты да маңызды 
параметрлерге жатады. Мысалы, бірмезгілде жұмыс істеп тұрған 
қолданбалар санына байланысты бӛгеліс ӛзгеруі мүмкін. Бӛгелістің 
процессорлар санына байланысы екі ситуация үшін 1-ші кестеде кӛрсетілген 
[9, 13]. Бірінші жағдайда біртарамды қолданбалар, ал екіншісінде 
кӛптарамды 
бағдарламалар 
жұмыс 
істейді. 
Бірінші 
жағдайдан 
айырмашылығы, екінші жағдайда процессорлар кэш-жадысы когеренттігіне 
қолдау кӛрсету үшін қосымша шығындар пайда болады. Екі жағдайда да 
кестеде бӛгелістің орта кӛрсеткіштері келтірілген және сұраныстардың 
жадыға таратылуы бірқалыпты деп есептеледі. 
1 кесте. Процессорлар және жүктеулер санына байланысты бӛгеліс 
Процессорлар 
саны 
Біртарамды 
бағдарламалар нс 
Кӛптарамды 
бағдарламалар нс 

174 
235 

208 
266 
16 
228 
296 
32 
261 
336 
64 
275 
360 
Кӛріп отырғанымыздай, 4 процессорлы конфигурациядан 64-
процессорлыққа кӛшкендегі бӛгелістің арту коэффициенті бар болғаны 1,6 
есе. Яғни, пайдаланушы кӛп жағдайларда дәстүрлі SMP-компьютерлері үшін 
құрылған ӛз бағдарламаларының тиімді іске асырылатынынан үміттенуге 
болады деп айта аламыз. 
HP Superdome компьютері кӛптеген қызықты ерекшеліктерге ие. 
Мысалы, компьютердің бағдарламалық-аппараттық ортасы оны әртүрлі 
баптауға мүмкіндік береді. Hewlett Packard Superdome компьютерін әртүрлі 
бірнеше операциялық жүйелермен жұмыс істейтін (HP UX, Linux, Windows 
2000) бір-біріне тәуелсіз бӛлімдердің жиыны ретінде де құрастыруға болады. 


87 
HP Superdome компьютері архитектурасының ерекшеліктерімен таныса 
отырып, ондағы пайдаланылатын РА-8700 процессорының құрылымын 
қысқаша қарастырып ӛтейік. Егер біз тұтас жүйені тиімді пайдаланғымыз 
келсе, онда оның базалық компоненттерінің ерекшеліктері туралы 
жалпылама түрде болса да түсінігіміз болуы қажет. 
Процессордың тактілік жиілігі 750 МГц. Максималды жүктелу кезінде 
ол бір тактіде тӛрт арифметикалық амал орындай алады. Бұл екі параметр 
оның шектік ӛнімділігінің мәнін анықтайды – 3 Гфлопс. Бұдан базалық 64-
процессорлы HP Superdome компьютерінің шектік ӛнімділігі алынады – 192 
Гфлопс. 
РА-8700 процессорының архитектурасы суперскалярлық. Ол әрбір 
тактіде кодтың ақпараттық құрылымы қанша операция орындауға мүмкіндік 
бере алса сонша орындайды және де осы мезетте қанша функционалдық 
құрылғы қолжетімді болса соншама орындайды. РА-8700 процессоры 
барлығы 10 функционалдық құрылғыдан тұрады: тӛрт құрылғы бүтін санды 
арифметика және логика үшін, тӛртеуі нақты арифметикамен жұмыс істеуі 
үшін, екі құрылғы оқу/жазу операциясы үшін. Әрбір тактіде командаларды 
таңдау құрылғысы кэш-жадыдан 4 команданы оқи (считывает) алады. 
Процессордың кэш-жадысының кӛлемі 2,25 Мбайт, оның 1,5 Мбайты кэш 
деректерге бӛлінсе, қалған 0,75 Мбайт – ол командалар кэші.
Жалпы HP Superdome компьютерлерінің пайдаланылу облысы ӛте кең. 
Россияны алатын болсақ, ғылыми-техникалық есептерді шешуге арналған 64-
процессорлы 
бір 
HP 
Superdome 
компьютері 
Межведомствалық 
суперкомпьютерлік орталықта орналасқан, ал 72-процессорлы екінші 
компьютер Россияның Сбербанкінде жұмыс істеуде. 
Енді ортақ жадылы есептеу жүйелерінің нақты бағдарламалар 
ӛнімділігін тӛмендетуге алып келетін кейбір ерекшеліктерін атап ӛтейік.
Амдал заңы әмбебап сипатқа ие болғандықтан, ол барлық параллель 
есептеу жүйелерімен бірге еске алынады. Егер бағдарламада барлық 
операциялардың 20 % қатаң тізбекті түрде орындалатын болса, онда 
пайдаланылған процессорлар санына байланыссыз 5-тен кӛп үдеу алу мүмкін 
емес (мұнда кэш-жадының әсері қарастырылмайды). Бұны жаңа параллель 
кодты жобалауда да, ескі тізбекті бағдарламаны осы архитектураға лайықтап 
келтіру алдында да ескеру керек.
Осы класты жүйелерде жадымен жұмыс істеу ӛте «ерекше» болып 
есептеледі. Ӛнімділікті тӛмендететін себептердің бірі – жадыға біртекті 


Достарыңызбен бөлісу:
1   ...   44   45   46   47   48   49   50   51   ...   121




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет