Технічні характеристики сучасних серверів

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Симетричні мультипроцесорні системи компанії Bull

Група компаній, об'єднаних під загальною назвою Bull, є одним з найбільших виробників інформаційних систем на світовому комп'ютерному ринку і має свої відділення в Європі та США. Більша частина акцій компанії належить французькому уряду. У зв'язку з відбувалася в останньому п'ятилітті перебудовою структури комп'ютерного ринку компанія оголосила про свою прихильність до напрямку побудови відкритих систем. В даний час компанія продовжує випускати комп'ютери класу мейнфрейм (серії DPS9000/900, DPS9000/800, DPS9000/500) і середнього класу (серії DPS7000 і DPS6000), що працюють під управлінням операційної системи фірмової GCOS8, UNIX-системи (серії DPX/20, Escala), а також широкий ряд персональних комп'ютерів компанії Zenith Data Systems (ZDS), що входить до групи Bull.

Активність Bull в області відкритих систем зосереджена головним чином на побудові UNIX-систем. У результаті технологічної угоди з компанією IBM, в 1992 році Bull анонсувала ряд комп'ютерів DPX/20, що базуються на архітектурі POWER, а пізніше в 1993 році на архітектурі PowerPC і працюють під управлінням операційної системи AIX (версія системи UNIX компанії IBM). Версія ОС AIX 4.1, розроблена спільно фахівцями IBM і Bull, підтримує симетричну многопроцесоорную обробку.

Архітектура PowerScale, являє собою першу реалізацію симетричної мультипроцессорной архітектури (SMP), розробленої Bull спеціально для процесорів
PowerPC. На початку вона була реалізована на процесорі PowerPC 601, але легко модернізується для процесорів 604 і 620. Ця нова SMP-архітектура використовується в сімействі систем Escala.

Архітектура процесорів PowerPC

Основою архітектури PowerPC є многокристального архітектура POWER, яка була розроблена перш за все в розрахунку на однопроцесорних реалізацію процесора. При розробці PowerPC для задоволення потреб трьох різних компаній (Apple, IBM і Motorola) в архітектурі POWER було зроблено декілька змін в наступних напрямках:

спрощення архітектури, з метою її пристосування для реалізації дешевих однокристальних процесорів; усунення команд, які можуть стати перешкодою підвищення тактової частоти; усунення архітектурних перешкод суперскалярной обробці та позачергового виконання команд; додавання властивостей, необхідних для підтримки симетричної мультипроцессорной обробки; додавання нових властивостей, що вважаються необхідними для майбутніх прикладних програм, забезпечення тривалого часу життя архітектури шляхом її розширення до 64-бітової.

Архітектура PowerPC підтримує ту ж саму базову модель програмування і призначення кодів операцій команд, що й архітектура POWER. У тих місцях, де були зроблені зміни, які могли потенційно порушити двійкову сумісність з додатками, написаними для архітектури POWER, були розставлені "пастки", що забезпечують переривання і емуляцію за допомогою програмних засобів. Такі зміни вводилися, природно, тільки в тих випадках, якщо відповідна можливість або використовувалася не дуже часто в кодах прикладних програм, або була ізольована в бібліотечних програмах, які можна просто замінити.

Мікропроцесор PowerPC підтримує мультипроцесорну обробку, зокрема, модель тісно пов'язаних обчислень в розділяється (загальною) пам'яті. Робота тісно пов'язаних процесорів припускає використання різними процесорами однієї спільної пам'яті і однієї операційної системи, яка управляє всіма процесорами і апаратурою системи. Процесори повинні конкурувати за колективні ресурси.

У симетричній мультипроцессорной системі всі процесори вважаються функціонально еквівалентними і можуть виконувати операції введення / виводу і інші обчислення. Можливості управління подібною системою з пам'яттю, що реалізовані в ОС AIX 4.1.

Розроблене Bull сімейство Escala забезпечує масштабованість і високу готовність систем, центральним місцем яких є симетрична мультипроцесорна архітектура, названа PowerScale, що дозволяє робити поступову модернізацію й об'єднувати в системі від 1 до 8 процесорів.

Проблеми реалізації SMP-архітектури

За визначенням симетрична мультипроцесорна обробка (SMP) є архітектурою, в якій кілька процесорів поділяють доступ до єдиної спільної пам'яті і працюють під управлінням однієї копії операційної системи. У цьому випадку завдання можуть відповідним чином плануватися для роботи на різних процесорах у межах "пулу наявних ресурсів", допускаючи розпаралелювання, оскільки кілька процесів в такій системі можуть виконуватися одночасно.

Головною перевагою архітектури SMP в порівнянні з іншими підходами до реалізації мультипроцесорних систем є прозорість для програмних додатків. Цей фактор істотно покращує час виходу на ринок і готовність традиційних комерційних додатків на системах SMP в порівнянні з іншими мультіпроцесорними архітектурами.

У сучасних системах SMP найбільш актуальним питанням розробки є створення високопродуктивної підсистеми пам'яті для забезпечення високошвидкісних RISC-процесорів даними і командами. Спільне рішення цієї проблеми полягає у використанні великої високошвидкісної кеш-пам'яті, тобто у створенні ієрархії пам'яті між процесорами і розділяється глобальної пам'яттю. Архітектура PowerScale пропонує новий підхід до вирішення питань традиційного вузького горла, що обмежує продуктивність SMP-систем, а саме, нову організацію управління кеш-пам'яттю і доступу до пам'яті.

PowerScale являє собою високо оптимізовану розробку, яка є результатом інтенсивних досліджень параметрів продуктивності сучасних комерційних додатків. Зазвичай виконання цих прикладних систем пов'язане з необхідністю маніпулювання величезними обсягами даних і розділення доступу до цих даних між багатьма користувачами або програмами. Такого роду робоче навантаження характеризується наявністю великих робочих наборів даних з низьким рівнем локалізації. При моделюванні прикладних систем подібного профілю на системах SMP, були помічені два особливих ефекту:

Через малу ймовірність знаходження відповідних даних у кеш-пам'яті постає досить інтенсивний трафік між системною пам'яттю і кешами ЦП. Тому дуже важливо сконструювати систему, що забезпечує широкосмуговий доступ до пам'яті. У традиційній SMP-системі за замовчуванням одне із завдань планувальника полягає в тому, щоб запустити наступний дозволений для виконання процес на першому ж процесорі, який стає вільним. Тому в міру того, як збільшується число процесорів і процесів, ймовірність переміщення процесів з одного процесора на інший, також збільшується. Ця побічна міграція процесів призводить до суттєвого збільшення рівня трафіку між кешами ЦП. Тому ключовим питанням забезпечення високої системної продуктивності стає фізична реалізація когерентності кеш-пам'яті.

У традиційній SMP-архітектурі зв'язку між кешами ЦП і глобальної пам'яттю реалізуються за допомогою загальної шини пам'яті, що розділяється між різними процесорами. Як правило, ця шина стає слабким місцем конструкції системи і прагне до насичення при збільшенні числа інстальованих процесорів. Це відбувається тому, що збільшується трафік пересилань між кешами і пам'яттю, а також між кешами різних процесорів, які конкурують між собою за пропускну здатність шини пам'яті. При робочого навантаження, що характеризується інтенсивною обробкою транзакцій, ця проблема є навіть ще більш гострою.

В архітектурі PowerScale компанії Bull інтерфейс пам'яті реалізований з урахуванням зазначеного вище профілю додатків і розрахований на використання декількох поколінь процесорів з дедалі більшою продуктивністю. У дійсності архітектура PowerScale з самого початку була розроблена в розрахунку на підтримку до 8 процесорів PowerPC 620.

Опис архітектури PowerScale

В архітектурі PowerScale (рис. 4.1) основним засобом оптимізації доступу до поділюваного основної пам'яті є використання достатньо складної системної шини. Насправді ця "шина" представляє собою комбінацію шини адреси / управління, реалізованої класичним способом, і набору магістралей даних, які з'єднуються між собою за допомогою високошвидкісного матричного комутатора. Ця система межз'єднань отримала назву MPB_SysBus. Шина пам'яті використовується тільки для пересилання простих адресних тегів, а неблокіруемой матричний комутатор - для забезпечення більш інтенсивного трафіку даних. До матричному комутатора можуть бути приєднані до 4 двопроцесорних портів, порт вводу / виводу і підсистема пам'яті.

Головною перевагою такого підходу є те, що він дозволяє кожному процесору мати прямий доступ до підсистеми пам'яті. Іншою важливою властивістю реалізації є використання розшарування пам'яті, що дозволяє багатьом процесорам звертатися до пам'яті одночасно.

Нижче наведена схема, що ілюструє загальну організацію доступу до пам'яті (рис. 4.2) Кожен процесорний модуль має свій власний виділений порт пам'яті для пересилання даних. При цьому загальна шина адреси і управління гарантує, що на рівні системи всі адреси є когерентними.

Питання балансування навантаження

У процесі розробки системи був зроблений вибір у напрямку використання великих кешей другого рівня (L2), доповнюють кеші першого рівня (L1), інтегровані в процесорах PowerPC. Це рішення породило необхідність більш глибокого розгляду роботи системи в цілому. Щоб отримати повну перевагу від використання просторової локальності даних, присутніх в кешах L2, необхідно мати можливість знову призначити раніше відкладений процес на процесор, на якому він раніше виконувався, навіть якщо цей процесор не є наступним вільним процесором. Подібна "настройка" системи є основою для балансування навантаження і аналогічна процесу планування.

Технічні характеристики сучасних серверів

Рис. 4.1. Архітектура PowerScale

Очевидно, що завжди корисно виконувати процес на одному і тому ж процесорі і мати більш високий коефіцієнт попадань в кеш, ніж при виконанні процесу на наступному доступному процесорі. Використовуючи алгоритми, що базуються на засобах ядра системи, можна визначити найбільш підходяще використання пулу процесорів з урахуванням поточного коефіцієнта попадань в кеш. Це дозволяє оптимізувати рівень міграції процесів між процесорами і збільшує загальну пропускну здатність системи.

Технічні характеристики сучасних серверів

Рис. 4.2. Схема організації доступу до пам'яті

Модель пам'яті

Процесор PowerPC визначає слабо упорядковану модель пам'яті, яка дозволяє оптимізувати використання пропускної здатності пам'яті системи. Це досягається за рахунок того, що апаратурі дозволяється переупорядочівать операції завантаження і запису так, що потребують тривалого часу операції завантаження можуть виконуватися раніше визначених операцій запису. Такий підхід дозволяє зменшити дійсну затримку операцій завантаження. Архітектура PowerScale повністю підтримує цю модель пам'яті як на рівні процесора за рахунок набору команд PowerPC, так і глобально шляхом реалізації наступних обмежень:

Звернення до глобальних змінних синхронізації виконуються строго послідовно. Ніяке звернення до змінної синхронізації не видається процесором до завершення виконання всіх звернень до глобальних даними. Ніякі звернення до глобальних даними не видаються процесором до завершення виконання попередніх звернень до змінної синхронізації.

Для забезпечення такої моделі упорядкованих звернень до пам'яті на рівні кожного процесора системи використовуються певна апаратна підтримка і явні команди синхронізації. Крім того, на системному рівні дотримання необхідних протоколів для забезпечення упорядкування звернень між процесорами або між процесорами і підсистемою вводу / виводу покладено на програмне забезпечення.

Підсистема пам'яті

З реалізацією архітектури глобальної пам'яті в мультипроцессорной системі зазвичай пов'язаний дуже важливе питання. Як поєднати переваги "логічно" локальної для кожного процесора пам'яті, що має малу затримку доступу, з вимогами реалізації поділюваної глобальної пам'яті?

Компанія Bull розробила патентовану архітектуру, в якій масив пам'яті повністю розшаровані до рівня довжини рядка системного кеша (32 байти). Така організація забезпечує мінімум конфліктів між процесорами при роботі підсистеми пам'яті і гарантує мінімальну затримку. Вимога реалізації глобальної пам'яті забезпечується тим, що масив пам'яті для програмних засобів завжди представляється безперервним.

Запропонована конструкція вирішує також проблему, часто виникає в інших системах, в яких використання методів розшарування для організації послідовного доступу до різних областей пам'яті можливо тільки, якщо плати пам'яті встановлюються збалансовано. Цей, що здається тривіальним, питання може призводити до зайвих закупівель додаткових ресурсів і пов'язаний виключно з можливостями конструкції системи. PowerScale дозволяє обійти цю проблему.

Архітектура PowerScale автоматично оптимізує ступінь розшарування пам'яті залежно від того, які плати пам'яті інстальовані в системі. У залежності від конкретної конфігурації вона буде використовувати низьку або високу ступінь розшарування або їх комбінацію. Все це повністю прозоро для програмного забезпечення і, що більш важливо, для користувача.

Архітектура матричного комутатора

Архітектура комутатора реалізована за допомогою апаратної мережі, яка здійснює індивідуальні з'єднання типу точка-точка процесора з процесором, процесора з основною пам'яттю і процесора з магістраллю даних введення / виводу. Ця мережа працює спільно з розділяється адресною шиною. Такий збалансований підхід дозволяє використовувати найкращі властивості кожного з цих методів організації з'єднань.

Колективна адресна шина спрощує реалізацію спостереження (snooping) за адресами, яке необхідно для апаратної підтримки когерентності пам'яті. Адресні транзакції конвеєризований, виконуються асинхронно (розщеплено) по відношенню до пересилках даних і вимагають відносно невеликий смуги пропускання, гарантуючи, що цей ресурс ніколи увійде у стан насичення.

Організація пересилань даних вимагає більше уваги, оскільки рівень трафіку і час зайнятості ресурсів фізичного межсоединения тут істотно вище, ніж це потрібно для пересилання адресної інформації. Операція пересилання адреси являє собою одиночну пересилання, в той час як операція пересилання даних повинна задовольняти вимогу багатобайтні пересилання відповідно до розміру рядка кеша ЦП. При реалізації окремих магістралей даних з'являється ряд додаткових можливостей, які забезпечують:

максимальну швидкість передачі даних за допомогою з'єднань точка-точка на більш високих тактових частотах; паралельну пересилання даних за допомогою організації виділеного шляху для кожного з'єднання; поділ адресних транзакцій і транзакцій даних. Тому архітектуру PowerScale компанії Bull можна назвати многопотоковой апаратної архітектурою (multi-threaded hardware architecture) з можливостями паралельних операцій.

На рис. 4.3 показані основні режими і операції, що виконуються матричним комутатором.

Технічні характеристики сучасних серверів

Рис. 4.3. Матричний комутатор. ССA2 - здвоєний контролер адрес кеш-пам'яті;
CCD2 - здвоєний контролер даних кеш-пам'яті; IOD - дочірня плата вводу / виводу;
DCB - матричний комутатор даних; SMC - контролер системної пам'яті

Режим звернення до пам'яті - Memory mode: (a)

Процесорний вузол або вузол в / в комутується з масивом пам'яті (MA). Таке з'єднання використовується для організації операцій читання пам'яті запису в пам'ять.

Режим втручання (читання): (b)

Той, хто читає вузол комутується з іншим вузлом (вмешивающимся вузлом) і шиною даних MA. Цей режим використовується тоді, коли при виконанні операції читання рядка від механізму спостереження за когерентним станом пам'яті надходить відповідь, що даний рядок знаходиться в кеш-пам'яті іншого вузла і модифікована. У цьому випадку дані, які добувають із рядка кеша власника, подаються читаючому вузлу і одночасно записуються в MA. Якщо хто читає, і втручається ЦП знаходяться всередині одного й того ж вузла, то дані загортаються тому на рівні вузла та одночасно записуються в пам'ять.

Режим втручання (читання з наміром модифікації - RWITM): (c)

Процесорний вузол або вузол в / в (читає вузол) комутується з іншим процесорним вузлом або вузлом в / в. Цей режим використовується тоді, коли при виконанні операція RWITM від механізму спостереження надходить відповідь, що даний рядок знаходиться в кеш-пам'яті іншого вузла і модифікована. У цьому випадку дані, які добувають із рядка кеша власника, подаються тільки читає вузлу і не записуються в пам'ять.

Режим програмованого введення / виводу (PIO): (d)

Процесорний вузол комутується з вузлом в / в. Це випадок операцій PIO, при якому дані обмінюються тільки між процесором і вузлом в / в.

Режим в / в з відображенням у пам'яті (memory mapped):

Головний вузол комутується з вузлами в / в (підлеглими вузлами), залученими в транзакцію. Це випадок операцій з пам'яттю.

Параметри продуктивності

Слідом за настановної фазою транзакції (наприклад, після встановлення адреси на адресній шині) дані можуть пересилатися через комутатор на повній швидкості синхронізації. Це можливо завдяки організації з'єднанню точка-точка, яка створюється для кожної окремої транзакції. Тому надалі будь-які перешкоди відсутні. Можливо також виконувати паралельно кілька операцій, наприклад, множинний доступ до пам'яті або пересилання між кешами.

Для того щоб зменшити затримку пам'яті, операції читання починаються до виконання будь-яких дій по забезпеченню глобальної когерентності на рівні системи. Відповіді когерентності повністю синхронізовані, вирішуються за фіксований час і надходять завжди перш, ніж буде захоплений розділяється ресурс - шина пам'яті. Це допомагає уникнути непотрібних захоплень шини. Будь-які транзакції, які не вирішуються когерентно за дане фіксований час, пізніше будуть повторені системою.

Використовувана в системі внутрішня частота синхронізації дорівнює 75 МГц, що дозволяє оцінити рівень продуктивності розробленої архітектури. Інтерфейс фізичної пам'яті має ширину 32 байта і, враховуючи арбітраж шини, дозволяє пересилати 32 байти кожні 3 такту синхронізації. Це дає швидкість передачі даних 800 Мбайт / с, підтримувану на рівні інтерфейсу пам'яті. Кожен порт ЦП має ширину 8 байт і здатний передавати по 8 байт за такт, тобто зі швидкістю 600 Мбайт / с. Слід зазначити, що це швидкість, що досягається як при пересиланні ЦП-пам'ять, так і при пересиланні кеш-кеш. Швидкість 800 Мбайт / с для пам'яті підтримується за допомогою буферів у комутаторі, які дозволяють конвеєризований кілька операцій.

Оскільки кілька операцій можуть виконуватися через комутатор на повній швидкості паралельно, то для оптимальної суміші операцій (дві пересилання з ЦП в пам'ять, плюс пересилання кеш-кеш), пропускна здатність може досягати пікового значення 1400 Мбайт / с. Таким чином, максимальна пропускна спроможність буде варіюватися в діапазоні від 800 до 1400 Мбайт / с в залежності від коефіцієнта влучень кеш-пам'яті.

Когерентність кеш-пам'яті

Відомо, що вимоги, які пред'являються сучасними процесорами до смуги пропускання пам'яті, можна істотно скоротити шляхом застосування великих багаторівневих кешів. Проблема когерентності пам'яті в мультипроцессорной системі виникає через те, що значення елемента даних, що зберігається в кеш-пам'яті різних процесорів, доступно цим процесорам тільки через їх індивідуальні кеші. При цьому певні операції одного з процесорів можуть впливати на достовірність даних, що зберігаються в кешах інших процесорів. Тому в подібних системах життєво необхідний механізм забезпечення когерентного (погодженого) стану кешів. З цією метою в архітектурі PowerScale використовується стратегія зворотного запису, реалізована в такий спосіб.

Вертикальна когерентність кешів

Кожен процесор для своєї роботи використовує дворівневий кеш з властивостями охоплення. Це означає, що крім внутрішнього кеша першого рівня (кешу L1), вбудованого в кожен процесор PowerPC, є пов'язаний з ним кеш другого рівня (кеш L2). При цьому кожен рядок в кеші L1 є також і в кеші L2. В даний час обсяг кеша L2 становить 1 Мбайт на кожен процесор, а в майбутніх реалізаціях передбачається його розширення до 4 Мбайт. Сама по собі кеш-пам'ять другого рівня дозволяє істотно зменшити число звернень до пам'яті і збільшити ступінь локалізації даних. Для підвищення швидкодії кеш L2 побудований на принципах прямої відображення. Довжина рядка дорівнює 32 байт (розміру когерентної гранулюванні системи). Слід зазначити, що, хоча з точки зору фізичної реалізації процесора PowerPC, 32 байти становлять тільки половину рядка кеша L1, це не міняє протокол когерентності, який управляє операціями кеша L1 і гарантує що кеш L2 завжди містить дані кеша L1.

Кеш L2 має зовнішній набір тегів. Таким чином, будь-яка активність механізму спостереження за когерентним станом кеш-пам'яті може бути пов'язана з кешем другого рівня, в той час як більшість звернень з боку процесора можуть оброблятися первинним кешем. Якщо механізм спостереження виявляє попадання в кеш другого рівня, то він повинен виконати арбітраж за первинний кеш, щоб оновити стан і можливо знайти дані, що зазвичай буде призводити до припинення процесора. Тому глобальна пам'ять може працювати на рівні тегів кеша L2, що дозволяє істотно обмежити кількість операцій спостереження, що генеруються системою в напрямку даного процесора. Це, у свою чергу, істотно збільшує продуктивність системи, оскільки будь-яка операція спостереження у напрямку процесора сама по собі може призводити до припинення його роботи.

Вторинна когерентність кеш-пам'яті

Вторинна когерентність кеш-пам'яті потрібно для підтримки когерентності кешів L1 & L2 різних процесорних вузлів, тобто для забезпечення когерентного стану всіх наявних у мультипроцессорной системі розподілених кешей (природно включаючи підтримку когерентної буферизації введення / виводу як з читання, так і по запису).

Вторинна когерентність забезпечується за допомогою перевірки кожної транзакції, яка виникає на шині MPB_SysBus. Така перевірка дозволяє виявити, що запитувана по шині рядок вже кешовані у процесорному вузлі, і забезпечує виконання необхідних операцій. Це робиться за допомогою тегів кеша L2 і логічно підтримується тим фактом, що L1 є підмножиною L2.

Протокол MESI і функція втручання

В рамках архітектури PowerScale використовується протокол MESI, який представляє собою стандартний спосіб реалізації вторинної когерентності кеш-пам'яті. Однією з основних завдань протоколу MESI є відкладання на максимально можливий термін операції зворотного запису кешованих даних у глобальну пам'ять системи. Це дозволяє поліпшити продуктивність системи за рахунок мінімізації непотрібного трафіку даних між кешами і основною пам'яттю. Протокол MESI визначає чотири стану, в яких може перебувати кожна рядок кожного кешу системи. Ця інформація використовується для визначення відповідних подальших операцій (рис. 4.4).

Стан рядка "Единственная" (Exclusive):

Дані цього рядка достовірні в даному кеші й недостовірні в будь-якому іншому кеші. Дані не модифіковані по відношенню до пам'яті.

Стан рядка "Розбита" (Shared):

Дані цього рядка достовірні в даному кеші, а також в одному або декількох віддалених кешах.

Стан рядка "Модифікована" (Modified):

Дані цього рядка достовірні тільки в даному кеші і були модифіковані. Дані недостовірні в пам'яті.

Стан рядка "Недостовірна" (Invalid):

Достовірні дані не були знайдені в даному кеші.

Технічні характеристики сучасних серверів

Рис. 4.4. Діаграм переходів станів протоколу MESI

Для підтримки мультипроцессорной організації були реалізовані кілька примітивів адресної шини. Це дозволяє одному головного пристрою шини передавати, а іншим пристроям виявляти (або спостерігати) поява цих примітивів на шині. Пристрій-власник кешу спостерігає за адресною шиною під час глобальної запиту і порівнює цільової адресу з адресами тегів в своєму кеші L2. Якщо відбувається попадання, то їх дії визначаються природою запиту.

Як вже було зазначено, однією з функцій тегів L2 є зменшення накладних витрат, пов'язаних з відповідями на запити механізму спостереження. Доступ до тегам L2 поділяється між процесорами і адресною шиною. Теги L2 практично виконують роль фільтрів по відношенню до активностей спостереження. Це дозволяє процесорам продовжувати обробку замість того, щоб відповідати на кожний запит спостереження. Хоча теги L2 представляють собою розділяється між процесором і шиною ресурс, його захоплення настільки короткочасний, що практично не призводить ні до яких конфліктів.

Стан рядка кеш-пам'яті "модифікована" означає зокрема те, що кеш, який зберігає такі дані, несе відповідальність за правильність цих даних перед системою в цілому. Оскільки в основній пам'яті ці дані недостовірні, це означає, що власник такого кеша повинен будь-яким способом гарантувати, що ніякий інший модуль системи не прочитає ці недостовірні дані. Зазвичай для опису такої відповідальності використовується термін "втручання" (intervention), яке являє собою дію, що виконується пристроєм-власником модифікованих кешованих даних при виявленні запиту спостереження за цими даними. Втручання сигналізується за допомогою відповіді станом "рядок модифікована" протоколу MESI, за яким слідують пересилаються запитувача, а також потенційно в пам'ять, дані.

Для збільшення пропускної спроможності системи в PowerScale реалізовані два способи виконання функції втручання:

Негайна кроссировки (Cross Immediate), яка використовується, коли канал даних джерела і одержувача вільні і можна пересилати дані через комутатор на повній швидкості. Пізня кроссировки (Cross Late), коли ресурс (магістраль даних) зайнятий, тому дані будуть записуватися в буфер комутатора і пізніше пересилатися запитувача.

Фізична реалізація архітектури

Нижче на рис. 4.5 показана схема, що представляє системні плати, розроблені компанією Bull, які використовуються для фізичної реалізації архітектури PowerScale.

Багатопроцесорна плата:

Багатопроцесорна материнська плата, яка використовується також як монтажної панелі для встановлення модулів ЦП, модулів основної пам'яті і однієї плати в / в (IOD).

Модуль ЦП (дочірня процесорна плата):

Кожен модуль ЦП, побудований на базі PowerPC 601/604, включає два мікропроцесора та пов'язані з ними кеші. Є можливість модернізації системи, побудованої на базі процесорів 601, шляхом встановлення модулів ЦП з процесорами 604. Змішані конфігурації 601/604 не підтримуються.

Дочірня плата вводу / виводу: (IOD)

IOD працює як міст між шинами MCA і комплексом ЦП і пам'яті. Підтримуються 2 канали MCA зі швидкістю передачі 160 Мбайт / с кожен. Хоча поставляється сьогодні підсистема в / в базується на технології MCA, це не є принциповим елементом архітектури PowerScale. В даний час проводяться дослідження можливостей реалізації декількох альтернативних шин введення / виводу, наприклад, PCI.

Технічні характеристики сучасних серверів

Рис. 4.5. Фізична реалізація PowerScale

Плати пам'яті:

Кожна плата пам'яті складається з парного числа банків. Максимальне число банків дорівнює 16. Об'єм пам'яті на кожній платі може бути 64, 256 або 512 Мбайт.

Комутатор даних (DCB) інтегрований в декількох НВІС (4х16 біт) і функціонально з'єднує магістраль даних MPB_SysBus з підсистемою пам'яті, модулями ЦП і платою в / в. Ширина магістралі даних DCB на рівні масиву пам'яті становить 256 + 32 біт, а ширина магістралі даних для кожного порту ЦП і порту в / в дорівнює 64 + 8 біт. Операції DCB управляються контролером системної пам'яті (SMC) за допомогою командної шини, що забезпечує необхідну комутацію пристроїв.

Сімейство UNIX-серверів Escala

На російський ринок у цей час активно просуваються UNIX-сервери сімейства Escala - багатопроцесорні системи з архітектурою PowerScale, побудовані на базі мікропроцесора PowerPC 601. Вони пропонуються для роботи в якості декількох типів серверів додатків: сервера транзакцій (Transation Server) при використанні моніторів обробки транзакцій подібних Tuxedo, сервера бази даних (Database Server) на основі таких відомих систем як Oracle або Informix, а також керуючого сервера (System Management Server ), що забезпечує управління інфраструктурою підприємства й істотно спрощує адміністрування гетерогенними системами та мережами. Сервери Escala двійково сумісні з системами Bull DPX/20, а їхня архітектура розроблена з урахуванням можливості застосування новітніх процесорів PowerPC 604 і 620.

Основні характеристики серверів Escala в залежності від застосовуваного конструктиву дані в таблиці 4.1. Системи сімейства Escala забезпечують підключення наступних комунікаційних адаптерів: 8 -, 16 - і 128-входові адаптерів асинхронних послідовних портів, 1 - або 4-входові адаптерів портів 2 Мбіт / с X.25, а також адаптерів Token-Ring, Ethernet і FDDI.

Таблиця 4.1

МОДЕЛЬ Escala M101 M201D201 D401 R201
Mini-Tower DesksideRack-Mounted
ЦП
Тип процесора PowerPC 601
Тактова частота (МГц) 75 7575 75 75
Число процесорів 1 / 4 2/42/8 4 / 8 2 / 8
Розмір кеша другого рівня (Кб) 512 5121024 1024 1024
ПАМ'ЯТЬ
Стандартний обсяг (Мб) 32 6464 64 64
Максимальний обсяг (Мб) 512 5122048 2048 2048
ВВЕДЕННЯ / ВИСНОВОК
Тип шини MCA MCAMCA MCA MCA
Пропускна здатність (Мб / с) 160 160160 2x160 2x160
Кількість слотів 6 615 15 16
Кількість посадочних місць
3.5 " 4 47 7 7
5.25 " 2 23 3 3
Ємність внутрішнього
дискової пам'яті Гб)
1 / 18 1/182/36 4 / 99 -
Ємність зовнішньої
дискової пам'яті (Гб)
738 7381899 1899 2569
Кількість мережевих адаптерів 1 / 4 1/41/12 1 / 12 1 / 13
ПРОДУКТИВНІСТЬ (число процесорів 2 / 4)
SPECint92 77 7777 77 77
SPECfp92 84 8484 84 84
SPECrate_int92 3600/6789 3600/67893600/6789 - / 6789 3600/6789
SPECrate_fp92 3900/7520 3900/75203900/7520 - / 7520 3900/7520
Tpm-C 750/1350 750/1350750/1350 750/1350 750/1350

Висновок

При розробці PowerScale Bull вдалося створити архітектуру з досить високими характеристиками продуктивності в розрахунку на задоволення потреб додатків користувачів сьогодні і завтра. І робиться це не тільки збільшенням числа процесорів в системі, а й можливістю модернізації поколінь процесорів PowerPC. Розроблена архітектура приваблива як для розробників систем, так і користувачів, оскільки в її основі лежить одна з головних процесорних архітектур в комп'ютерній промисловості - PowerPC.


Додати в блог або на сайт

Цей текст може містити помилки.

Програмування, комп'ютери, інформатика і кібернетика | Реферат
61.4кб. | скачати


Схожі роботи:
Технічні характеристики комп`ютера
Розрахунок та технічні характеристики електромагнітного реле
Типи літаків дальньої авіації їх тактика і технічні характеристики
Технічні характеристики казана ГМ-30-150 Розрахунок теплової схеми котельні
Крейсер I-го рангу Цусімському кампанії Дмитро Донський Історія та технічні характеристики
Основні характеристики сучасних принтерів
Порівняльні характеристики сучасних апаратних платформ
Безпека www-серверів
Антивірусний захист ПЗ для серверів
© Усі права захищені
написати до нас