«Мережні бази даних та субд»

Ім'я файлу: 29158 (1).docx
Розширення: docx
Розмір: 254кб.
Дата: 03.11.2022
скачати
Пов'язані файли:
лаб 1.1 ППІПЗ.docx
Pythonlearn-16-Data-Viz.pptx

Недержавний освітній заклад

вищої освіти

Московський технологічний інститут

Факультет __________________ Кафедра __________________

КУРСОВА РОБОТА
з дисципліни _____________________________
на тему:

« Мережні бази даних та СУБД »

Рівень освіти_____________________

Напрям ____________________________

Профіль (або магістерська програма)____________________

Виконав(ла):

Студент (ка) _____ курсу

Форма навчання_________

_______________________

(ПІБ повністю)

Москва 20___

ЗМІСТ

ВСТУП 2

1. БАЗИ ДАНИХ 4

1.1. Поняття та визначення 4

1.2. Компоненти системи БД 6

1.3. Функції СУБД 8

1.4. Класифікація СУБД 10

1.5. Короткі висновки 13

2. МЕРЕЖЕВІ БАЗИ ДАНИХ І СУБД 14

2.1. Загальні відомості 14

2.2. Стандарт CODASYL 17

2.3. Вимоги до мережевих моделей 18

2.4. Фізична організація даних у мережевих СУБД 20

2.5. Короткі висновки 21

3. ОСОБЛИВОСТІ МЕРЕЖОВОГО ЗБЕРІГАННЯ ДАНИХ 22

3.1. Пристрої мережі NAS 23

3.2. Мережі зберігання даних SAN 23

3.3. Управління життєвим циклом інформації 25

3.4. Резервне копіювання 26

3.5. Короткі висновки 29

ВИСНОВОК 30

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ 32

ВСТУП

Діяльність будь-якої сучасної людини нерозривно пов'язана із поняттям інформації. Інформацією називаються будь-які відомості, які сприймаються людиною чи спеціальними пристроями як відображення фактів духовного чи матеріального світу у процесі комунікації [5].

Для зручного сприйняття інформації, її необхідно представляти у певному вигляді – структурувати. Одним із способів подання є табличний вид, який знайшов своє застосування у сфері баз даних. Базою даних (БД) називається сукупність взаємозалежних даних, які організовані відповідно до схеми БД таким чином, щоб із ними міг працювати користувач [4]. Зі зростанням інформаційного потоку, що циркулює всередині суспільства, зростають вимоги до цього потоку, збільшується обсяг даних, що зберігаються в наявних БД.

Справді, на сьогоднішній день у всьому світі є безліч банків, акціонерних товариств та інших компаній, основним завданням яких є обробка та зберігання інформації. Втрата інформації при цьому здебільшого призводить до втрати доходу. Подібна організація робочої структури спричинила розвиток комп'ютерної техніки та створення електронних таблиць для зберігання даних [12].

Одним із пріоритетних напрямів даної сфери є автоматизація процесів, результат якої в більшості випадків полягає у створенні певної інформаційної системи. Така система може бути реалізована у вигляді автоматизованої системи управління (АСУ), або у вигляді автоматизованої інформаційної системи (АІС). При цьому АСУ застосовується для прийняття певних рішень або формування конкретного впливу на об'єкт управління, а АІС служить для надання операторам системи та користувачам певних даних, які використовуються в процесі їх діяльності [ 14].

Сьогодні для оперативного та ефективного управління організаціями впроваджуються системи автоматизованого управління, в основі яких лежить база даних. Використання БД тісно пов'язані з використанням систем управління базами даних (СУБД).

Актуальність цієї роботи очевидна – нині людина постійно зіштовхується з інформаційними системами, заснованими на використанні баз даних. Щоб грамотно їх використовувати, а також вміти самостійно створювати такі системи та керувати ними, важливо знати всі тонкощі цієї теми.

Об'єкт дослідження цієї роботи – сучасні системи управління базами даних (СУБД), без яких неможливе використання самих баз.

Предмет використання – мережеві БД та СУБД.

Мета роботи – вивчити основні поняття теорії баз даних, і навіть розглянути мережеві СУБД. Для досягнення цієї мети належить вирішити низку завдань:

проаналізувати літературу на задану тему;
визначити основні поняття БД;
визначити призначення та характерні риси СУБД;
виявити особливості мережевих БД та СУБД.

При написанні роботи як опорні джерела були використані такі: Макарова Н.В. – «Інформатика: Підручник для вузів» та Радигін В.Ю. – «Бази даних та СУБД: навчально-методичний посібник».

1. БАЗИ ДАНИХ

1.1. Поняття та визначення

Розвиток обчислювальної техніки послужило передумовою появи нової інформаційної технології інтегрованого зберігання та обробки даних – концепції баз даних. Ключовим поняттям тут є банк даних - це система, що містить спеціально організовані дані, а також технічні, програмні та мовні засоби, метою яких є централізоване накопичення та колективне багатоцільове використання даних [10].

В основу даної технології покладено механізм надання обробній програмі лише даних, які їй потрібні. Форма подання даних також встановлюється заздалегідь та описується на логічному рівні. Логічна структура даних, які у базі, називається моделлю представлення даних.

Базою даних прийнято називати іменовану сукупність даних, що відображає стан об'єктів і відносин між ними в предметній області, що розглядається. Відмінною рисою БД є сталість:

дані у БД постійно накопичуються та використовуються;
структура та склад завдань у рамках конкретної БД постійні та стабільні в часі;
БД завжди зберігає актуальні дані [3].

Фактично СУБД представляє збій комплекс програмних та мовних засобів, який служить для створення, ведення та спільного використання БД великою кількістю користувачів [18].

Схема описаного уявлення наведено малюнку 1.

Рисунок 1 – Загальна термінологія БД

1.2. Компоненти системи БД

Основні компоненти будь-якої системи баз даних представлені малюнку 2.

Система баз данных

Пользователи

Программное обеспечение

Аппаратное обеспечение

Данные

Малюнок 2 – Компоненти системи баз даних

Дані

Будь-яка БД зберігає у собі певний набір постійних даних. Крім того, існують ще й транзитні дані, що є вхідними, вихідними даними, а також проміжні результати.

Вхідні дані – це інформація, яка надходить у систему, наприклад, вводиться з клавіатури. Ці дані можуть бути причиною коригування постійних даних, але є частиною БД.

Вихідні дані – це результати та повідомлення, які видаються системою. У більшості випадків вони беруться з постійних даних і не є частиною БД.

Крім даних, що характеризують предметну область, БД зберігають дані про способи та методи переробки інформації або про те, де знайти дані – знання про місцезнаходження даних, оцінки цих даних, опис джерел тощо. Такі дані називаються метаінформацією [7]. Централізоване зберігання метаінформації є словником даних, що відбиває властивість самодокументованості БД.

Дані у будь-якій БД мають бути загальними та інтегрованими. Загальні дані реалізують можливість використання окремих наборів даних із загальної бази різними групами користувачів на вирішення будь-яких завдань.

Інтегровані дані є дані, зібрані з різних джерел і мають єдиний спосіб доступу.

Ці дві властивості даних є перевагою використання систем БД корпоративного рівня, а інтеграція відбиває перевагу під час використання персональних систем.

Апаратне забезпечення

У загальному вигляді прийнято виділяти дві групи властивостей, які найважливіші для будь-якої системи БД. Насамперед сюди відносяться пристрої зберігання даних. Потім – пристрої обробки даних.

У невеликих системах зберігання та обробка можуть бути реалізовані на одному комп'ютері. Однак більшість великих БД задіють різні типи систем зберігання, а також безліч серверів, що відповідають за обробку даних.

Програмне забезпечення

Під програмним забезпеченням (ПЗ) розуміються всі засоби, що дозволяють кінцевим користувачам працювати з даними. Крім того, ПЗ вирішує й інші завдання, наприклад, забезпечує безпеку даних, реалізує технологію одночасного доступу і т.п. Весь описаний комплекс програм заведено називати системою управління базами даних – СУБД [17].

Основна функція СУБД - надання користувачеві можливості працювати з БД, не вникаючи в деталі апаратного забезпечення.

Крім СУБД до компоненту програмного забезпечення відносяться й інші компоненти - різні утиліти, генератори звітів, а також прикладне програмне ПЗ.

Користувачі

Усі користувачі БД поділяються на такі групи:

кінцеві користувачі – люди, які працюють з БД безпосередньо з терміналу чи робочої станції. Ці користувачі можуть використовувати розроблене спеціально для них прикладне ПЗ або вбудовані засоби СУБД. Саме підтримки діяльності таких користувачів створюється вся система баз даних;
прикладні програмісти – люди, які відповідають за розробку та реалізацію прикладних програмних продуктів, що взаємодіють із БД. Розроблені продукти звертаються із запитами до СУБД, а потім отримують результати та надають їх користувачеві. Існують програми пакетної обробки та оперативні програми, завданням яких є підтримка роботи кінцевого користувача, що має інтерактивний доступ до системи;
адміністратори даних – люди, відповідальні за ці організації. Саме адміністратори даних приймають рішення про те, які дані потрібно вносити до БД, а також кому та до яких даних можна мати доступ;
адміністратори баз даних – технічні фахівці, які відповідають реалізації рішень адміністраторів даних [15].

1.3. Функції СУБД

Як говорилося раніше, основне завдання СУБД - управління базою даних, яке передбачає виконання низки функцій.

Управління словником даних

Функціонування СУБД передбачає зберігання даних та відносин між ними у певному словнику даних ( data dictionary ). Для пошуку структур даних і відносин СУБД використовує цей словник, що допомагає уникнути кодування в рамках кожного додатка користувача. Крім того, будь-які коригування даних та їх взаємовідносин автоматично реєструються у словнику даних, що також дозволяє уникнути необхідності модифікації ПЗ . Робота зі словником досягається завдяки абстракції даних, що усуває структурну залежність, і навіть залежність за даними.

Управління зберіганням даних

У рамках СУБД створюються спеціальні складні структури зберігання даних, що звільняє програмістів від визначення та програмування фізичних властивостей оброблюваних даних. СУБД, що існують на сьогоднішній день, здатні зберігати не тільки дані, а й пов'язані з ними екранні форми, схеми звітів, правила перевірки даних тощо.

Подання та перетворення даних

СУБД відповідає за структурування даних, що вводяться в БД, автоматично перетворюючи їх у форму, зручну для зберігання. Це дозволяє користувачеві уникнути процедури перетворення даних з логічного формату у фізичний . Крім того, СУБД дозволяє перетворювати логічні запити на певні команди, тим самим забезпечуючи абстракцію даних та програмну незалежність.

Управління безпекою

СУБД створює власну систему безпеки, завданням якої є забезпечення конфіденційності даних та захист користувача. СУБД містить певний набір правил безпеки, які дозволяють встановити права доступу до різних даних різним користувачам.

Управління розрахованим на багато користувачів доступом

Щоб забезпечити доступ одразу кількох користувачів до одних і тих самих даних у рамках СУБД створюються спеціальні складні структури. Основне завдання даного підходу – забезпечення цілісності та несуперечності даних. Для цього в СУБД використовуються складні алгоритми, які гарантують, що декілька користувачів одночасно зможуть отримати доступ до ресурсів БД без ризику порушення цілісності.

Управління резервним копіюванням та відновленням

СУ БД включає набір процедур резервного копіювання і відновлення даних. Такі процедури необхідні у разі пошкодження БД, наприклад, при фізичному пошкодженні сектора на жорсткому диску або після аварійного вимкнення живлення.

Управління цілісністю даних

СУБД містить низку правил, які забезпечують цілісність даних. Ці правила дозволяють уникнути надмірності, а також гарантують несуперечність даних, що зберігаються. Крім того, для забезпечення цілісності застосовуються ще й зв'язки між даними, що зберігаються у словнику даних.

Підтримка мови доступу до даних та інтерфейсів прикладного програмування

СУБД забезпечує доступ до даних, що зберігаються за допомогою спеціальної мови запитів. Мовою запитів називається непроцедурна мова, що надає користувачеві можливість самостійно визначити, що саме необхідно виконати, не вказуючи, як це потрібно зробити. Мова запитів містить два основні компоненти:

мова визначення даних ( Data Definition Language , DDL ) – визначає структури розміщення даних;
мова маніпулювання даними ( Data Manipulation Language , DML ) – реалізує запити та дозволяє витягувати дані з БД.

Інтерфейси взаємодії з БД

Сучасні СУБД підтримують спеціальне ПЗ, що реалізує взаємодію з БД так, щоб вона могла приймати запити користувача в рамках мережевого оточення [13].

1.4. Класифікація СУБД

Як говорилося раніше, логічна структура даних, які у БД, називається моделлю представлення цих даних. Існує кілька основних моделей уявлення.

Реляційна модель

Реляційна модель є найпростішою і найбільш звичною формою представлення даних – у табличному вигляді. Теорія множин має особливий математичний апарат для роботи з такою моделлю – реляційне літочислення та реляційну алгебру.

У основі реляційної моделі лежить поняття відносини. Відношенням називається безліч елементів, які називаються кортежами. У звичному розумінні кортежем є рядок таблиці (див. рисунок 3). Стовпець таблиці є атрибутом. Базова структура цієї моделі побудована на декартовому творі доменів. Доменом називається безліч значень, які можуть приймати елемент даних [11].

Рисунок 3 – Реляційна модель даних
Існує ще й модель постріляння даних, що розширює описану. Вона знімає обмеження неподільності даних, що зберігаються у записах таблиць. З іншого боку, постреляционная модель допускає використання багатозначних полів, у своїй набір значень таких полів вважається окремої самостійної таблицею, яка вбудована основну .

Переваги реляційної моделі даних:

простота організації - таблична форма зберігання є природною та зрозумілою для користувача;
чітке дотримання правил математичного апарату;
незалежність даних у процесі зміни структури таблиці;
відсутність потреби знання організації БД для побудови запитів.

Недоліки моделі:

великий обсяг пам'яті;
мала швидкість доступу до даних;
Проблема розуміння структури у разі великого числа таблиць [16].

Ієрархічна модель

Ієрархічна модель даних є деревом (рисунок 4).

Малюнок 4 – Ієрархічна модель даних
Кожне дерево складається з набору типів, одним з яких є корінь. Кореневим називається такий тип, який має підлеглі типи, причому сам не є підтипом. Підтип - нащадок по відношенню до типу-предка. Нащадки одного типу є близнюками один до одного.

Кожен тип, що входить у дерево, є простим або складовим типом запису. Поля запису (атрибути) зберігають символьні чи числові значення, які є вмістом БД.

Перевагою ієрархічної моделі є ефективне використання пам'яті ЕОМ, і навіть високі показники часу виконання основних операцій над даними.

Основний недолік – громіздкість щодо обробки інформації зі складними логічними зв'язками, а також складність для розуміння.

Мережева модель

Мережева модель відображає відносини елементів БД як графа (рисунок 5).

Малюнок 5 - Мережева модель даних
Основними елементами даної моделі є записи та зв'язки. На формування зв'язку не накладається спеціальних обмежень – записи-нащадки може мати необмежену кількість записів-предків.

Перевага даної моделі полягає у можливості ефективної реалізації за показниками оперативності та витрат пам'яті.

Недоліки – висока складність та жорсткість схеми БД. З іншого боку, в мережевої моделі ослаблений контроль цілісності зв'язків через допустимість встановлення довільних відносин [1].

1.5. Короткі висновки

У цьому розділі було розглянуто основні поняття теорії баз даних, описані компоненти системи БД, виділено функції системи управління базами даних, і навіть наведено класифікація СУБД залежно від моделі даних.

2. МЕРЕЖЕВІ БАЗИ ДАНИХ І СУБД

2.1. Загальні відомості

В основі мережевої моделі даних лежить поняття мережі, якою називається безконтурний орієнтований граф. У будь-якій мережі існують вершини – вузли графа – з нульовим півступенем заходу. Такі вершини називаються джерелами (входами) мережі. Вершини з нульовим напівступенем результату називаються стоками (виходами) мережі.

Основний вплив на розробку мережевої моделі БД вплинув американський учений Чарльз Бахман , який сформулював основні принципи мережевих моделей. Еталонний варіант мережевої моделі даних наводиться у звітах робочої групи з мов баз даних CODASYL ( COnference on DAta System Languages ) в 1971 р. Відповідно до цього стандарту в мережевий СУБД виділяють такі складові:

елемент даних – мінімальна іменована одиниця даних, з допомогою якої здійснюється побудова всіх інших структур. Ім'я елемента є його ідентифікатором у схемі даних вищого рівня. Значення елемента завжди типізовано та вибирається із стандартних типів даних;
агрегат даних – названа сукупність елементів даних у рамках одного запису, яка може бути розглянута як єдине ціле. Ім'я агрегату є його ідентифікатором у схемі даних вищого рівня. Агрегат буває простий та складовий (див. малюнки 6, 7). Відмінність між ними полягає в тому, що простий агрегат складається тільки з даних, а складової з інших агрегатів.

Малюнок 6 – Простий агрегат даних

Рисунок 7 – Складовий агрегат даних

запис – названа сукупність елементів даних або агрегатів. Запис являє собою агрегат, який не входить до складу жодного іншого агрегату і може мати складну ієрархічну структуру, т.к. у межах цієї моделі допускається багаторазове використання агрегації. Ім'я запису є її ідентифікатором у схемі даних вищого рівня. Примірником запису прийнято називати набір конкретних значень, які приймають всі елементи даних і агрегати, що входять до запису;
Набір записів є поіменованою сукупністю записів, яка є дворівневою ієрархічною структурою підпорядкування. Кожен тип набору тут є відношенням між кількома типами записів. Через властивості ієрархічності набору кожного його типу одна запис є «власником», інші записи – «члени», у своїй запис-власник завжди одна. Один і той же екземпляр будь-якого запису може входити тільки в один екземпляр конкретного набору, тим самим реалізуючи відносини один до одного і один до багатьох серед різних видів записів.

Набори записів бувають наступних видів:

сингулярні;
двотипні ;
множинні.

Сингулярний набір наведено малюнку 8. Такий набір містить лише «запис-член». Як «запис-власник» тут виступає система.

Малюнок 8 – Сингулярний набір «Система-Константа»
Двотипний набір містить один «запис-власника» та кілька «записів-членів» одного типу.

Множинний набір відрізняється тим, що включає кілька типів «записів-членів» набору [17].

Щоб уникнути дублювання та порушення цілісності, мережна модель вимагає, щоб зв'язки встановлювалися між існуючими записами. Крім того, дані можуть бути ізольовані у відповідних таблицях та пов'язані із записами в інших таблицях.

Цілісність даних в даному випадку говорить про те, що при модифікації таблиць самі дані та логічні зв'язки, встановлені між ними, не повинні бути втрачені. Крім того, зазначений тип і діапазон даних також повинен дотримуватися за будь-яких змін.

Головна перевага мережевої моделі – можливість ефективної реалізації за показниками витрат оперативності та пам'яті. Крім того, дана модель надає великі можливості утворенні довільних зв'язків.

Недоліки моделі виявляються в її складності та жорсткості використовуваної схеми БД. Найбільш критичним мінусом є «жорсткість». Пошук даних, а також доступ до них може бути реалізований тільки по зв'язках, які дійсно існують в рамках конкретної моделі. Крім того, мережні БД складні для розуміння та виконання обробки інформації. Важливо і ослаблений контроль цілісності зв'язків через допустимість їх довільної кількості [2].

2.2. Стандарт CODASYL

Спочатку мережеві СУБД замислювалися уявлення складних взаємозв'язків між даними. Для створення стандарту на конференції CODASYL було сформовано робочу групу List Processing Task Force , яку потім перейменували на DBTG – Data Base Task Group . У завдання цієї групи входило визначення специфікацій середовища, яка допускала б розробку мережевих баз даних та управління ними. Звіт, розроблений цією групою, включав такі твердження:

мережна схема є логічну організацію всієї бази даних цілком, обов'язково включаючи ім'я БД, а також типи всіх записів і компонентів;
підсхема являє собою ту частину БД, яку видно конкретним користувачам або додаткам;
мова управління даними є інструментом визначення структури та властивостей даних.

Крім того, група DBTG запропонувала стандартизувати такі мови:

DDL – Data Definition Language – мова визначення даних схеми БД, з якого адміністратор БД може її описати;
DDL для підсхеми, що дозволяє визначати в додатках частини БД, доступ до яких необхідний;
DML – Data Manipulation Language – мова маніпулювання даними, створений управління БД.

Важливо відзначити, що цей звіт не отримав офіційного схвалення Національним Інститутом Стандартизації США ( ANSI - American National Standards Institute ), проте велике число систем потім було розроблено у повній відповідності до пропозицій групи DBTG . Такі системи отримали назву CODASYL – або DBTG- систем [9].

2.3. Вимоги до мережевих моделей

У моделях мережевих БД дуже важливо, щоб виконували певні вимоги до зв'язків. Тип зв'язку характеризує два типи записів: предка та нащадка. Примірник типу включає один екземпляр предка і кілька екземплярів нащадків. Для конкретного типу зв'язку L із записом-предком P та записом-нащадком C повинні виконуватися умови:

всякий екземпляр P є предком лише одному примірнику L ;
всякий екземпляр C є нащадком трохи більше , ніж у одному екземплярі L .

На формування типів зв'язку особливі обмеження не накладаються, тому найчастіше виникають такі ситуации:

тип запису-нащадка в одному типі зв'язку L 1 може бути записом-предком в іншому типі зв'язку L 2 (аналогічно ієрархії);
тип запису P може бути ролі предка у кожному числі типів зв'язку;
тип запису P може у ролі нащадка у кожному числі типів зв'язку;
в рамках однієї моделі може існувати будь-яка кількість типів зв'язку з тим самим типом запису-предка і одним і тим же типом запису-нащадка. При цьому якщо L 1 і L 2 являють собою два типи зв'язку із записом-предком P і записом-нащадком C , правила, згідно з якими утворюється спорідненість, в різних зв'язках можуть відрізнятися;
типи записи X і Y можуть у ролі предків і нащадків лише у зв'язку й у зворотних ролях у іншому зв'язку;
предки і нащадки можуть бути записами одного типу [9].

Приклад мережної схеми бази даних наведено малюнку 9.

Рисунок 9 – Приклад мережевої БД
Набір операцій для маніпулювання даними може включати такі операції:

пошук конкретного запису у наборі однотипних записів, наприклад, пошук студента Іванова І.І.;
перехід від предка до першого нащадка по якомусь зв'язку, наприклад, перехід до першого студента з групи 15Р3;
перехід до наступного нащадка у межах будь-якої зв'язку, наприклад, перехід від студента Іванова І.І. до студента Петрова П.П.;
перехід від нащадка до предка по якомусь зв'язку, наприклад, знайти групу, в якій навчається Петров П.П.;
створення нового запису;
редагування запису;
видалення запису;
включення у зв'язок;
виключення із зв'язку;
перенесення в інший зв'язок і т.д. [6]

2.4. Фізична організація даних у мережевих СУБД

У мережевих БД набори реалізуються за допомогою адресних покажчиків, при цьому можливі такі відображення:

односпрямований список (рисунок 10);

Малюнок 10 – Однонаправлений список

двонаправлений список (рисунок 11);

Малюнок 11 – Двонаправлений список

двонаправлений список із поверненням на власника (рисунок 12).

Малюнок 12 – Двонаправлений список із поверненням на власника
Останній представлений спосіб найчастіше застосовується практично, хоча витрати пам'яті у разі максимальні, проте такий підхід істотно скорочує час обробки з допомогою те, що використання двонаправлених зв'язків дозволяє швидко і легко вносити зміни, а наявність покажчиків прискорює процеси обходу.

Розглядаючи фізичну організацію даних, не можна обмежуватись розглядом способів зв'язку між елементами, також важливо приділити увагу наступним аспектам:

стискування даних при зберіганні;
способи організації зберігання записів змінного складу;
можливість вторинного індексування;
керування фізичним розміщенням даних у пам'яті [8].

2.5. Короткі висновки

У цьому розділі було розглянуто загальні відомості, що стосуються мережевих баз даних та СУБД, описано стандарт CODASYL , наведено вимоги, які пред'являються до мережевих моделей БД, а також приділено увагу фізичній організації даних у мережевих сховищах.

3. ОСОБЛИВОСТІ МЕРЕЖОВОГО ЗБЕРІГАННЯ ДАНИХ

Ідея мережевих систем зберігання даних з'явилася у 90-х роках минулого століття. Основна мета створення – усунути недоліки систем зберігання даних із прямим підключенням ( DAS – Direct - attached Storage ). При цьому мали вирішуватися такі завдання:

зниження витрат та складності управління даними;
зменшення трафіку локальних мереж;
підвищення ступеня готовності даних та загальної продуктивності.

Результатом цієї ідеї стала поява систем NAS ( Network Attach Storage ) та SAN ( Storage Area Network ).

3.1. Пристрої мережі NAS

Головне завдання систем типу NAS є спрощення спільного використання файлів. На базовому рівні NAS є обладнання, підключене до локальної мережі. Такі пристрої отримали назву файлерів , вони реалізуються у вигляді єдиного головного пристрою, який виконує обробку даних і здійснює мережне з'єднання ланцюга дичків. Пристрої NAS використовують системи зберігання в межах мереж Ethernet , використовуючи протокол TCP / IP для спільного доступу до файлів. Описані пристрої дозволяють клієнтам спільно використовувати файли, навіть у випадках, коли клієнтські системи працюють під управлінням різних операційних систем. Основна відмінність від архітектури DAS полягає в тому, що системи NAS не вимагають переведення серверів в автономний режим для підвищення загальної ємності. Крім того, в структуру NAS диски можуть додаватися простим підключенням пристрою до мережі.

Важливо, що пристрої NAS не можуть спільно використовувати носії інших пристроїв NAS в мережі, при цьому кожен новий пристрій, що додається в мережу, повинен керуватися як окремий том. Обмежуючим фактором є те , що NAS-пристрої оперують тільки у файловому форматі і не можуть розділяти свою ємність між кількома вузлами.

3.2. Мережі зберігання даних SAN

Мережі SAN повинні були виправити недоліки DAS та NAS . Концепція SAN була запропонована в 1998 р. шляхом запозичення зі світу мейнфреймів , де вона застосовувалася, наприклад, у центрах обробки даних для підключення комп'ютерів до систем зберігання та розподілених мереж. Основною відмінністю SAN від NAS є спосіб організації обміну даними між серверами та пристроями зберігання. Фактично, архітектура SAN націлена на вирішення проблем, викликаних інтенсивними процедурами резервного копіювання та обміну даними шляхом перенесення всієї системи у виділену підмережу. В основі архітектури SAN лежить протокол Fibre Channel , який дозволяє змінювати ємність системи зберігання даних у широких межах і гарантувати більш високу пропускну здатність у межах виділеної підмережі.

Оптимізація архітектури SAN для протоколу передачі на рівні блоків зробила природним її застосування до роботи з великими базами даних. Вона стала розглядатися як надійне рішення, особливо динамічного структурованого контенту. Крім того, дана мережа не задіює існуючу локальну мережу з метою передачі даних між пристроями зберігання та серверами. Дані тут переміщуються всередині мережі зберігання, не викликаючи при цьому надмірного трафіку локальної мережі. Але застосування блокових команд вводу-виводу означає, що, незважаючи на можливість спільного використання накопичувачів різними серверами, спільне використання файлів різними користувачами в загальному випадку неможливе, що разом з високою вартістю та необхідністю залучення значних ресурсів для управління цими складними рішеннями може обмежувати сфери застосування даної технології.

Це говорить про те, що для передачі даних на рівні блоків користувачі за традицією звертаються до технологій SAN та DAS , що дозволяє точно визначати де і яким чином зберігатимуться дані.

Сьогодні існують пристрої, де забезпечується сумісність як із файловими, і з блоковими протоколами, тобто. працюючі і як NAS , і як SAN .

3.3. Управління життєвим циклом інформації

Зростання обсягів даних веде до зростання систем зберігання. Якщо продовжувати використання старих методів управління даними, вартість таких систем зросте. При цьому важко реалізовувати достатню продуктивність, високу доступність даних, необхідну надійність зберігання інформації.

Одним із рішень даної проблеми є поділ даних за критерієм їхньої цінності для бізнесу та управління інформацією з урахуванням зміни її цінності в часі. Такий підхід отримав назви управління життєвим циклом інформації ILM ( Information Life-cycle Management ). В основі даного підходу лежить ідея про те, що найбільш важлива на даний момент інформація повинна автоматично переміщатися на швидку, надійну та захищену систему зберігання даних. При цьому менш важлива інформація переміщається на менш швидкісну та дешевшу систему.

Одним із методів вирішення протиріччя між часом доступу до даних та їх обсягами є управління ієрархічним зберіганням HSM ( Hierarchical Storage Management ). HSM реалізує політику архівування даних, що рідко використовуються - вони переписуються з дисків на стрічки з компресією.

На початку управління життєвим циклом інформації відбувається оцінка та класифікація наявної інформації, а також ресурсів її зберігання з погляду бізнес-цінності . За ці кроки відповідає організація, яка вирішила керувати своєю інформацією з урахуванням її життєвого циклу. До завдань цієї організації входить:

визначення цілей управління інформацією;
класифікація інформації з урахуванням її цінності для бізнесу.

Головне завдання ILM – забезпечення розширеного набору політик, які зможе задавати користувач. Після визначення цього набору можуть застосовуватися такі технологічні рішення щодо їх реалізації:

різні способи автоматичної інтелектуальної міграції даних із систем зберігання одного класу на інший;
засоби їх географічно віддаленого та локального дзеркалювання ;
інструменти резервного копіювання та архівування і т.д.

Впровадження концепції ILM дозволяє знизити сукупну вартість володіння шляхом зниження витрат на обладнання та програмне забезпечення. Автоматизація управління життєвим циклом інформації означає такий рівень інтеграції додатків, сервісів управління зберіганням та інформаційних ресурсів, при якому достатньо задати ступінь важливості програми або її інформаційних груп, щоб відповідний рівень обслуговування було застосовано автоматично.

3.4. Резервне копіювання

Система резервного копіювання є невід'ємною частиною системи зберігання даних. Крім того, система резервного копіювання є одним з найбільш важливих методів забезпечення безперервності бізнесу. Побудова централізованої системи резервного копіювання скорочує сукупну вартість володіння інфраструктурою за рахунок оптимального використання пристроїв резервного копіювання та зниження витрат на адміністрування.

Централізована система резервного копіювання включає такі елементи:

сервери копіювання даних, до яких підключено пристрої резервного копіювання;
сервер управління резервним копіюванням, який може поєднувати функції сервера копіювання даних;
комп'ютери-клієнти із програмами-агентами резервного копіювання;
консоль адміністратора системи резервного копіювання

Адміністратор системи веде список комп'ютерів-клієнтів резервного копіювання, пристроїв запису та носіїв зберігання резервних даних, а також складає розклад резервного копіювання. Ця інформація зберігається у спеціальній базі, що знаходиться на сервері керування резервним копіюванням.

Згідно з розкладом або за командою оператора, сервер управління дає команду програмі-агенту, встановленій на комп'ютері-клієнті, для початку резервного копіювання даних відповідно до обраної політики. Програма-агент збирає та передає дані, що підлягають резервуванню, на сервер копіювання, який вказується сервером управління.

Сервер копіювання зберігає отримані дані на спеціальному підключеному до нього пристрої зберігання даних. Інформація про процес (які файли копіювалися, на які носії здійснювалося копіювання тощо) зберігається на базі сервера управління. Подібна інформація дозволяє визначати розташування збережених даних за необхідності їх відновлення на комп'ютері-клієнті.

Щоб система резервного копіювання зберігала несуперечливі дані комп'ютера-клієнта, вони не повинні змінюватися в процесі їх збору та копіювання програмою-агентом. Для цього програми комп'ютера-клієнта повинні завершити всі транзакції, зберегти вміст кеш-пам'яті на диск та призупинити свою роботу. Цей процес ініціюється за командою програми-агента, яка передається додаткам комп'ютера-клієнта.

Оскільки система резервного копіювання призначена для відновлення даних після аварії чи збою, створені резервні копії необхідно перевіряти щодо працездатності та цілісності. Крім того, при побудові системи резервного копіювання важливо вкластися у скорочене вікно резервного копіювання.

У локальних мережах необхідно зменшувати трафік даних резервного копіювання. Структура будь-якої системи резервного копіювання передає дані між клієнтськими комп'ютерами та серверами за допомогою локальної мережі. Це говорить про те, що при великих обсягах даних трафік у локальній мережі сильно зросте, що може стати причиною недоступності мережі через зовнішні програми.

До створення SAN для вирішення цієї проблеми використовували виділену мережу для резервного копіювання даних у поєднанні з багаторівневою структурою кількох серверів.

Використання SAN дозволило перенести трафік резервного копіювання з локальної мережі на мережу зберігання. При цьому існує дві реалізації технології:

без завантаження локальної мережі - позамережеве копіювання (LAN- free backup );
без участі сервера - позасерверне копіювання ( Server-free backup ).

Копіювання даних передбачає копіювання даних всередині SAN . Виняток мережного сегмента в даному випадку дозволяє скоротити затримки на передачу трафіку за допомогою мережі IP і плат введення-виводу. Це забезпечує падіння навантаження локальної мережі, внаслідок чого резервне копіювання може проводитись у час доби. Однак за пересилання даних відповідає сервер, безпосередньо підключений до SAN, що збільшує навантаження на нього.

Позасерверне копіювання є подальшим розвитком способу позамережного копіювання, т.к. його основне завдання - зменшення числа пам'яті, процесорів, пристроїв вводу -виводу, задіяних у цьому процесі. Процес позасерверного копіювання повністю архівує розділи, на відміну від файлового архівування, дозволяючи при цьому відновлювати окремі файли. Оскільки в даному випадку резервне копіювання передбачає наявність деякого додаткового третього вузла, який відповідає за процес копіювання, звідси випливає друга назва даного методу - копіювання за участю третьої сторони ( Third-Party Copy , 3PC). Третьою стороною може бути маршрутизатор сховищ даних, виконує функції, відведені серверу.

Перевагою архітектури SAN є відсутність жорсткої прив'язки складових її систем до будь-яких пристроїв зберігання даних. Ця властивість стала основою технології резервного копіювання без участі сервера. У цьому випадку сервер даних та пристрої, що беруть участь у копіюванні, можу мати прямий доступ до дискових масивів. Резервному копіюванню блоків даних, які стосуються якогось файлу, передує створення якогось індексу чи списку номерів його блоків. Це дозволяє надалі залучити зовнішні пристрої для резервного копіювання.

Таким чином, позасерверне копіювання дозволяє переміщувати дані між дисковими масивами та бібліотеками безпосередньо. Дані при цьому переміщуються виключно через мережу SAN, не завантажуючи ні локальну мережу, ні сервери. Це копіювання вважається ідеальним у разі корпоративних мереж, які мають функціонувати у безперервному режимі. Особливо це важливо у тих випадках, коли тимчасовий період, протягом якого можна виконувати резервне копіювання без суттєвого впливу на роботу користувачів та додатків, стає неприпустимо малим [19, 20].

3.5. Короткі висновки

У цьому розділі було розглянуто особливості мережевого зберігання даних, мережі NAS і SAN , управління життєвим циклом інформації, і навіть важливе питання резервного копіювання даних.

ВИСНОВОК

У рамках виконання даної роботи було розкрито тему мережевих баз даних та СУБД. Базою даних називається сукупність взаємозалежних даних, які організовані відповідно до схеми БД таким чином, щоб з ними міг працювати користувач. Для управління базами даних застосовуються спеціальні системи – СУБД, які з наступних компонент:

дані;
апаратне забезпечення;
програмне забезпечення;
користувачі.

Основна функція СУБД - надання користувачеві можливості працювати з БД, не вникаючи в деталі апаратного забезпечення.

Мережева модель бази даних є графом. Основними елементами даної моделі є записи та зв'язки. Перевага мережевих БД полягає у можливості ефективної реалізації за показниками оперативності та витрат пам'яті. Як недоліки можна відзначити високу складність та жорсткість схеми БД. Крім того, у мережній моделі ослаблений контроль цілісності зв'язків через допустимість встановлення довільних відносин.

В основі всіх мережевих СУБД лежать твердження, розроблені групою DBTG , згідно з якими:

мережна схема є логічну організацію всієї бази даних цілком, обов'язково включаючи ім'я БД, а також типи всіх записів і компонентів;
підсхема являє собою ту частину БД, яку видно конкретним користувачам або додаткам;
мова управління даними є інструментом визначення структури та властивостей даних.

Фізично дані зберігаються за допомогою покажчиків. Можливі такі варіанти їх використання:

односпрямований список;
двонаправлений список;
двонаправлений список із поверненням на власника.

У третій главі даної роботи виділено особливості мережевого зберігання даних, до яких належать:

мережі NAS та SAN ;
керування життєвим циклом даних;
технологія резервного копіювання

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ

Баканов М.В. Бази даних. Системи управління базами даних: навчальний посібник/М.В. Баканов, В.В. Романова, Т.П. Крюкова. Кемеровський технологічний інститут харчової промисловості. - Кемерово, 2010. - 166 с.
Виноградова М.С. Математичні методи збереження даних. - М.: МДТУ ім. н.е. Баумана, 2012. - 15 с.
Голіцина О.Л. Бази даних: Навчальний посібник/О.Л. Голіцина, Н.В. Максимов, І.І. Попов. - М.: ФОРУМ: ІНФРА-М, 2010. - 352 с.
ГОСТ 34.321 - 96. Еталонна модель управління даними.
ГОСТ 7.0 - 99. Інформаційно-бібліотечна діяльність, бібліографія.
Громов Ю.Ю. Управління даними: підручник/Ю.Ю. Громов, О.Г. Іванова, А.В. Яковлєв, В.Г. Однолько . - Тамбов : Вид-во ФДБОУ ВПО «ТДТУ», 2015. - 192 с.
Гущин О.М. Бази даних. 2-ге вид., Випр . та доп.: навчально-методичний посібник. М.-Берлін: Директ -Медіа, 2015. - 311 с.
Діго С.М. Бази даних. Проектування та створення. - УМК: ЄАОІ, 2011. - 171 с.
Додон М.В. Розподілена обробка даних у сучасних СУБД. - Самара, 2010. - 106 с.
Єлінова Г.Г. Інформаційні технології у професійній діяльності: Короткий курс лекцій. Оренбург: ГОУ ОГУ, 2014. - 39 с.
Карпова І.П. Бази днів : Навчальний посібник. - СПб .: Пітер, 2013. - 240 с.
Кузін О.В. Бази даних : у чеб. посібник для студ . Кузін, С.В. Леонісова // М.: Видавничий центр "Академія", 2012. – 320 с.
Макарова Н.В. Інформатика: Підручник для вузів/Н.В. Макарова, В.Б. Волків. - СПб .: Пітер, 2011. - 576 с.
Мезенцев К.М. Автоматизовані інформаційні системи: підручник для студ. установ середовищ . проф . освіти – 4-те вид., стер. – К.: Видавничий центр “Академія”, 2013. – 176 с.
Нестеров С.А. Бази даних: навч . п особисті. - СПб .: Вид-во Політех . ун-ту, 2013. - 150 с.
Петров Г.А., Тихов С.В., Яковлєв В.П. Бази даних: навчальний посібник / СПбДТУ РП. - СПб. 2015. - 74 с.
Радигін В.Ю. Бази даних та СУБД: навчально-методичний посібник. - М.: МДІУ, 2011. - 72 с.
Саак А.Е. Інформаційні технології управління: Підручник для вузів. 2-ге вид. / А.Е. Саак , Є.В. Пахомов, В.М. Тюшняків . - СПб .: Пітер, 2012. - 320 с.

Електронні ресурси:

Базові технології в системах зберігання даних [Електронний ресурс] URL : http :// www . npk . ru / articles / article . html ? io =1& id =83& pv =1 (дата звернення 19.02.2016)
Організація резервного копіювання в центрах обробки даних [Електронний ресурс] URL: http://www.bytemag.ru/articles/detail.php?ID=8610 (дата звернення 19.02.2016)

скачати