Вимоги до геоінформаційних систем та утримання баз даних

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Міністерство освіти і науки Російської Федерації

Волгоградський Державний Університет

Факультет Управління та Регіональної Економіки

Кафедра економіки природокористування

Реферат

З дисципліни: "Географічні інформаційні системи"

на тему: "Вимоги до ГІС та утримання баз даних"

Волгоград 2008

Зміст

Введення

1. Вимоги до ГІС

1.1 Принципи організації ГІС

1.2 Структура ГІС та її основні функції

2. Бази даних

2.1 Поняття про базу даних

2.2 Файлові бази даних

2.3 Взаємодія баз геолого-геофізичних даних

Література

Введення

Геоекологічний прогноз, а також створення системи моніторингу в районах інтенсивного техногенного впливу вимагають залучення і комплексного аналізу різноманітної інформації як природного, так і соціально-економічного характеру. Для цього необхідна організація системи автоматизованого збору, обробки та аналізу природного інформації, побудованої на базі сучасних ЕОМ і автоматичних пристроях введення-виведення інформації. Можливість оперативної обробки великих обсягів геоекологічної інформації, включаючи картографічну, найбільш істотна при оцінці стану геосистем регіонального рівня, а також для територіального планування та управління ресурсами навколишнього середовища. У сучасних умовах планування народного господарства з обов'язковим проведенням геоекологічних експертиз природоохоронна інформація набуває якість особливого виду ресурсу (інформаційного) з усіма специфічними вимогами до методів її отримання та обробки. Така оцінка інформації вимагає принципово нового підходу до організаційних структур виробництва і переробки даних про навколишнє середовище на базі сучасної промислової технології.

Цій меті служать геоінформаційні системи (ГІС).

ГІС - це комп'ютерні системи збору, зберігання, вибірки, аналізу і відображення просторових даних. Створення автоматизованих систем природного інформації входить в коло завдань геоекоінформатікі - наукового напрямку, що розробляє теорію, методи і технологію інформаційного забезпечення та автоматизації біосферних і геоекологічних досліджень з метою раціоналізації природокористування та охорони природи.

ГІС є ефективним засобом для вивчення інтегральних ефектів антропогенного впливу на навколишнє середовище, оскільки вона акумулює і обробляє дані за тривалий період часу для великих географічних регіонів.

Одна з найважливіших проблем створення ГІС - це інформаційне забезпечення регіональних геоекологічних моделей, що включає як вибір джерела для формування бази даних, визначення точності інформації, що надходить, так і визначення набору параметрів, необхідних і достатніх для вивчення динаміки геосистем різного ієрархічного рівня.

1. Вимоги до ГІС

1. 1 Принципи організації ГІС

Геоінформаційна технологія зародилася на початку 60-х років для автоматизації ряду операцій з обробки географічних даних. Перші системи створювалися при відсутності програмного забезпечення, наявності примітивної обчислювальної техніки та пристроїв введення-виведення графічних даних.

Розвиток інформаційних систем йшло як по шляху збільшення оброблюваних обсягів даних, так і ускладнення структури, що зберігається. Тому інформаційні масиви, призначені для обробки на ЕОМ, організовуються в бази даних (БД). Для забезпечення досить складних операцій з пошуку і вибірці даних в БД, їх об'єднання в інформаційні масиви необхідної структури розробляються системи управління базами даних.

На даний момент ГІС представляють собою складну інформаційну систему, що включає потужну операційну систему, інтерфейс користувача, системи ведення без даних, відображення графічної інформації.

Поряд з ГІС широке поширення отримала організація проблемно-орієнтованих БД, призначених для картографування природних і соціально-економічних явищ. Такі БД називаються картографічними банками даних (КБД).

Найважливіша функція КБД полягає в автоматизованому картопостроеніі, виконуваної автоматизованої картографічної системою (АКС), яка є невід'ємною частиною також ГІС.

В останні роки при створенні інформаційних систем (ІС) в географії підвищену увагу приділяється побудові експертних систем (ЕС). Під ЕС розуміється система логічного висновку, яка грунтується на фактах (знаннях) і евристичних прийомах (емпіричних правилах) обробки даних. Основні складові частини ЕС: 1) база знань (БЗ) - організовані набори фактів і 2) механізм логічного вирішення поставленого завдання.

Поява в останні роки масового інтересу до побудови ГІС вимагає вироблення принципів оцінки створюваних інформаційних систем, їх класифікації, визначення потенційних можливостей. Певною мірою це можливо при виробленні вимог до ідеальної ГІС:

  1. Можливість обробки масивів покомпонентний гетерогенної просторово-координованої інформації.

  2. Здатність підтримувати бази даних для широкого класу географічних об'єктів.

  3. Можливість діалогового режиму роботи користувача.

  4. Гнучка конфігурація системи, можливість швидкої настройки системи на вирішення різноманітних завдань.

  5. Здатність «сприймати» і обробляти просторові особливості геоекологічних ситуацій.

Розробка ГІС включає етап проектування структури, визначення цілей і завдань, потенційних користувачів. Проектування ГІС, як складної інформаційної системи, вимагає використання методів системного аналізу, за допомогою яких вирішуються такі завдання:

- Побудова концептуальної моделі ГІС, визначення її підсистем, характеру взаємозв'язку між ними;

- Структуризація географічної інформації з урахуванням специфіки обробки, зберігання та подання на ЕОМ і автоматичних пристроях;

- Визначення етапів перетворення і обробки надходить природного і соціально-економічної інформації;

- Створення людино-машинних систем для математичного моделювання природних і соціально-економічних процесів у структурі ГІС.

Використання інформаційної технології в геоекології передбачає автоматизацію процесів збору та аналізу параметрів геосистем. Отримання і обробка інформації розглядаються як єдиний процес, що включає ряд послідовних етапів (табл. 1).

Етапи інформаційної технології в створенні та експлуатації ГІС включають наступні стадії: збір первинних даних, введення та зберігання даних, аналіз даних, аналіз сценаріїв і прийняття рішень. Необхідно відзначити, що виділені етапи є найбільш загальними і повторюються при створенні конкретних ГІС, розрізняючи в деталях, пов'язаних з цілями і завданнями ГІС, а також технічними можливостями системи.

Очевидно, що джерела інформації, процедура її отримання, методи аналізу повинні розглядатися як етапи єдиного технологічного процесу, об'єднаного спільністю цілей і завдань побудови та експлуатації ГІС. Це означає, що в основу проектування і створення ГІС повинна бути покладена єдина методологія. Оскільки ГІС можна розглядати як засіб машинного представлення даних і знань комплексу наук про Землю, то в якості методологічної основи ГІС повинно бути вибрано напрямок їх побудови як інструментарію пізнання закономірностей структури і організації геосистем за допомогою засобів інформатики, що включає математичне моделювання і машинну графіку.

1.2 Структура ГІС та її основні функції

У найзагальнішому вигляді структура ГІС може бути представлена ​​наступним чином (рис. 1): діалогова система користувача програмно-технічний комплекс, бази даних, блок моделей,

блок оцінки та прийняття рішень. Побудова ГІС виконується за блочним (модельному) принципом. Це дає можливість розширювати систему за рахунок додавання нових блоків (програм) або працювати тільки з певною частиною (модулем) ГІС.

Рис. 1. Структура ГІС



Багатоцільові ГІС можуть бути використані для вирішення різних завдань. Виконання розв'язуваних завдань пов'язані з здійсненням певних функцій. Так, поряд з іншими, ГІС виконує такі основні функції: підготовку та ведення банків даних; інформаційно-довідкові; імітаційного моделювання; експертного моделювання; автоматизованого картографування.

ГІС може розглядатися як інформаційна основа (база даних) для вивчення природних особливостей регіону і як інструмент дослідження динаміки або прогнозу явищ і процесів (система моделей).

Крім цього, ГІС може використовуватися як інформаційно-довідкова система, за певним запитом виконує пошук і вибірку даних. Наступний момент роботи ГВС пов'язаний з розробкою математичних моделей або системи експертних оцінок з метою аналізу динаміки геосистем.

Для вирішення кожної з перерахованих завдань необхідна розробка алгоритмічного та програмного забезпечення, а також створення діалогових людино-машинних систем, що підтримують роботу користувача і представлення результатів моделювання в традиційному картографічному вигляді.

Програмно-технічний комплекс. На даний момент ГІС комплектуються як графічні станції, що використовують різноманітні засоби введення-виведення графічної інформації. Для організації регіональних ГІС потрібно ЕОМ з досить великим об'ємом оперативної пам'яті і значним швидкодією, що працює як в інтерактивному, так і в пакетному режимі. З цією метою можуть бути використані як великі ЕОМ (для обробки космічної інформації), так і персональні комп'ютери.

Пристрої введення графічної інформації поділяються на автоматичні (сканери) та напівавтоматичні (цифрователь). Для побудови картографічних зображень використовуються: графобудівники, матричні принтери, кольорові струменеві друкуючі пристрої. До складу графічної системи входить також кольоровий графічний дисплей, який забезпечує діалоговий режим користувача.

Інформаційний блок (бази даних). Інформаційні масиви в ГІС об'єднуються в бази даних, доступ до яких забезпечується СУБД. Основне призначення баз даних полягає в обслуговуванні інформаційних потреб користувача, а також підтримці системи моделей ГІС. В БД зберігається не тільки фактологічна інформація на певний момент часу, але також початкові умови і коефіцієнти рівнянь моделі, що використовуються в режимі імітаційного моделювання.

Для пошуку і вибірки даних використовуються різні команди запитів користувача. Використання або комбінування різних команд дає можливість представляти результати запиту в різному вигляді: табличному, графічному, картографічному. Залежно від запиту, фактична інформація може бути доповнена статистично параметрами: середнім значенням, дисперсією і т.д.

Блок моделей. Даний блок включає програмне забезпечення, призначене для різних операцій з обробки даних. Оскільки ГІС будується як багатоцільова і багатофункціональна інформаційно-моделююча система, то до її складу включаються пакети прикладних програм, а також банк стандартизованих моделей.

Центральне місце в ГІС займає система автоматизованого картографування. При організації ГІС можуть бути використані вже готові моделі чи програмні блоки, що відповідають вимогам розв'язуваних завдань. Стандартизація приватних моделей, що моделюють окремі властивості ландшафту або його компонентів (грунт, рослинність, міграція речовин у ландшафті) спрощує процедуру інформаційного забезпечення моделей, а головне, дає можливість використовувати наявний досвід в області моделювання конкретних процесів у ландшафті при вирішенні нових завдань.

Важливе місце в ГІС відводиться блоку експертного моделювання та експертних оцінок. У даній частині ГІС провідна роль відводиться експерту, спеціалісту в конкретній предметній області. Робота даного подблока ГІС полягає у автоматизації традиційних методів аналізу та синтезу геокологіческой інформації, виконуваних експертом на основі набору емпіричних правил.

Система управління діалогом користувача. Функціонування ГІС як цілісної системи забезпечується системою управління діалогом користувача. Даний блок здійснює взаємозв'язок між окремими підсистемами ГІС, організовуючи діалогове взаємодія користувача з системою. У залежності від розв'язуваної задачі виконується автоматична настройка ГІС на її рішення. Для цього з банку моделей вибирається необхідна модель, з інформаційного блоку всі необхідні дані.

Діалоговий режим ГІС розрахований на користувачів різного ступеня підготовленості: прикладних програмістів, аналітиків і дослідників і випадкових користувачів. Для кожного типу користувача вибирається свій рівень ведення діалогу.

Блок оцінки та прийняття рішень. Результати роботи ГВС аналізуються в блоці оцінки та прийняття рішень. Слід зазначити, що система управління діалогом користувача нерозривно пов'язана з блоком оцінки та прийняття рішень за допомогою формування набору сценаріїв, виборів методів відображення (табличного, картографічного) одержуваних результатів.

Блок оцінки, як і діалогова система, розрахований на різні режими роботи ГВС. Найбільш простий - це використання ГІС як інформаційно-довідкової системи, більш складний, стосується розробки автоматизованої методики аналізу результатів імітаційного моделювання.

Вибір сценаріїв безпосередньо пов'язаний з оцінкою геоекологічних ситуацій і багато в чому спирається на знання експерта про найбільш типових або ймовірних умов поведінки досліджуваного природного об'єкта під впливом збурюючих факторів.

У сучасних системах контролю та управління якістю навколишнього середовища важливе місце займає оперативність отримання результатів машинного прогнозування. ОПР потрібно в стислі терміни переглянути різні сценарії моделювання, проаналізувати отримані результати і запропонувати найбільш оптимальні управлінські рішення, що спираються на результати роботи моделей ГІС.





2. Бази даних

Великі обсяги первинної геоінформації, реєстрованої як чотирьох рівнях спостереження, вимагають організації їх зберігання в пам'яті мікро-, міні-та супер-ЕОМ за спеціальними правилами і принципами, що дозволяє здійснювати багаторазове до них звернення з метою використання даних для обробки та інтерпретації, вибору стратегії подальших прогнозно-пошукових або розвідувально-експлуатаційних робіт, прийняття за результатами обробки та інтерпретації оптимальних управлінських рішень.

При цьому важливо, щоб організація даних та їх зберігання в різних технічних засобах [мікро-ЕОМ («Іскра», «Електроніка», IBM і ін) в режимі персонального комп'ютера, міні-ЕОМ (СМ ЕОМ, БВК (СМ-1) , керуючі обчислювальні комплекси НВК (СМ-2, СМ-4, СМ-1420, СМ-1810 та ін), а також супер-ЕОМ (експедиційні обчислювальні комплекси ЕГВК ПС-2000 та СМ-2, ЕС-10/55 і ін)] відрізнялися єдиної технологією, забезпечуючи можливість їх використання для вирішення різних геологічних завдань з урахуванням різниці технічних засобів. Розглянемо поняття бази даних, різних типів баз даних та їх взаємодії між собою.

2.1 Поняття про базу даних

Описи даних і відносин між ними визначають двома типами: логічне та фізичне. Фізичний опис даних забезпечується фізичної записом даних на зовнішніх носіях (магнітних стрічках, дисках, дискетах тощо) і представляє спосіб зберігання інформації на цих носіях.

Логічне опис даних вказує на те, в якому вигляді дані уявляє собі користувач, програміст, і завдання геоінформатики полягає саме в аналізі логічного опису геоданих та їх взаємовідносин між собою для подальших операцій зберігання, передачі та обробки.

Згідно з визначеннями Асоціації за мовами систем обробки даних (CODASYL) виділяють наступні опису даних.

Байт - найменша адресується група бітів (8 бітів).

Елемент даних - найменша одиниця пойменованих даних, яка може складатися з будь-якої кількості бітів або байтів. Елемент даних - це будь-яка (одна) характеристика досліджуваного об'єкта, у тому числі і його координати; елемент має ім'я (ідентифікатор).

Агрегат даних - пойменована сукупність елементів даних. Виділяються два типи агрегатів: вектор ~ одномірна упорядкована сукупність елементів (наприклад, назва району робіт, номер профілю, номер точки спостереження утворюють агрегат даних) і повторювана група - сукупність векторів, що зустрічаються кілька разів поспіль, наприклад, коли дані описуються таким чином, що спочатку вказуються номери профілів, а потім номери точок, тобто повторюється пара: профіль - точка, профіль - точка і т.д.

Запис даних ~ пойменована сукупність елементів або агрегатів даних. Сукупність елементів описується так, як це представляється програмісту, причому логічна запис може не збігатися з фізичної, оскільки логічна запис складається з елементів, розташованих в інших фізичних записах.

Елементи запису - це характеристики (ознаки, координати) одного об'єкта, зокрема, однієї точки спостереження. Кожна запис описується ім'ям (ідентифікатором) і форматом зберігання, що визначає спосіб упаковки елемента запису на стрічку, диск, дискету. При читанні з бази даних програміст може повністю прочитати логічну запис.

Файл - пойменована сукупність всіх примірників логічних записів заданого типу. Якщо запис представляє опис різних характеристик об'єкта або точки спостереження, то файл - це сукупність тих же характеристик по декількох об'єктів або за профілем спостережень, тобто файл - це матриця - таблиця вихідних даних.

База даних (БД) - сукупність записів різного типу, що містить перехресні посилання, або інакше - це сукупність екземплярів різних типів записів і відношень між записами, елементами, агрегатами. БД - це також сукупність матриць - таблиць (файлів) і програм, які визначають відносини між типами даних.

База даних, по іншому поширеній в геофізиці визначенням - це сукупність масивів даних на зовнішніх носіях та програмних засобів доступу до них, де під масивами маються на увазі і запис, і файли. Дійсно, геофізичні, геохімічні та геологічні пакети програм включають дані різних типів: польові спостереження, інформацію про досліджуваному об'єкті та системі спостережень; проміжні результати обробки; параметри обробки; програмно-сформовані зображення виводяться результатів і т.д.

Фізична організація БД, на відміну від логічної, - це фізичне уявлення даних та їх розташування на запам'ятовуючих пристроях.

База даних організується таким чином, що дані збираються один раз і централізовано зберігаються так, щоб вони були доступні всім фахівцям-програмістам, охочим їх використовувати. Одне з важливих властивостей БД - незалежність даних від особливостей прикладних програм, які їх використовують. Це означає, що зміна значень даних або особливостей їх зберігання на фізичних носіях не вимагає зміни прикладних програм.

У поняття БД включається система управління базою даних (СКБД), призначена для виконання операцій з обробки даних у прикладних програмах. СУБД переглядає опис фізичної організації БД і визначає, яку фізичну запис (записи) потрібно вважати, при цьому СУБД видає операційній системі ЕОМ команду читання необхідної запису.

Нерідко поняття БД і СУБД об'єднують в одне поняття банк даних.

Поняття бази даних нерозривно пов'язано зі структурою її побудови (виділяють ієрархічні, мережні і реляційні БД), мовою маніпулювання даними та мовою опису даних.

Мова опису даних (ЯОД) - засіб оголошення СУБД тих структур, які будуть використовуватися при обробці. ЯОД включається в програмне опис ЕОМ. ЯОД для логічного опису повинна ідентифікувати типи даних (елемент, запис, файл), тобто присвоювати ім'я кожному типу даних.

Мова маніпулювання даними (ЯМД) - це інтерфейс (стикування) між прикладною програмою і СУБД. ЯМД включає ряд програм, що здійснюють відкриття або закриття файлу, заміну або видалення окремих записів з файлу (або самого файлу), передачу в робочу область програми вмісту зазначеного елемента даних і т.д.

Серед структур побудови БД найбільш поширені в геологорозвідці реляційні БД. Реляційні БД - це табличне представлення даних, зазвичай у вигляді двовимірних таблиць. Кожен елемент таблиці - це один елемент даних, повторення тут відсутні. Всі стовпчики таблиць - однорідні, тобто елементи стовпця мають однакову природу (значення одного і того ж поля, властивості, параметри і т.д.). Кожному стовпцю присвоєні імена. У таблиці немає двох однакових рядків, оскільки координати точок спостереження різні. В операціях з таблицею її рядки і стовпці можуть розглядатися в будь-якому порядку, в будь-якій послідовності. Всі найбільш застосовувані таблиці при, геолого-геофізичних дослідженнях, наприклад, таблиця петрофізичних властивостей гірських порід, таблиця опису фізико-геологічної моделі об'єкта (родовища) і т.д., задовольняють зазначеним властивостям. Подібні таблиці називаються ставленням, а база даних, побудована за допомогою відносин називається реляційної. Таким чином, реляційна БД будується з плоских наборів елементів даних (рис. 2, а). У реляційних БД зустрічаються терміни: домен (один стовпець таблиці) і кортеж - таблиця, яка визначає взаємозв'язок між елементами. даних. Інакше, кортеж - набір взаємопов'язаних величин, а файл утворюється з набору кортежів.

Основні переваги реляційних БД: простота, гнучкість, точність, зв'язність, простота впровадження, незалежність даних від прикладних програм, ясність.

Поширеними структурами БД в геологорозвідці є також ієрархічні або деревоподібні структури (див. рис. 2, б). Дерево - це ієрархія елементів, званих вузлами. На верхньому (першому) рівні ієрархії знаходиться один вузол - корінь. Кожен вузол, крім кореня, пов'язаний з одним вузлом на більш верхньому рівні, званому вихідним вузлом для даного вузла. Жоден елемент не має більше одного вихідного. Кожен елемент може бути пов'язаний з одним або декількома елементами на більш низькому рівні. Такі елементи називаються породженими, а елементи, що не мають в кінці галузі породжених, називаються листям.

Використовується термін ієрархічний файл, тобто такий файл, у якому записи пов'язані в вигляді дерева. Ієрархічні структури БД використані в автоматизованій системі АСПО-8 і в концепції створення банку «Розвідувальна геофізика».

Рідко використовується так звані мережеві структури БД, наведені на рис. 2, ст.

У трьох наведених на рис. 2, в мережевих структурах перша (зліва) має три рівні і для кожного вузла - два вихідних елемента, друга (в середині) - чотири рівня, третя (праворуч) - п'ять рівнів.

Мережеві структури БД характерні для організації управлінням геологорозвідувальним виробництвом на рівні експедиції і вище.

Організація даних в БД перш за все повинна правильно передавати їх основне смислове значення, або семантику, та дозволяти ефективно до них звертатися. У звичайній прикладній програмі структура даних організується таким чином, щоб забезпечити зручний доступ до них з даної програми.

Малюнок 2. Структури даних:

а-реляційна, б-ієрархічна, по-мережева

БД містить дані, які використовуються безліччю різноманітних програму, отже, при визначенні структури БД не можна орієнтуватися на критерії, які використовуються при програмуванні конкретних функцій. При обробці геолого-геофізичних даних БД характеризується великими і дуже великими розмірами вибірок. Великим називається таке значення, яке перевершує кількість даних, що обробляються однією людиною, навіть якщо він має доступ до обчислювальної системи. Фактична кількість змінюється від складності даних і розв'язуваних завдань. Прикладом великий БД є система, яка містить відомості вже про 5000 зразках, рудних тілах, родовищах і т.д. Така БД може, наприклад, містити 300 000 записів десятка або більше типів. Три тисячі сейсмічних стрічок зі стоканальной записом кожна вже утворюють велику БД.

Дуже велика БД утворюється, наприклад, при зведенні всіх геолого-геофізичних даних для одного мільйонного аркуша.

Великі масиви геолого-геофізичної інформації вимагають використання спеціальних систем для організації зберігання і пошуку даних. Такі системи називаються інформаційно-пошуковими (ІПС). ІПС, по суті, представляють БД спільно з СУБД, що здійснюють швидкий пошук даних. Пошук даних зазвичай проводиться за певним символу. На відміну від БД і СУБД, які можна розглядати окремо, для ІПС характерна нерозривний зв'язок функцій БД та СУБД.

У сейсморозвідці при створенні автоматизованої системи обробки даних СЦС-3 широке застосування отримала ІПС «ІНЕС». При обробці та інтерпретації даних ГІС використовується ІПС ГЕОКОМПАС, що базується на СУБД КОМПАС.

2.2 Файлові бази даних

Вищенаведені визначення БД, засновані на концепціях CODASYL, а також ієрархічні і мережеві структури БД складно використовувати при зберіганні, пошуку та обробці масових геолого-геофізичних даних, що пояснюється наступними обставинами:

  1. при багатоетапної і багатоцільовий обробці даних важко заздалегідь визначити зв'язки між усіма типами геооб'ектов і відповідними їм типами записів. При вирішенні різних геологічних завдань взаємозв'язку між об'єктами обробки (точками спостережень, геологічно однорідними майданчиками, геохімічними та геофізичними аномаліями, відомими проявами корисних копалин тощо) змінюються. Змінюється також і принцип групування записів, які відповідають цим об'єктам;

  2. окремий запис при обробці геолого-геофізичних матеріалів не має, як правило, самостійного значення.

    Тому кошти більшості систем управління базами даних, орієнтованими на пошук та надання програмісту одиничних записів, не можуть задовольнити ні програміста, що займається створенням геолого-геофізичного програмного забезпечення, ні геолога-геофізика як фахівця в. області обробки та інтерпретації даних;

    3) реляційні БД більшою мірою, ніж мережеві та ієрархічні, пристосовані до обробки геолого-геофізичних даних, оскільки реляційну БД можна розглядати як сукупність різноманітних таблиць об'єкти - властивості, зв'язки між таблицями неявно визначаються через загальні елементи даних, наприклад, координати точок. Однак і реляційна БД практично не враховує особливості технології зберігання, пошуку та обробки масових даних: а) геолого-геофізичні дані зберігаються у вигляді географічно, покоординатного заданої інформації, що відноситься до певного методу, способу досліджень при певній детальності робіт (масштаб робіт), б) при довготривалому зберіганні геолого-геофізичні дані не модифікуються, оскільки вони зазвичай пройшли стандартну первинну обробку; в) кожний новий фрагмент даних повинен розглядатися як автономний (інакше ведення баз при їх реальних величезних обсягах стане непосильно трудомістким), але система пошуку повинна забезпечувати оперативний пошук і вибір необхідного фрагмента бази даних; г) технологія обробки диктує необхідність доставки геолого-геофізичних даних не по окремих записів, а досить великими порціями (сейсмічна траса, профіль, площа зйомки і т.п.).

    З урахуванням зазначених обставин і особливостей технології зберігання та обробки геоінформації В.В. Ломтадзе запропонував синтезувати гідності файлових структур опису даних, інформаційно-пошукових систем і реляційних БД, До переваг файлової структури належить автономія фрагментів інформації, оформлюваних у вигляді окремих файлів. Переваги ІПС полягають у можливості значеннєвого пошуку фрагментів інформації (файлів), необхідних для вирішення конкретних завдань. Нарешті, гідності реляційних баз даних складаються в логічній ясності представлення даних, гнучкості їх перетворення і т.д., оскільки можна "вирізати" з таблиць об'єкти - властивості необхідні стовпці (властивості) або, навпаки, «склеювати» їх, формуючи для прикладних програм файли з заданим складом записів.

    Під файлової базою даних (ФБД) розуміється сукупність організованих за загальними принципами файлів, між якими неявно визначено зв'язки. Якщо в мережевих та ієрархічних базах даних об'єктом пошуку та обробки є запис, то в ФБД основний об'єкт пошуку та обробки представляє файл або ж сукупність взаємопов'язаних однотипних записів, звана масивом і є частиною файлу. В окремих випадках можна виконувати роботу і з окремими записами.

    Вибір стандартних структур організацій даних, в які, як у контейнери (або як книги на полиці бібліотеки), вкладається різноманітна інформація, є ключовим моментом при проектуванні технології обробки масових геолого-геофізичних даних. До переваг концепції банку даних належить запровадження поняття структури даних і виділення набору стандартних структур, керованих набором стандартних програм і підпрограм, що входять у конкретну СУБД. Такий набір програм і підпрограм В.В. Ломтадзе для файлових баз даних називає системою оперування даними (СОД), яка грає роль загальносистемного програмного апарату.

    У ФБД виділяють чотири структури даних: файл, масив, запис, елемент, які по суті все розмаїття площинної геолого-геофізичної інформації.

    Файл зазвичай відповідає площі робіт, тобто містить конкретні дані по цій площі.

    Масив файлу відповідає профілю або маршрутом, свердловині або інтервалу свердловини, сейсмічної трасі, кривої ВЕЗ, МТЗ або будь-який інший сукупності точок спостереження, тобто масив містить дані за профілем, маршрутом, свердловині і т.д. Масив складається з заголовка і записів.

    Заголовок - особлива запис для характеристики масиву в цілому. Записи масиву в сукупності утворюють таблицю об'єкти - властивості. Один запис відповідає одному об'єкту і збігається з поняттям «запис» в термінах CODASYL.

    Елементи запису - це характеристики, наприклад, значення конкретного фізичного поля, координати, ознаки одного об'єкта, тобто однієї точки профілю, однієї точки свердловини, однієї точки сейсмотрасси і т.п.

    Будь-який файл в СОД складається з короткого паспорта і масивів. Є близька аналогія між паспортом файлу і анотацією книги, між масивами файлу і главами тієї ж книги. У паспорті файлу міститься ім'я (або назву) файлу, ім'я (позначення) власника партії, експедиції, об'єднання, параметр PACK, зазвичай рівний 1 (це означає, то дані, що містяться у файлі, повинні зберігатися на стрічці або диску в упакованому вигляді; в випадку РАСК = 0 упаковка забороняється), параметри V (число елементів даних у заголовку кожного масиву), W (Число елементів даних у заголовках кожного файлу), Р о> символічно позначає принцип кодування масивів файлу (принцип групування записів в масиви); Pj, Uj, Cj, (/ = 1, ..., У + W), що описують елементи заголовка і записів масивів.

    Якщо для геофізичного методу визначено типи файлів, то численні програми обробки та інтерпретації даних можуть розроблятися незалежно один від одного. Будь-який перехід, наприклад, від файлу А до файлу типу В може бути здійснено із застосуванням різних алгоритмів і різних програм.

    На кожному кроці послідовного перетворення файлів за допомогою тієї чи іншої програми виконується перехід від одного або кількох вихідних файлів до одного або більше, які можуть відрізнятися від вихідних структурою і складом. Оскільки кожен крок графа обробки визначається ім'ям програми, що виконує необхідні функції, іменами вихідних і створюваних файлів і значеннями параметрів управління роботою Даною програми (наприклад, граничні координати оброблюваної площі, імена використовуваних ознак і т.п.), то після будь-якого кроку процес обробки може бути перерваний для візуалізації та аналізу проміжних результатів, прийняття рішення про вибір прийомів і параметрів подальшої обробки чи інтерпретації.

    Описаний вище підхід до побудови реляційно-файлових (або просто файлових) баз даних знайшов у цей час саме широке застосування при створенні автоматизованих систем обробки та інтерпретації геолого-геофізичної інформації, а також при забезпеченні програмними продуктами польових обчислювальних комплексів і автоматизованих робочих місць. При цьому більшість програмістів воліють обмежуватися трьома структурами даних: елемент, запис і файл, вважаючи використання структури масиву зайвим.

    2.3 Взаємодія баз геолого-геофізичних даних

    Загальний підхід формалізованого подання масових геолого-геофізичних даних в середовищі ФБД є також ключем до вирішення проблеми створення різних типів баз та їх взаємодії між собою. Вирішення цієї проблеми грунтується на розглянутої формалізації подання різнотипних за змістом і характером »геологічних, геохімічних даних, на що вводяться поняттях регіональних і локальних баз даних і на реалізації організаційно-технічних заходів, здійснюваних в даний час в рамках створення геосистеми.

    Локальна методная ФБД утворюється і існує в період обробки матеріалів польової партії, експедиції, наприклад, гравіметричної, геохімічної, геологорозвідувальної і т.д. Зв'язки між файлами локальної методной ФБД неявно визначаються таблицею типів файлів даного геолого-геофізичного методу, а також прийнятою технологією обробки. Файли деяких типів кожної методной ФБД, утворені, як правило, в результаті обробки на польових обчислювальних комплексах або на автоматизованих робочих місцях, передаються в регіональні бази даних.

    Регіональні бази даних (РФБД) забезпечують довготривале зберігання фактичних даних в державних масштабах.

    Регіональна база даних (РФБД) - це сукупність всіх файлів, що містять геолого-геофізичні дані по одному мільйонному листу картографічної розграфки. Файл, що включається до регіональної ФБД, отримує ім'я, що складається з восьми символів: номенклатура аркуша (3 символи), рік закінчення робіт, дані яких поміщені в файл (2 символи), реєстраційний номер файлу в базі даних на цей рік (3 символи). Наприклад, Р4889005 містить результати робіт, завершених у 1989 р. в межах листа Р-48.

    Коротка інформація про кожен файл регіональної бази (масштаб робіт, вид мережі, координати, «ключі» для переходу від відносних координат в записах файлу до дійсних координатах, дескриптори, що характеризують зміст файлу) поміщаються в пошуковий образ файлу. Пошукові образи всіх файлів регіональної ФБД об'єднують в один файл пошукових образів, що зберігається при пошуку даних на диску. Самі файли регіональних ФБД зберігаються на стрічках або будь-яких інших пристроях пам'яті великої місткості. Зв'язки між цими файлами визначаються через їх пошукові образи і тезаріус - словник, що містить коди (дескриптори) ключових слів.

    Найбільш важливим завданням, що вирішується при створенні та веденні РФБД, є збереження основних фактичних матеріалів, одержуваних при геологорозвідувальних роботах, та забезпечення можливості їх використання для багаторазового подальшої обробки спільно з новими даними. Для вирішення цього завдання в рамках створення Геосистема необхідно:

    1) розподілити територію країни (за мільйонним листам) між регіональними обчислювальними центрами. Такі центри слід організувати на базі яких великих геологічних об'єднань, яких великих науково-дослідних інститутів, оснащених великими і супер-ЕОМ. Можна виділити принаймні вісім регіональних центрів (вказані в дужках) з обслуговування території Росії: Далекий Схід (ПГО «Таежгеологія»), м. Хабаровськ; Східна Сибір - два центри (ПГО «Іркутскгеологія» спільно з ПГО «Іркутскгеофізіка» і ПГО « Красноярскгеологія »); Західна Сибір (ЗапСібНІГРІ), м. Тюмень; Урал (інститути УО РАН), м. Свердловськ; схід Європейської частини Росії (ПГО« Пермьгеологія »); центр Європейської частини Росії (ПГО« Центргеологія », м. Москва) ; північ Європейської частини Росії (ПГО «Севзапгеологія», м. Ленінград); південь Європейської частини Росії, м. Ростов-на-Дону;

    2) стандартизувати організацію даних в рамках методних
    ФБД, визначивши для кожного геолого-геофізичного методу типи
    файлів, що підлягають передачі в регіональні ФБД;

    1. встановити порядок поповнення регіональних ФБД, аналогічний поповненню територіальних геологічних фондів;

    2. здійснити ведення регіональних ФБД на базі спеціалізованої технологічної групи з виконанням функцій з прийому файлів з ​​методних ФБД, їх запису на магнітні стрічки, що належать певному мільйонному листу, складання образів новоприйнятих файлів і їх включенню у файли образів, створення цільових ФБД за запитами.

    Регіональні (або архівні) ФБД використовуються для створення локальних цільових ФБД. Тимчасова цільова БД звичайно призначена для узагальнення та комплексного аналізу геолого-геофізичних матеріалів у межах конкретної території з метою вирішення завдань прогнозування. Для створення тимчасової цільової бази даних користувач (геолог, геохімік, геофізик відповідної технологічної групи обчислювального центру) формує запит, вказуючи прив'язку необхідних даних за місцем (мільйонний лист, граничні координати площ), часу (часовий інтервал проведення робіт, дані яких представляють інтерес для вирішення конкретної прогнозно-пошукової задачі, геоекологічного дослідження і т.д.), детальності робіт та їх змістом (дескриптори, що відображають масштаб досліджень, конкретні геологічні, геохімічні та геофізичні методи).

    Програмне забезпечення регіональних ФБД за допомогою файлу пошукових образів дозволяє встановити, в яких файлах і на яких стрічках знаходиться необхідна інформація, і, отже, отримати цю інформацію, сформувати на її основі тимчасову цільову ФБД. Зв'язки між файлами такий ФБД визначаються структурою системи комплексного аналізу даних і прогнозу геологічних об'єктів, зокрема, виділеними в ній типами файлів, а також технологією обробки даних. Для роботи з локальною ФБД застосовуються загальносистемне - програмне забезпечення, програмний апарат обробки та інтерпретації даних комплексу методів і програми, що належать методним системах обробки. До локальних можна також віднести постійно діючих цільових ФБД по родовищах певного типу, свердловинах (у тому числі надглибоким), окремим локальним структурам і т.п. Такі бази даних зазвичай відрізняються специфікою вирішуваних завдань (наприклад, контроль за експлуатацією нафтогазової поклади), і форми їх взаємодії з регіональними ФБД можуть бути самі різні.

    Література

    1. Кузнєцов О.Л., Нікітін А.А., Геоінформатика. - М. - 1992.

    2. Основи геоінформатики: У 2-х кн. Кн. 1: Учеб. посібник для студ. вузів / О.Г. Капралов, А.В. Кошкар, В.С. Тикунов та ін; під ред. В.С. Тикунова. - М.: Видавничий центр «Академія», 2004.

    3. Екоінформатіка / Под ред. Соколова А.Л. - М. - 1992.

    Додати в блог або на сайт

    Цей текст може містити помилки.

    Програмування, комп'ютери, інформатика і кібернетика | Реферат
    117.6кб. | скачати


    Схожі роботи:
    Використання баз даних та інформаційно пошукових систем для раціона
    Використання баз даних та інформаційно-пошукових систем для раціонального ведення діловодства
    Просопографіческіе бази даних Росії на прикладі баз даних Comandarm і Duma1
    Створення бази даних критичних властивостей речовин в редакторі баз даних MS Access
    Використання геоінформаційних систем для складання схеми землі
    Використання геоінформаційних систем для складання схеми землеустрою
    Роль Геоінформаційних систем (ГІС) у системах екологічного моніторингу
    Організація баз даних
    Організація баз даних
    © Усі права захищені
    написати до нас