1   2   3   4   5   6   7   8
Ім'я файлу: 2017 печ 32Л _конспект лекцій_ЦОЗ_4 курс_Творошенко.pdf
Розширення: pdf
Розмір: 1701кб.
Дата: 07.01.2022
скачати
3 МАТЕМАТИЧНІ ОСНОВИ ФІЛЬТРАЦІЇ ЗОБРАЖЕНЬ
3.1 Фільтрація та відновлення зображень
План
1. Формати графічних файлів. Растрова і векторна графіка.
2. Стиснення зображень без втрат і з втратами.
3. Структура графічного файлу.
4. Моделі зображень. Каузальні, півкаузальні і некаузальні моделі.
5. Авторегресійні моделі.
6. Перетворення яскравості та контрасту.
7. Розтяжка і еквалізація гістограми.
8. Сегментація зображень. Способи сегментації.
9. Розрахунок порогу при порогової сегментації.
10. Сегментація шляхом нарощування областей.
11. Сегментація шляхом виділення кордонів.
12. Розпізнавання зображень.
13. Кластерний аналіз.
14. Теорема Байєса.
15. Помилки класифікації.
16. Геометричні перетворення та прив’язка зображень.
Формати графічних файлів. Растрова і векторна графіка
Для подання графічної інформації на двовимірній площині (екрані монітору) застосовуються два підходи: растровий та векторний.
При векторному підході графічна інформація описується як сукупність абстрактних геометричних об’єктів – прямих, відрізків, кривих, прямокутників.
Векторний опис припускає апріорні знання про структуру зображення.
Векторна модель – лінійний список параметрів (вектор), що математично визначають графічні об’єкти, це складові синтезованого зображення (об’єктно- орієнтована модель).
Растрова модель – прямокутна матриця однакових неподільних елементів-пікселів, кожен з яких у закодованому вигляді відображає певну ділянку реального або синтезованого зображення.
Елемент растру називають пікселем.

41
Стандартна ідентифікація пікселей [8, 9]:



 



j
i
C
j
i
A
j
i
f
,
,
,
,

,
(3.1) де


2
,
R
j
i
A

– область пікселя,


C
j
i
C

,
– атрибут пікселя (як правило, колір).
Частіше за все використовують два види атрибутів:





j
i
I
j
i
C
,
,

– інтенсивність (яскравість) пікселя;




 
 



j
i
B
j
i
G
j
i
R
j
i
C
,
,
,
,
,
,

– кольорові атрибути у моделі RGB.
Растрова графіка оперує з довільними зображеннями у вигляді растрів.
Растр – це опис зображення на площині шляхом розбиття (дискретизації) його на однакові елементи по регулярній сітці і присвоєння кожному елементу свого кольору та будь-яких інших атрибутів.
З математичних позицій растр – це кусково-постійна апроксимація на площині безперервної функції зображення.
Найпростіший растр – прямокутний, найекономічніший для передачі зображень – гексагональний.
Нехай зображення містить дві прямі з відомими координатами початку і кінця кожної, як показано на рисунку 3.1.
Рисунок 3.1 – Дві прямі з відомими координатами

42
Зображення (рис. 3.1) у векторній формі має вигляд


3 3
2 2
1 1
,
;
,
;
,
y
x
y
x
y
x
Зображення у растровій формі, що відповідає цим прямим, представлено в умовному вигляді на рисунку 3.2.
a
a
a
a
w
w
w
w
w
w
a
a
a
a
w
a
a
a
a
a
a
a
a
a
w
a
a
a
a
a
Рисунок 3.2 – Зображення у растровій формі
Зображення (рис. 3.2), що містить дві прямі з яскравістю w на фоні a у вигляді 3 рядків по 10 пікселів, зазвичай, записується в пам’яті електронно- обчислювальної машини у вигляді: aaaawwwwwwaaaawaaaaaaaaawaaaaa.
Для виведення такого зображення на монітор необхідно навести дані про число рядків і пікселів у рядку.
Кожна з форм запису має свої переваги і недоліки.
Растрова форма запису більш універсальна, більш інформативна,
ідеально відповідає архітектурі електронно-обчислювальної машини. Однак, якщо збільшити растрове зображення ліній, то вони стануть товщі.
Векторна графіка позбавлена цього недоліку. При будь-якому масштабі точка зображується пікселем, лінія має однакову товщину. Це надзвичайно важливо при роботі з геоінформаційними системами, коли необхідно послідовно переходити від дрібномасштабних до великомасштабних зображень, від карт місцевості до планів, що містять зображення міст, житлових кварталів та окремих будинків з різними комунікаціями, причому зображення супроводжуються текстовою та цифровою інформацією. Векторна графіка більш орієнтована на роботу з базами даних, ніж растрова.
Під час роботи з космічними зображеннями Землі доводиться одночасно використовувати растрову і векторну графіку, наприклад, накладати зображення земної поверхні на географічну карту, накладати координатну сітку на зображення. Тому в програмному забезпеченні станцій прийому та обробки космічної інформації передбачається перетворення вектор-растр.

43
Для збереження растрових зображень потрібний значний обсяг пам’яті електронно-обчислювальної машини.
Етапи отримання растрової моделі (рис. 3.3): а) дискретизація – розбиття на однакові елементи (дискрети); б) кодування – присвоєння дискрету параметрів, що характеризують відповідний фрагмент зображення.
Рисунок 3.3 – Етапи отримання растрової моделі
Основні параметри растрових цифрових зображень:
– розмір – добуток ширини на висоту в пікселях (наприклад, 400×600).
– дозвіл – щільність інформації на одиницю довжини по горизонталі і вертикалі (ppi – pixels per inch – пікселів на дюйм, наприклад, 300 ppi).
– тип колірної моделі (наприклад, RGB).
– глибина кольору (біт на піксель, наприклад, 24 б/п).
Стиснення зображень без втрат і з втратами
У даний час розроблені різні методи економічною запису зображень у пам’ять електронно-обчислювальної машини та стиснення зображень, існує багато форматів запису.
Один з найпростіших методів стиснення – групове кодування. Відповідно до групового кодування повторювані величини замінюються однією величиною
із зазначенням їх кількості. Наприклад, замість послідовності значень яскравості abbbcccddeeeeeeeeef можна записати 1a3b3c2d9e1f.
Цей метод легко реалізується, він добре працює з довгими серіями повторюваних величин, наприклад, при наявності великих областей з однаковою яскравістю або кольором, у цьому випадку він зручніший, ніж
кодування кодами змінної довжини (статистичне кодування).

44
Групове кодування використовується у форматах TIF, PCX, BMP, воно не вимагає складання кодової таблиці.
Наприклад, космічне зображення природного об’єкту (місце впадання річки Селенга в Байкал) при 24-бітному поданні RGB, 780×780 пікселів має розмір 1,46 Мбайт. Групове кодування у форматі BMP стискає зображення до 479 Кбайт. Групове кодування добре справляється зі стисненням зображень об’єктів, що містять великі ділянки, які однорідні по тону (кольору).
Статистичне кодування більш ефективне, ніж групове [8, 13].
У теорії інформації доведено, що найбільшою середньою кількістю
інформації на одне повідомлення володіє джерело, що видає повідомлення з випадковими, незалежними, рівномірно розподіленими значеннями.
Якщо інтервал зміни цих значень дорівнює


b
a,
, то ймовірність появи будь-якого значення з цього інтервалу однакова, значення яскравості необхідно кодувати словами однакової довжини. З цієї точки зору, «найбільш
інформативним зображенням» буде шум з рівномірним законом розподілу при статистичній незалежності яскравості всіх пікселів.
Однак, реальні зображення істотно відрізняються від випадкового двовимірного поля, вони містять фон і деякі зв’язкові об’єкти. Фон і об’єкти, як правило, мають повторювані значення яскравості, деякі значення яскравості зустрічаються часто, деякі – рідко. Реальне зображення володіє надмірністю, і якщо її усунути, для його збереження потрібний менший об’єм пам’яті.
Надмірність усувається шляхом раціонального кодування, що враховує нерівну ймовірність (точніше, частоту) появи яскравості пікселів і їх взаємозалежність.
Найпростіше врахувати нерівну ймовірність появи різних значень яскравості.
У даний час широко застосовується статистичне кодування за методом
Хаффмана, для якого довжина кодового слова залежить від імовірності появи повідомлення. Кодування за Хаффманом вимагає під час першого етапу проведення аналізу зображень і визначення ймовірності (частоти) появи яскравості (або основних кольорів) пікселів зображення та складання кодової таблиці з урахуванням цих ймовірностей. Далі всім яскравостям присвоюються кодові слова з таблиці. При цьому відбувається стиснення зображення, так як для передачі цієї сукупності буде потрібно менше біт, ніж для запису рівномірним кодом [13].
Нехай растрове зображення має вигляд abbbcccddeeeeeeeeef.
Частоти, з якими з’являються значення яскравості, рівні:
a: 1, b: 3, c: 3, d: 2, e: 9, f: 1.

45
Для кодування цих 6 значень можна використати рівномірний 3-бітний код та записати:
a: 001; b: 010; c: 011; d: 100; e: 101; f: 110.
Загальна довжина кодової комбінації в цьому випадку складе:
19 ⋅ 3 = 57 (біт).
Для кодування по Хаффману використовуємо двійкове дерево (рис. 3.4).
Найбільш рідко зустрічаються значення у цьому прикладі – a та f, вони стають першою парою: a присвоюється 0-а гілка, f – 1-а. 0 і 1 стануть молодшими бітами кодів для a та f. Старші біти будуть отримані з дерева у міру його побудови [8].
Рисунок 3.4 – Двійкове дерево
Підсумовуємо частоти a та f, у сумі отримуємо 2, ця пара далі об’єднується із символом d, який також має частоту 2.
Парі a та f присвоюється 0-а гілка цього дерева, а d присвоюється гілка 1.
Код для a закінчується на 00, для f – на 01, для d – на 1.
Дерево продовжує будуватися так, що найменш поширені величини описуються більш довгими кодами, а найбільш поширені – одним (або більше) бітами. У нашому випадку маємо:
a: 0000; b: 010; c: 011; d: 001; e: 1; f: 0001.
Загальна довжина кодової комбінації тепер дорівнює:
41 4
9 6
9 9
4 4
1 1
9 3
2 3
3 3
3 4
1


















(біт).
Коефіцієнт стиснення рівний 1,39:1.

46
Алгоритм Хаффмана дозволяє у певних випадках досягати стиснення більше, ніж 8:1. Однак, він вимагає два підходи: один для створення кодової таблиці, другий – для кодування. Кодування і декодування по Хаффману великих масивів інформації – порівняно повільні процеси, це характерно і для
інших кодів змінної довжини.
Існують процедури, які не потребують попереднього створення кодової таблиці, у цих процедурах кодова таблиця створюється і уточнюється по мірі надходження даних – адаптивні методи стиснення. До числа таких процедур відноситься схема стиснення LZW (Лемпела-Зеева-Велч), яка використовується в форматах GIF та TIF. 24-бітове зображення гирла річки Селенга розміром
780×780 пікселів займає 1,46 Мбайт, а стиснене за методом LZW у форматі TIF займає 436 Кбайт проти 479 Кбайт при груповому кодуванні у форматі BMP.
Розглянуті методи не охоплюють всіх відомих схем стиснення зображень.
Особливістю їх є відсутність втрати інформації при стискуванні. Це важливо при зберіганні вихідних даних.
Існують алгоритми стиснення з втратами, наприклад, JPEG (Joint
Photographic Experts Group), розширення jpg. Цей алгоритм використовує ідею, реалізовану в сучасних системах кольорового телебачення (SECAM, PAL,
NTSC) і застосовується у цифрових фотоапаратах та видавничих системах.
Враховується, що людське око дуже чутливе до зміни яскравості зображення, але не помічає колір дрібних його деталей. У телебаченні дані про колір передаються у сильно стислому вигляді так, що кадр чорно-білого і кадр кольорового телевізійного зображення займає однакову смугу частот.
Алгоритм JPEG забезпечує дуже високий коефіцієнт стиснення, але мало придатний для збереження зображень, одержаних під час дослідження Землі з космосу і призначених для подальшої обробки на електронно-обчислювальній машині. Однак, він корисний при створенні рисунків до статей та презентацій.
Зображення гирла річки Селенга, стиснене за методом JPEG, займає всього 65 Кбайт замість 1,46 Мбайт вихідного зображення у форматі TIF.
Під час обробки зображень застосовуються дискретні ортогональні перетворення, зокрема, вейвлет-перетворення, на основі їх використанням розроблені нові швидкі алгоритми стиснення зображень та нові формати, наприклад, JPEG-2000.
Структура графічного файлу
Кожний графічний файл складається з двох основних частин: заголовка та даних. Кольорові зображення містять також таблицю, відповідно до якої елементам зображення присвоюються значення основних кольорів.

47
Заголовок починається з ідентифікатора, який зазначає, в якому форматі записаний файл (TIF, BMP чи GIF), далі містяться загальні відомості про структуру файлу (ширина, висота зображення, чи кольорове, чи стиснене).
Форма подання цих відомостей різна для кожного формату.
Найбільш розвиненим, але і найскладнішим є ТIF-формат (Tag Image
File Format). Кожна серйозна програма обробки зображень може читати і записувати ТIF-файли. У цьому форматі можна зберігати всі види зображень.
Поряд із основною інформацією про зображення (розміри зображення, дані про кольори), у заголовку ТIF-файлу можна записати множину додаткових відомостей про зображення.
Формат файлу, придатний для обміну даними між комп’ютерами різних систем, – це формат Targa (TGA), він не створює ніяких проблем і практично виключає несумісність між програмами, але і цей формат має недолік, який полягає у тому, що дозвіл зображення у файлі, зазвичай, не запам’ятовується.
Формат GIF відомий всім користувачам Інтернету. Метою розробки формату було забезпечити максимальне стиснення відеоданих під час їх запису в пам’ять, щоб зменшити обсяг файлів, мінімізувати витрати на їх завантаження та передачу по каналах зв’язку. Стандартна версія формату GIF обмежується зображеннями з палітрою, що містить максимум 256 кольорів.
Моделі зображень. Каузальні, півкаузальні і некаузальні моделі
Під час моделювання випадкових полів на електронно-обчислювальній машині числа від датчика випадкових чисел перетворюються у числову матрицю, що володіє певними властивостями. Залежно від того, які відліки датчика беруть участь у формуванні поточного значення поля, моделі випадкових полів розділяються на каузальні, півкаузальні і некаузальні.
Основна відмінність між цими моделями обумовлена їх просторовими особливостями, які найчастіше призводять до принципово різних алгоритмів.
Якщо для формування відліку поля (біла точка на рисунку 3.5) з координатами


y
x,
використовується поточний відлік датчика, попередні його відліки, то модель називають каузальною (рис. 3.5) [8], з латинської causa – причина [14].
Іноді під каузальною моделлю розуміють модель, що використовує дані області, геометрія якої визначається растровою розгорткою (рис. 3.6) [8].
Під час роботи в реальному часі, коли відомі лише ці дані, виконується умова причинності.

48
Рисунок 3.5 – Каузальна модель
Рисунок 3.6 – Каузальна модель (растрова розгортка)
Півкаузальний фільтр (рис. 3.7) [8] використовує вхідні дані верхньої півплощини, а некаузальний – дані всієї площини (рис. 3.8) [8].
Рисунок 3.7 – Півкаузальна модель

49
Рисунок 3.8 – Некаузальна модель
Можуть використовуватися не всі дані відповідної області, а лише деяка
їх частина (рис. 3.9) [8], наприклад, зазначена штриховий лінією.
Рисунок 3.9 – Приклади використання моделей

50
Приклад зображення (рис. 3.10), побудованого за каузальною методикою, модель космічного знімку лісу у вигляді сукупності кругів різного діаметру, випадковим чином розміщених на площині, причому круги не перекриваються.
Рисунок 3.10 – Модель космічного знімку лісу
Під час побудови моделі спочатку, за випадковим законом, вибирається центр першого кола в околі лівого верхнього кута, зображується ця окружність.
Далі в її околі випадковим чином ставляться наступні точки – центри інших кіл.
Окружність зображується, якщо виконується умова [8]:



 

2 2
2
j
i
j
i
j
i
y
y
x
x
R
R





,
(3.2) де

 

j
i
j
i
y
y
x
x
,
,
,
– координати центрів найближчих сусідів;
j
i
R
R ,
– радіуси найближчих сусідів,
j
i
За цією схемою поступово, зверху вниз, заповнюється все поле.
У програмному забезпеченні сучасних електронно-обчислювальних машин є алгоритм моделювання випадкових чисел, розподілених рівномірно в
інтервалі від 0 до 1, ці числа є статистично незалежними у досить довгій послідовності.
Математичне очікування таких чисел
5
,
0 1


, дисперсія
12 1
2


, якщо відняти з цих чисел
1

, то отримаємо послідовність, розподілену рівномірно в
інтервалі від мінус 0,5 до 0,5. З послідовності рівномірно розподілених випадкових чисел можна отримати послідовність нормально розподілених випадкових чисел.

51
З теорії ймовірностей відомо, що сума незалежних однаково розподілених випадкових величин має нормальний закон розподілу за умови, що доданки дають рівномірно малий вклад у суму (центральна гранична теорема). Щоб отримати один відлік випадкового числа з нормальним законом розподілу, досить підсумувати 8 чи 10 рівномірно розподілених випадкових чисел, отриманих за описаною методикою, зручніше використовувати 12 чисел, при цьому
12 1
2


Нехай вихідна послідовність чисел
 
i
x з рівномірним законом розподілу має
0 1


та
12 1
2


Враховуючи, що значення цієї реалізації
j
i
x
x ,
при
j
i
статистично незалежні, підсумуємо 12 таких чисел і отримаємо реалізацію
 
k
h
з нормальним законом розподілу, з нульовим середнім і одиничною дисперсією.
Помножимо всі
k
h на постійне число

і додамо до них постійну
1

. Нова реалізація
j
f
матиме задану дисперсію і середнє значення.
Використовуючи випадкові числа
i
x або
k
h , можна моделювати зображення, якщо послідовно, рядок за рядком, присвоювати пікселям ці випадкові значення яскравості. Необхідно враховувати, що яскравість – величина невід’ємна. Якщо її значення
j
f
лежать в інтервалі від 0 до 255, то при нормальному законі розподілу можна припустити, наприклад,
127 1


,
50


, при цьому значення
0

j
f
і
255

j
f
мало вірогідні. Можна задавати великі

, у цих випадках від’ємним
j
f
слід присвоювати нульові значенням, а
255

j
f
присвоювати значення
255

j
f
Отримане таким чином зображення – це сукупність непов’язаних одна з одною точок. Більш реалістичні зображення вдається отримати, якщо використовувати авторегресійну модель.

1   2   3   4   5   6   7   8

скачати

© Усі права захищені
написати до нас