1   2   3   4   5   6   7   8
Ім'я файлу: 2017 печ 32Л _конспект лекцій_ЦОЗ_4 курс_Творошенко.pdf
Розширення: pdf
Розмір: 1701кб.
Дата: 07.01.2022
скачати
1.2 Технічні засоби обробки зображень
План
1. Введення зображень за допомогою настільного сканера.
2. Сучасні монітори.
3. Струменевий і лазерний принтери.
4. Залежність дозволу при друку від числа градацій яскравості.
5. Нейрокомп’ютери в обробці зображень.
6. Метод головних компонентів.
Введення зображень за допомогою настільного сканера
У датчиках зображень – сканерах авіаційного та космічного базування, телевізійних камерах, настільних сканерах, у цифрових фотоапаратах спосіб подання зображення називається растровою графікою. Дані датчики дозволяють отримувати напівтонові і кольорові зображення в аналоговій формі.
Для введення в електронно-обчислювальну машину зображення необхідно перетворити в деяку числову матрицю. Процес перетворення називається дискретизацією і складається з вибірки і квантування.
Вибірка полягає у виборі на полі спостереження деякої множини точок, у кожній з яких вимірюється величина яскравості


y
x
f
,
Під час використання електронно-обчислювальної машини для обробки зображень нерідко застосовується формат 512 × 512, згадана множина точок складається з 512⋅512 = 262 144 пікселів.
Вибірка проводиться з деяким кроком, який і характеризує просторовий дозвіл. Під час використання сканерів космічного базування дозвіл, зазвичай, визначається швидкістю супутника і частотою сканування.
У даний час пристроєм введення зображень в електронно-обчислювальну машину з плоских оригіналів є планшетний сканер (Desk Scanner), він застосовується для введення топографічних карт [2].
Типовий планшетний сканер містить джерело світла, систему дзеркал, одне з них разом з лампою переміщається за допомогою крокового двигуна уздовж сканованого зображення (рис. 1.6).
Для квантування і перетворення


y
x
f
,
в числовий код у пристроях введення використовується аналого-цифровий перетворювач.

23
Рисунок 1.6 – Типовий планшетний сканер
Оскільки людське око не в змозі розрізняти рівні освітленості, що відрізняються один від одного менше, ніж на 1% чи 2%, для якісного подання півтонування цілком достатньо мати 256 рівнів квантування, тобто по 1 байту на піксель. Ця величина характеризує тоновий дозвіл.
Під час дискретизації кольорового зображеннявитрачають по 1 байту на кожен із трьох основних кольорів, тобто 3 байта на піксель (24-бітове кодування, 24-бітна глибина кольору).
Чорно-білі сканери реєструють не менше 256 градацій сірого, кольорові – не менше 256 градацій кожного з трьох основних кольорів, тобто не менше
16700000 відтінків. У деяких системах, наприклад в сканерах космічного базування, число рівнів квантування вибирається, виходячи з конкретного завдання. До числа пристроїв, спеціально призначених для введення зображень в електронно-обчислювальну машину, відносяться цифрові фото-і відеокамери.
Типова цифрова фотокамера містить аналого-цифровий перетворювач матрицю з роздільною здатністю не менше 5 мегапікселів та процесор, зображення у цифровій формі записується на напівпровідникову пам’ять.
До електронно-обчислювальної машини зображення вводиться або через кабель, або через безконтактний пристрій введення, або через флеш-карту.
За якістю зображення тверді копії невеликого формату, отримані за допомогою цифрової камери, не поступаються звичайній фотографії розміром 9×13см, однак, 35-міліметрові фотонегативи допускають 10-кратне збільшення без істотної втрати якості. На збільшеному в 3 або 4 рази зображенні з цифрової камери проглядається піксельна структура.

24
Сучасні монітори
Для візуалізації зображень використовуються кольорові монітори на електронно-променевих трубках, рідкокристалічних плазмових дисплеях.
Рідкокристалічні дисплеї менше стомлюють зір, ніж електронно-променеві. Рідкокристалічний дисплей має дві тонкі пластини з кварцового скла, на внутрішній стороні яких нанесені матриці з електродів, кожна чарунка відповідає одному пікселю.
Наприклад, монітори формату 1024×768 містять 1024 елемента по горизонталі і 768 по вертикалі. Якщо користувач побажає перевести цей монітор у режим 640×480, то зображення буде виводитися на середину екрану, а по краях залишатимуться темні поля.
Можливе застосування інтерполяції, тоді зображення займає весь екран, проте воно буде виглядати не дуже якісним, наприклад, літери можуть мати не плавні обриси, а ступінчасті. Рідкокристалічні монітори дають більш бляклі кольори, ніж електронно-променеві.
Плазмові екрани поєднують технології електронно-променевих трубок і рідкокристалічних екранів, вони складаються з окремих чарунків, у яких знаходиться інертний газ при низькому тиску, а на стінку, повернену до глядача, нанесено люмінофор.
Для професійної обробки зображень використання рідкокристалічних моніторів небажано.
Струменевий і лазерний принтери
Тверді копії отримують за допомогою принтерів і плотерів.
Матричні принтери мало придатні для виведення зображень.
Струменеві принтери забезпечують значно кращу якість при тій же ціні, що і матричні.
Сучасні струменеві принтери друкують від 2 до 10 сторінок формату А4 за хвилину з роздільною здатністю до 1400 точок на дюйм. Деякі струменеві принтери реалізують таку ж якість зображень, яка досягається на кольорових фотографіях невеликого розміру. Практично всі струменеві принтери дозволяють друкувати кольорові зображення.
Більш досконалі лазерні принтери.
Спеціальний світлочутливий барабан заряджають статичною електрикою, через барабан «прокочується» аркуш паперу, тонер переходить на папір і закріплюється нагріванням.
Лазерні принтери можуть забезпечувати більш високий дозвіл, ніж струменеві.

25
Залежність дозволу під час друку від числа градацій яскравості
Зазначений вище дозвіл реалізується під час друку не напівтонових, а бінарних зображень, до числа яких можна віднести літери тексту, чорні лінії на білому фоні. Для друку напівтонових зображень, як правило, доводиться
імітувати півтони за допомогою створення растру. Растр півтонування може друкуватися у вигляді чарунків 8×8 пікселів. Залежно від заповнення чарунку точками чорного кольору можна імітувати 64 градації півтонів. Незаповнений чарунок має білий колір, заповнений 8 точками, що імітує 12%-й рівень почорніння, заповнений 32 точками – 50%-й рівень.
Отже, при друці зображень дозволи принтера по півтонам та за елементами залежать один від одного. Якщо дозвіл принтера складає 600 точок на дюйм, то імітують 64 півтони, маємо 600 / 8 = 75 чарунків на дюйм.
Кращого результату можна досягти, якщо відмовитися від строгої відповідності між напівтоновими чарунками та друкованими точками, тобто використовувати так званий дифузійний метод друку.
Нейрокомп’ютери в обробці зображень
У 90-х роках було розроблено нейромережеві модулі обробки інформації, що дають можливість поліпшити характеристики систем розпізнавання образів
і систем пошуку інформації у відповідності з інтересами користувача. Створено також апаратні засоби підтримки нейромережних модулів – нейрокомп’ютери.
Розроблені нейромережеві модулі використані для створення системи пошуку інформації, яка самостійно будує модель інтересів користувача і з поточної інформації вибирає таку, що найбільше його цікавить. Модулі, що містять нейромережеві класифікатори, були використані для створення систем розпізнавання рукописних слів.
Відбувається нове підвищення складності об’єктів обробки інформації, з якими людина може лише шляхом підвищення рівня інтелектуалізації технічних засобів. Це спричиняє необхідність розвитку таких кібернетичних понять, як самоорганізація, самокерування, розумна, адаптивна поведінка, самовдосконалювальні та генераційні системи. Дедалі більшого значення набувають методи та інструментарій системного аналізу.
Метод головних компонентів
До недавнього часу метод головних компонент вважали різновидом факторного аналізу. Сьогодні даний метод відносять до групи самостійних статистико-математичних методів багатомірного аналізу. Виникла необхідність у стисненні інформації, тобто описати досліджуване явище (об’єкт) більш укрупненими показниками, так званими «головними компонентами».

26
Вихідним ступенем тут є кореляційна матриця, на підставі якої з використанням методу головних компонент може бути продовжено аналіз значень спостережуваних ознак. Правильно відібрані у кореляційну модель ознаки пов’язані між собою. Наявність таких зв’язків між ними дозволяє на основі одного фактора мати інформацію про інший. Існування тісного зв’язку між ознаками дає підставу для виключення однієї з них. Ідея обліку однієї ознаки на підставі другої лежить в основі методу головних компонент.
З двома ознаками метод головних компонент малоефективний. Його використовують, як правило, при десятках взаємопов’язаних ознак, ставиться мета «набрати» певну частину загальної варіації результативної ознаки мінімальною кількістю змінних, які підбирають до тих пір, поки сума їх дисперсій не досягне заданої частки у дисперсії досліджуваного явища.
Метод головних компонентів розв’язує такі завдання:
– відшкодування скритих закономірностей у зміні явищ;
– характеристика явища, що вивчається. Число головних компонентів, виділених у процесі дослідження, буде вміщувати у компактній формі більше
інформації, ніж початково-виміряні ознаки;
– виявлення ознак, найбільш тісно пов’язаних з головною компонентою.
Інакше кажучи, вивчення стохастичного зв’язку між ними (зв’язок, при якому зі зміною однієї змінної змінюється закон розподілу другої);
– прогнозування рівнів досліджуваних явищ на підставі рівняння регресії, яке одержане по інформації головних компонентів.
Переваги такого методу прогнозування на відміну від класичного регресійного аналізу можна пояснити тим, що в модель намагаються включити максимально можливу кількість факторів, які в економічних явищах часто характеризуються істотною корельованістю (мультилінеарністю). Прогноз за такими змінними, як правило, буває не точним. Тому виникає завдання про заміну вихідних взаємопов’язаних змінних сукупністю некорельованих параметрів. Це завдання вирішується математичним апаратом – методом головних компонентів, який є характеристиками, що побудовані на підставі первинно виміряних ознак.
Недоліком методу головних компонентів слід назвати складність математичного апарату, зумовлену абсолютністю знань теорії ймовірностей, математичної статистики, лінійної алгебри, а також математичного забезпечення електронно-обчислювальної машини. Формальне використання стандартних програм без розуміння математичної суті обчислювальних процедур може призвести до необґрунтованих висновків.

27
2 МЕТОДИ КЛАСИФІКАЦІЇ ЦИФРОВИХ ЗОБРАЖЕНЬ
2.1 Параметричні та непараметричні методи класифікації
цифрових зображень
План
1. Роль нормального розподілу в задачах класифікації.
2. Метод максимальної правдоподібності.
3. Метод мінімальних відстаней.
4. Метод паралелепіпедів.
5. Особливості непараметричних методів класифікації.
6. Робастні алгоритми.
7. Рангова статистика.
8. Двовибірний алгоритм Вілкоксона.
9. Декореляції фону.
Роль нормального розподілу в задачах класифікації
Під час дистанційного зондування яскравість кожного пікселя складається з яскравостей природних об’єктів, що потрапили під миттєве поле зору сканера. Об’єкти випадковим чином відображають і розсіюють сонячне випромінювання, так що яскравість пікселя є сумою випадкових величин.
З теорії ймовірностей відомо, що сума незалежних, однаково розподілених випадкових величин має нормальний (гаусівський) закон розподілу (центральна гранична теорема).
Таким чином, є підстави вважати, що для природних об’єктів яскравість пікселів може підпорядковуватися нормальному закону розподілу.
Названа вище причина не єдина, за якою у задачах параметричного розпізнавання зображень широко використовується гіпотеза про нормальний закон розподілу яскравості пікселів.
Під час розпізнавання монохроматичних зображень для розподілу яскравості майже завжди вдається підібрати один з відомих одновимірних законів (нормальний, біноміальний, експонентний, пуасонівський).
Інша справа – зображення, одержані за допомогою сканерів, що мають n- спектральних каналів,
1

n
. У цьому випадку для опису статистичних характеристик потрібно n-мірний спільний розподіл величин яскравості в каналах.

28 n-мірна нормальна функція щільності ймовірностей яскравості має вигляд
 
 




2 1
exp
2 1
2 1
2


















ij
T
ij
n
ij
n
f
R
f
R
f
w
(2.1)
У (2.1) вектор даних, що характеризує яскравість


j
i,
-го пікселя у всіх n-спектральних каналах, позначений через
ij
f
, вектор математичного очікування – через

, кореляційна матриця – через R ,
R
– визначник кореляційної матриці,
1

R
– матриця, обернена до R , символ


T
ij
f


означає транспонування вектора [8].
nij
ij
ij
ij
f
f
f
f


2 1

,
m






2 1

,
nn
n
n
n
n
R
R
R
R
R
R
R
R
R
R
















2 1
2 22 21 1
12 11

(2.2)
Компоненти вектора
nij
ij
ij
ij
f
f
f
f
,
,
,
:
2 1

– яскравість пікселя у першому, другому та інших каналах. Компоненти вектора
n




,
,
,
:
2 1

– математичне очікування яскравості пікселя для першого, другого та інших каналів.
На головній діагоналі кореляційної матриці (2.2) на перетині n-го рядка та
n-го стовпця стоїть величина
2
p
nn
R


, що показує значення дисперсії яскравості пікселів у n-му каналі (характеристика контрасту).
sn
ns
R
R

– це коефіцієнт кореляції значень яскравості пікселів у n-му та s-му каналах.
Методи класифікації, засновані на нормальному законі розподілу, задовільно працюють навіть при помітних відхиленнях від нормальності.
Нехай супутникове сканерне зображення земної поверхні, що отримане в
n-спектральних каналах, є сукупністю пікселів, яскравість


j
i,
-го пікселя описується вектором
ij
f
з n компонентів. Потрібно віднести цей піксель до одного з М класів. Попередньо створюється навчальна вибірка – супутникове зображення, на якому по наземним даним визначені ділянки, що відповідають різним класам. Користувач вказує межі цих класів, відбувається процес навчання, тобто комп’ютер оцінює вектор математичного очікування і кореляційну матрицю для кожного із класів.

29
Далі проводиться обробка даного супутникового зображення. Комп’ютер для кожного класифікованого пікселя визначає вектор вимірювань
ij
f
і в кожному k класі формує умовні щільності ймовірностей








k
ij
C
f
w
Для цього у багатовимірний нормальний закон розподілу (2.1) підставляються
k

і
k
R – задані умови, тобто у даному випадку оцінки вектора математичного очікування і кореляційної матриці еталонного об’єкта «k».
Таким чином, для кожного пікселя формується М умовних щільностей ймовірностей, які порівнюються з деяким порогом
kl
Q . Порівняння дозволяє визначити, яка з гіпотез найбільш правдоподібна.
Відношення правдоподібності
kl
L для класів k та l має вигляд [8]:
















































l
ij
l
T
l
ij
l
k
ij
k
T
k
ij
k
l
ij
k
ij
kl
f
R
f
R
f
R
f
R
C
f
w
C
f
w
L




1 2
1 1
2 1
2 1
exp
2 1
exp
(2.3)
Замість відношення правдоподібності
kl
L можна використати будь-яку монотонну функцію від нього, наприклад, натуральний логарифм
kl
L
ln
:












l
ij
l
T
l
ij
k
ij
k
T
k
ij
k
l
kl
f
R
f
f
R
f
R
R
L













1 1
2 1
2 1
ln
2 1
ln
. (2.4)
У цьому випадку величина
kl
L
ln порівнюється з порогом
kl
kl
Q
q
ln

Перший член
k
l
R
R
ln
2 1
і множник
2 1
у виразі для
kl
L
ln можуть бути включені до порогу
kl
q . Таким чином, завдання з’ясування, до k-го або l-го класу відноситься


j
i,
-й піксель, зводиться до порівняння квадратичних форм:






k
ij
k
T
k
ij
f
R
f
A





1
,






l
ij
l
T
l
ij
f
R
f
B





1
(2.5)
Нерідко вважають, що
0

kl
q
. У цьому випадку вважається, що


j
i,
-й піксель відноситься до k-го класу, якщо квадратична форма
B
A
, тобто коли компоненти вектора
ij
f
тісніше групуються навколо
k


30
Квадратична форма






k
ij
k
T
k
ij
f
R
f




1
характеризує відстань класифікованого пікселя з вектором яскравості
ij
f
, вона часто застосовується у задачах розпізнавання зображень. У випадку, коли вектор яскравості пікселя
ij
f
складається з двох компонент, тобто для двох спектральних каналів, квадратична форма має вигляд (2.6).

























k
k
k
ij
k
ij
k
k
k
ij
k
k
ij
k
k
f
f
f
f
P
2 1
2 2
1 1
12 2
2 2
2 2
2 1
2 1
1 2
12 2
1 1










, (2.6) де
k
k
k
k
R
2 1
12 12




– нормований коефіцієнт кореляції двох спектральних каналів для об’єкта «k» еталонного зображення.

1   2   3   4   5   6   7   8

скачати

© Усі права захищені
написати до нас