Кодування зображень

виправити

1.Цвет

Людське око складається приблизно з 7 млн. колбочок і 120 млн. паличок. Функція паличок полягає в "нічному зір" - світлочутливості і пристосуванні до навколишнього яскравості. Функція колб - "денний зір" - сприйняття кольору, форми і деталей предмета. У них закладено три типи сприймають елементів, кожне з яких сприймає світлове випромінювання тільки певної довжини хвиль, що відповідають одному з трьох основних кольорів: червоного, зеленого і синього. Інші кольори і відтінки виходять шляхом змішування цих трьох.

Людське око сприймає колірну інформацію у діапазоні хвиль приблизно від 380 нм (синій колір) до 770 нм (червоний колір). Причому найкращу чутливість має в районі 520 нм (зелений колір).

На малюнку показана чутливість ока в залежності від довжини прийому хвилі. Область частот, лівіше синьою - ультрафіолетові хвилі, правіше червоною - інфрачервоні хвилі.

Грассман привів закони природи кольори:

Тривимірність природи кольору. Око реагує на три різних колірних складових. Приклади: червоний, зелений і синій кольори; колірний тон (домінуюча довжина хвилі), насиченість (чистоту) і яскравість (світлість).

Чотири кольору завжди лінійно залежні, тобто , Де . Для суміші двох кольорів і має місце рівність: . Якщо колір дорівнює кольору і колір теж дорівнює кольору , То колір дорівнює кольору незалежно від структури спектрів енергії .

Колірний простір безперервно. Якщо в суміші трьох квітів один безперервно змінюється, а інші залишаються постійними, то колір суміші буде змінюватися безперервно.

Розглянемо основні колірні моделі:

RGB.

Дана модель побудована на основі будови ока. Вона ідеально зручна для світяться поверхонь (монітори, телевізори, кольорові лампи тощо). В основі її лежать три кольори: Red-червоний, Green-зелений та Blue-синій. Ще Ломоносов зауважив, що за допомогою цих трьох основних кольорів можна отримати майже весь видимий спектр. Наприклад, жовтий колір-це складання червоного і зеленого. Тому RGB називають адитивною системою змішування кольорів.

Найчастіше цю модель представляють у вигляді одиничного куба з ортами: (1; 0; 0) - червоний, (0; 1; 0) - зелений, (0, 0, 1) - синій і початком (0, 0, 0) - чорний. На малюнку показаний куб і також розподіл квітів уздовж зазначених векторів.

CMY.

Ця модель застосовується для поверхонь, що відбивають (друкарських і принтерних фарб, плівок і т.п.). Її основні кольори: Cyan-блакитний, Magenta-пурпурний і Yellow-жовтий є додатковими до основного кольору RGB. Додатковий колір - різниця між білим і даними, наприклад, жовтий = білий - синій.

Тому CMY називають субтрактивной системою змішування кольорів. Наприклад, при пропущенні світла пурпурний об'єкт поглинається зелена частина спектра, якщо далі пропустити через жовтий об'єкт, то поглине синя частина спектру і залишиться лише червоний колір. Даний принцип використовують світлофільтри. На верхньому малюнку в колах - основні кольори системи RGB, на перетинах - їх змішання. Аналогічним чином працюють з фарбами художники, формуючи необхідну палітру. На нижньому малюнку в колах - основні кольори CMY, на перетинах - змішання. Зв'язок між RGB і CMY можна виразити через наступну формулу:

Поряд з системою CMY також часто застосовують і її розширення CMYK. Додатковий канал K (від англійського blacK) - чорний. Він застосовується для отримання більш "чистих" відтінків чорного. У кольорових принтерах найчастіше використовується чотири барвника. Ця система широко застосовується в поліграфії.

CIE.

Якщо є один контрольний колір, то за допомогою нього можна отримати деякі кольори, варіюючи даний контрольний по світлин (за умови, що не використовується колірний тон і насиченість). Дана процедура називається фотометрією і використовується при створенні монохроматичних репродукцій кольорових зображень.

За допомогою двох контрольних квітів можна отримати набагато більше квітів, але не всі. Для отримання видимого набору квітів використовують три контрольних кольору, дотримуючись умова, що вони знаходяться в різних областях спектру. Розглянемо наступний базис квітів:

R ed-червоний; лежить в області довгих видимих хвиль (`700 нм).

G reen-зелений; лежить в області середніх видимих хвиль (`546 нм).

B lue-синій; лежить в області середніх коротких хвиль (`436нм).

Розглянемо колір C:

r, g, b-відносні кількості потоків базових квітів, що входять в інтервал [0; 1]. Але даними складанням можна зрівняти не всі кольори. Наприклад, для отримання синьо-зеленого кольору об'єднуємо синій і зелений потоки кольору, але їхня сума виглядає світліше, ніж необхідний. Якщо спробувати зробити його темніше за допомогою червоного, то отримаємо ще більш світлий результуючий колір, оскільки світлові енергії складаються. Тобто ми можемо додавати червоний, для отримання більш світлого зразка. Математично додавання червоного кольору до повчає кольору відповідає вирахуванню його з двох, що залишилися базових потоків (фізично це неможливо, так як негативної інтенсивності світла не існує). Запишемо рівняння наступним чином:

На малюнку показано функції r, g, b рівняння за кольором для монохроматичних потоків кольору з довжинами хвиль 436, 546, 770 нм. З їх допомогою можна зрівняти всі довжини хвиль видимого спектру. На графіку присутня негативна область. Значення в даній області відповідають "додаванню" інструментального кольору до синтезується. Вивченням даних функцій займається колориметрія. Помічено, що один і той же колір можна отримати різними наборами базисних кольорів (r1, g1, b1) і (r2, g2, b2). Тобто колір можна зрівняти різними складовими джерелами з неоднаковим спектральним розподілом. (R1, g1, b1) і (r2, g2, b2) - метамери.

Уявімо колір С як вектор зі складовими rR, gG, bB. Перетин вектора C з одиничною площиною R + G + B = 1 дає відносні ваги його червоною, зеленою і синій складових. Їх також називають значеннями або координатами кольоровості:

Зауважимо, . Розглянемо зв'язок: . Якщо функції зрівнювання за кольором перенести в тривимірний простір, то результат не буде цілком лежати в позитивному Октант.

У 1931 був прийнятий стандарт CIE (Commission International de l'Eclairage - Міжнародна комісія з освітлення), в якості основи якого був обраний двовимірний колірної графік і набір з трьох функцій реакції очі, що виключає негативній області і зручний для обробки. Гіпотетичні кольору CIE - X, Y і Z. Трикутник XYZ задано так, що в нього входить видимий спектр. Координати кольоровості CIE (x, y, z) задаються наступним чином:

і . При проектуванні трикутника XYZ на площину (x, y) отримуємо колірної графік CIE. Координати x і y - відносні кількості трьох основних кольорів XYZ, необхідних для складання потрібного кольору. Яскравість визначається величиною Y, а X і Y підбираються у відповідному масштабі. Таким чином, тріада (x, y, Y) задає колір. Зворотне перетворення має вигляд:

Кодування зображень

Комісія вирішила орієнтувати трикутник XYZ таким чином, що рівні кількості гіпотетичних основних кольорів XYZ давали в сумі білий. На малюнку зображено колірної графік. Область на графіку - видиме безліч квітів. На контурі проставлені значення відповідних довжин хвиль в нм, відповідні чистим, не розбавленим квітам. У центрі області знаходиться опорний білий колір - точка рівних енергій, з координатами x = y = 0.33 (3). Часто застосовують такі джерела CIE:

Назва	Температура	x	y
Лампа з вольфрамової ниткою розжарювання.	2856К	0.448	0.408
Сонячне світло опівдні.	5600К	0.349	0.352
Полуденне освітлення при суцільній хмарності.	6300К	0.310	0.316
Опорний білий стандарт для моніторів і NTSC.	6400К	0.313	0.329

Система (x, y, Y) підпорядковується законам Грассмана. На малюнку показана кольорова область графіка CIE. Як видно, найбільшу площу займають кольору з переважанням зеленого, що узгоджується з чутливою вибірковістю людського ока.

На колірному графіку CIE зручно демонструвати колірної охоплення різних систем і устаткування: телебачення, типографського друку, фотоплівок і т.п. Колірний обхват для адитивних систем - трикутник з вершинами, відповідними основним квітам RGB. Колір, який можна отримати в даній колірній моделі лежить всередині трикутника, кольори, що лежать поза - отримати неможливо. Приклади колірних обхватів для деяких моделей можна побачити на малюнку. Зауважимо, що для кольорової плівки обхват є криволінійний трикутник. Причина цього полягає в нелінійному (в даному випадку логарифмічному) законі створення кольорового зображення за допомогою кольорової плівки. Нижче наведена таблиця основних кольорів моделей в координатах колірного графіка CIE:

Модель

Колір

CIE XYZ.

Червоний

Зелений

Синій

0.735

0.274

0.167

0.265

0.717

0.009

Стандарт NTSC.

Червоний

Зелений

Синій

0.670

0.210

0.140

0.330

0.710

0.080

Кольоровий монітор.

Червоний

Зелений

Синій

0.628

0.268

0.150

0.346

0.588

0.070

Координати кольоровості CIE представляють точний стандарт визначення кольору. Координати кольоровості CIE корисні при передачі інформації кольорів з однієї колірної моделі в іншу. Тому необхідно знати перетворення координат CIE в інші колірні моделі, а також і назад. Наприклад, перетворення RGB - CIE XYZ задається наступною формулою:

Кодування зображень , Де - Кольори для отримання координати одиничного основного кольору R, аналогічно і для G і B. Якщо відомі координати кольоровості CIE x і y для основних кольорів RGB, то:

Кодування зображень , Де:

- Дані величини необхідні для повного перетворення між системами основних кольорів, також можна отримати і в такий спосіб:

Відомі - Яскравості одиничних кількостей основних кольорів:

Кодування зображень .

Відомий - Координати кольоровості опорного білого і його яскравість:

Кодування зображень

Зворотне перетворення CIE XYZ в RGB задається як:

, Де c елементами:

Кодування зображень

YIQ.

Для кольорового телебачення стандарту NTSC було пред'явлено дві основні вимоги:

Бути в межах встановленого діапазону в 6 МГц,

Забезпечувати сумісність із чорно-білим телебаченням.

У 1953 була розроблена система YIQ:

Канал	Назва	Займаний діапазон
Y	яскравість	4 МГц
I	синфазний	1.4 МГц
Q	інтегрований	0.6 МГц

У каналі Y яскравість підібрана так, що вона відповідає колірній чутливості ока. Канал Y відповідає кольорам від блакитного до помаранчевого (теплим тонам). Канал Q - від зеленого до пурпурного. В якості опорного білого був узятий джерело з температурою 6500К. Перетворення між колірними системами RGB і YIQ:

RGB в YIQ:

Кодування зображень

YIQ в RGB:

Кодування зображень

Крім YIQ зустрічаються й інші колірні моделі у форматі Яскравість, 1-ий колірний канал, 2-ий колірний канал. Наприклад, при колірної корекції використовують формат LAB, в якому:

L (ightness) - яскравість,

A-колірний канал несе кольори від зеленого до червоного,

колірний канал, що відповідає за кольору в синьо-жовтому діапазоні.

HLS і HSB

Розглянемо інший підхід при описі кольору. У кольорі можна виділити його тон - переважаючий основний колір (довжину хвилі, що переважає у випромінюванні). Також розглянемо насиченість кольору - чим вона більше, тим "чистіше" колір (тобто ближче до тонової хвилі), наприклад, у білого кольору - насиченість = 0, так як неможливо виділити його колірної тон. Введемо, нарешті, для завершення яскравість (у чорного кольору = 0, у білого = 1). Таким чином, ми побудували тривимірне колірний простір HSV - Hue, Saturation, Volume (Тон, Насиченість і Яскравість). Зазвичай його представляють у вигляді конуса, зображеного на малюнку. Початок координат - вершина конуса - чорний колір. Висота, спрямована до основи - яскравість. Точка перетину висоти з основою - білий колір. На висоті знаходяться відтінки сірого кольору від чорного (вершина конуса) до білого. На колі, що обмежує підставу конуса, перебувають чисті колірні тони: від червоного ( ), Через зелений ( ), До синього ( ). Радіус конуса - насиченість кольору. З такою системою працюють художники, змінюючи насиченість за допомогою білої фарби, його відтінок за допомогою чорної і тон, комбінуючи з основними квітами. HSV часто представляють і у вигляді шестигранного конуса, у якого в основі лежить правильний шестикутник з вершинами, що відповідають наступним кольорами: червоний - жовтий - зелений - блакитний - синій - пурпуровий.

Наведемо формули зв'язку RGB і HSV, представленого у вигляді шестигранного конуса: HSV в RGB:

Кодування зображень

RGB в HSV:

Кодування зображень

RGB в HLS:

Кодування зображень

HLS в RGB:

Кодування зображень

Приклад перекладу RGB в HSB. У даному форматі RGB має на кожну з компонент R, G, B по 8 біт (256 рівнів градації) - True Color. HSB представлений трьома площинами, відповідними H, S, B, у вигляді чорно / білих зображень з 256 рівнями градації сірого.

Канали: Н - тон, S - насиченість, B - яскравість.

Деякі примітки до колірних моделях

При колірних перетвореннях необхідно також пам'ятати, що між кольоровими моделями CIE, CMY, RGB, YIQ існують аффінниє перетворення, тоді, як між HLS і HSV-ні. Дана обставина буде помітно, якщо зображення, що містить безперервні колірні переходи, перекладати, наприклад, з HLS в RGB (на зображеннях може з'явитися розрив безперервності).

2.Общая схема цифрової обробки зображень

Розглянемо процес обробки зображень у вигляді такої послідовності:

Отримання початкового, "сирого" зображення.

Фільтрація зображення.

Переклад зображення в необхідну колірну модель.

Форматування та індексування зображення.

Розбивка на блоки.

Обробка графічної інформації, що міститься в блоках.

Послідовне стиснення.

Ентропійне стиснення.

Цей поділ не претендує на повноту, але дає загальну картину процесу обробки. Деякі етапи, наприклад, 5, 7 або 8 можна пропустити. Перед кожним етапом, можливо, буде необхідна спеціальна фільтрація. Етап 3 ми розглянули у попередній частині. Інші етапи ми будемо розглядати не по порядку проходження, а за зростанням складності, щоб якомога рідше посилатися на матеріал наступних розділів.

Отримання початкового, "сирого" зображення.

Зображення для обробки умовно можна розбити на чотири класи:

Природні, отримані шляхом сканування, захоплення тілі або відео кадру, зйомкою цифровою апаратурою.

Зображення, намальовані з використанням графічного редактора на комп'ютері, назвемо їх комп'ютерними малюнками.

Тривимірні сцени, синтезовані за допомогою спеціальних програм, таких як: CAD'и (AutoCAD, ArchiCAD ...), 3D генератори (3D Studio, LightWave ...) і т.п.

Зображення - візуалізація даних, отриманих як результат деякого експерименту, досвіду, вимірів (енцефалограма, сейсмографічний карта ...).

Природничі зображення мають некомп'ютерні походження. У них майже немає різких колірних переходів. Комп'ютерні малюнки, як в іншому і будь-які інші, поділяються на два типи: растрові і векторні. У першому зображення зберігається як прямокутна матриця з елементами, що характеризують колірні складові. У векторних зображення - послідовність команд для його побудови. Приклад команди - коло з центром в точці (100,100) і радіусом 50, текстурований матеріалом під дерево. Перевага растрових - простота відтворення і реалістичність, недолік - великий обіймав обсяг, проблеми з масштабуванням. У векторних навпаки, перевага - невеликий обіймав обсяг, легкість масштабування, недолік - необхідність попередньої обробки перед відтворенням і труднощі створення реалістичних зображень. Тривимірні сцени винесені в окремий клас, так як в процесі їх створення (наприклад, прямої або зворотної трасуванням променя, методом излучательности) можна отримати додаткові дані (характеристики прямого та дифузного відбиття світла, заломлення ... об'єктів сцени) і використовувати їх при подальшій обробці . Зображення, як результат досвіду і т.п. необхідно обробити, з метою виявити його особливі характеристики, наприклад, виділити частину зображення що лежить в заданому спектрі і т.п. Надалі ми будемо розглядати в основному растрові зображення.

Форматування та індексування зображення.

У даному розділі будемо розглядати зображення як прямокутну матрицю A = {ai, j} з N стовпцями і M рядками, де N - ширина зображення в пікселях, M - висота зображення в пікселях. Розглянемо основні формати, які застосовуються в комп'ютерній обробці зображень:

Чорно-білий. Кожен елемент матриці представлений одним бітом. Якщо він дорівнює одиниці, то він ототожнюється з чорним кольором, якщо дорівнює нулю - з білим. Це самий простий формат, він застосовується при друку газет, розпізнаванні текстів і підписів.

Grayscale (градації сірого). Відмінність даного формату від попереднього в тому, що для кожного елемента матриці відводиться 8 бітів (байт). Це дозволить нам використовувати 28 = 256 рівнів сірого кольору. Якщо ai, j = 0, то маємо білий колір, зі зростанням до 255 ми будемо втрачати яскравість і при ai, j = 255 отримаємо чорний колір. У проміжку від 0 до 255 будуть розташовуватися сірі кольори за правилом: чим ближче значення до 255, тим чорніше буде сірий. Даний формат дозволяє отримувати досить якісні чорно-білі зображення. Значення ai, j містять зворотний яскравість, тобто значення (1 - L) * 255, де L - яскравість, яка може бути отримана, наприклад з RGB кольорових зображень за формулою: