Нейромережеві методи розпізнавання зображень

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Виконано огляд нейромережевих методів, використовуваних при розпізнаванні зображень. Нейромережеві методи - це методи, що базуються на застосуванні різних типів нейронних мереж (НС). Основні напрямки застосування різних НС для розпізнавання образів та зображень:

застосування для вилучення ключових характеристик або ознак заданих образів, класифікація самих образів чи вже витягнутих з них характеристик (у першому випадку витяг ключових характеристик відбувається неявно всередині мережі), рішення оптимізаційних завдань.

Архітектура штучних НС має деяку схожість з природними нейронними мережами. НС, призначені для вирішення різних завдань, можуть істотно різнитися алгоритмами функціонування, але не мають спеціальної математичної наступні [1-3].

НС складається з елементів, званих формальними нейронами, які самі по собі дуже прості і пов'язані з іншими нейронами. Кожен нейрон перетворює набір сигналів, що надходять до нього на вхід у вихідний сигнал. Саме зв'язку між нейронами, які кодуються вагами, грають ключову роль. Одна з переваг НС (а також брак при реалізації їх на послідовній архітектурі) це те, що всі елементи можуть функціонувати паралельно, тим самим істотно підвищуючи ефективність виконання завдання, особливо в обробці зображень. Крім того, що НС дозволяють ефективно вирішувати багато завдань, вони надають потужні гнучкі і універсальні механізми навчання, що є їх головною перевагою перед іншими методами [4,5] (імовірнісні методи, лінійні роздільники, вирішальні дерева і т.п.). Навчання позбавляє від необхідності вибирати ключові ознаки, їх значимість і відносини між ознаками. Але тим не менше вибір початкового представлення вхідних даних (вектор в n-мірному просторі, частотні характеристики, вейвлет і т.п.), істотно впливає на якість рішення і є окремою темою. НС мають гарну узагальнюючої здатністю (краще ніж у вирішальних дерев [5]), тобто можуть успішно поширювати досвід, отриманий на кінцевому навчальному наборі, на всі безліч образів.

Опишемо застосування НС для розпізнавання зображень, відзначаючи можливості застосування для розпізнавання людини по зображенню особи.

1. Багатошарові нейронні мережі

Архітектура багатошарової нейронної мережі (МНС) складається з послідовно сполучених шарів, де нейрон кожного шару своїми входами пов'язаний з усіма нейронами попереднього шару, а виходами - наступного. НС з двома вирішальними шарами може з будь-якою точністю апроксимувати будь-яку багатовимірну функцію. НС з одним вирішальним шаром здатна формувати лінійні розділяють поверхні, що сильно звужує коло завдань які вони вирішують, зокрема така мережа не зможе вирішити завдання типу "виключає або". НС з нелінійною функцією активації та двома вирішальними шарами дозволяє формувати будь-які опуклі області в просторі рішень, а з трьома вирішальними шарами - області будь-якої складності, в тому числі і неопуклих. При цьому МНС не втрачає своєї узагальнюючої здатності. Навчаються МНС за допомогою алгоритму зворотного поширення помилки, що є методом градієнтного спуску в просторі ваг з метою мінімізації сумарної помилки мережі. При цьому помилки (точніше величини корекції ваг) розповсюджується в зворотному напрямку від входів до виходів, крізь ваги, з'єднують нейрони.

Найпростіше застосування одношарової НС [6] (званої автоасоціативною пам'яттю) полягає в навчанні мережі відновлювати подаються зображення. Подаючи на вхід тестове зображення і обчислюючи якість реконструйованого зображення, можна оцінити наскільки мережа розпізнала вхідне зображення. Позитивні властивості цього методу полягають в тому, що мережа може відновлювати перекручені та зашумлені зображення, але для більш серйозних цілей він не підходить.

Рис. 1. Багатошарова нейронна мережа для класифікації зображень. Нейрон з максимальною активністю (тут перший) вказує приналежність до розпізнаної класу.

МНС так само використовується для безпосередньої класифікації зображень - на вхід подається або саме зображення в будь-якому вигляді, або набір раніше витягнутих ключових характеристик зображення, на виході нейрон з максимальною активністю вказує приналежність до розпізнаної класу (рис. 1). Якщо ця активність нижче деякого порога, то вважається, що поданий образ не відноситься ні до одного з відомих класів. Процес навчання встановлює відповідність поданих на вхід образів з належністю до певного класу. Це називається навчанням з учителем. У застосуванні до розпізнавання людини по зображенню особи, такий підхід хороший для завдань контролю доступу невеликої групи осіб. Такий підхід забезпечує безпосереднє порівняння мережею самих образів, але із збільшенням числа класів час навчання і роботи мережі зростає експоненціально. Тому для таких завдань, як пошук схожої людини у великій базі даних, вимагає вилучення компактного набору ключових характеристик, на основі яких можна робити пошук.

Підхід до класифікації з використанням частотних характеристик всього зображення, описаний в [7]. Застосовувалася одношарова НС, заснована на багатозначних нейронах. Відзначено 100% розпізнавання на базі даних MIT, але при цьому здійснювалося розпізнавання серед зображень, яким мережа була навчена.

Застосування МНС для класифікації зображень облич на основі таких характеристик, як відстані між деякими специфічними частинами обличчя (ніс, рот, очі), описано в [8]. У цьому випадку на вхід НС подавалися ці відстані. Використовувалися також гібридні методи - у першому на вхід НС подавалися результати обробки прихованої марковської моделлю, а в другому - результат роботи НС подавався на вхід марковської моделі. У другому випадку переваг не спостерігалося, що говорить про те, що результат класифікації НС достатній.

У [9] показано застосування НС для класифікації зображень, коли на вхід мережі надходять результати декомпозиції зображення за методом головних компонент.

У класичній МНС міжшарові нейронні з'єднання повнозв'язних, і зображення представлене у вигляді одновимірного вектора, хоча воно двовимірний. Архітектура сверточное НС [10] спрямована на подолання цих недоліків. У ній використовувалися локальні рецепторні поля (забезпечують локальну двовимірну зв'язність нейронів), загальні ваги (забезпечують детектування деяких рис у будь-якому місці зображення) та ієрархічна організація з просторовими підвибірки (spatial subsampling). Сверточних НС (СНР) забезпечує часткову стійкість до змін масштабу, зсувам, поворотів, спотворень. Архітектура СНС складається з багатьох шарів, кожен з яких має кілька площин, причому нейрони наступного шару пов'язані тільки з невеликим числом нейронів попереднього шару з околиці локальної області (як в зоровій корі людини). Ваги в кожній точці одній площині однакові (сверточних шару). За сверточних шаром слід шар, що зменшує його розмірність шляхом локального усереднення. Потім знову сверточних шар, і так далі. Таким чином, досягається ієрархічна організація. Пізніші шари витягають більш загальні характеристики, менше залежать від спотворень зображення. Навчається СНС стандартним методом зворотного розповсюдження помилки. Порівняння МНС і СНС [10] показало суттєві переваги останньої як за швидкістю, так і по надійності класифікації. Корисною властивістю СНР є і те, що характеристики, які формуються на виходах верхніх шарів ієрархії, можуть бути застосовні для класифікації за методом найближчого сусіда (наприклад, обчислюючи евклідова відстань), причому СНС може успішно використовувати такі характеристики і для образів, відсутніх в навчальному наборі. Для СНС характерні швидка швидкість навчання і роботи. Тестуванні СНС на базі даних ORL, яка містить зображення осіб з незначними змінами освітлення, масштабу, просторових поворотів, положення і різними емоціями, показало приблизно 98% точність розпізнавання, причому для відомих осіб, пред'являлися варіанти їх зображень, відсутні в навчальному наборі. Такий результат робить цю архітектуру перспективною для подальших розробок у галузі розпізнавання зображень просторових об'єктів.

МНС застосовуються і для виявлення об'єктів певного типу. Крім того, що будь-яка навчена МНС в деякій мірі може визначати приналежність образів до "своїх" класам, її можна спеціально навчити надійному детектування певних класів. У цьому випадку вихідними класами буде класи належать і не належать до заданого типу образів. В [11] застосовувався нейромережевої детектор для виявлення зображення обличчя у вхідному зображенні. Зображення сканувалися вікном 20х20 пікселів, яке подавалося на вхід мережі, вирішальною чи належить дана ділянка до класу осіб. Навчання проводилося як з використанням позитивних прикладів (різних зображень осіб), так і негативних (зображень, які не є особами). Для підвищення надійності детектування використовувався колектив НС, навчених з різними початковими вагами, внаслідок чого НС помилялися по різному, а остаточне рішення ухвалювалося голосуванням усього колективу.

Рис. 2. Головні компоненти (власні особи) і розкладання зображення на головні компоненти.

НС застосовується також для витягання ключових характеристик зображення, які потім використовуються для подальшої класифікації. В [1,6], показаний спосіб нейромережевої реалізації методу аналізу головних компонент. Суть методу аналізу головних компонент полягає в отриманні максимально декореллірованних коефіцієнтів, що характеризують вхідні образи. Ці коефіцієнти називаються головними компонентами і використовуються для статистичного стиснення зображень, в якому невелике число коефіцієнтів використовується для представлення всього образу. НС з одним прихованим шаром містить N нейронів (яке багато менше ніж розмірність зображення), навчена за методом зворотного розповсюдження помилки відновлювати на виході зображення, подане на вхід, формує на виході прихованих нейронів коефіцієнти перших N головних компонент, які і використовуються для порівняння. Зазвичай використовується від 10 до 200 головних компонент. Зі збільшенням номера компоненти її репрезентативність сильно знижується, і використовувати компоненти з великими номерами не має сенсу. При використанні нелінійних активаційних функцій нейронних елементів можлива нелінійна декомпозиція на головні компоненти. Нелінійність дозволяє більш точно відобразити варіації вхідних даних. Застосовуючи аналіз головних компонент до декомпозиції зображень облич, отримаємо головні компоненти, звані власними особами (holons в роботі [6]), яким так само притаманне корисна властивість - існують компоненти, які в основному відображають такі суттєві характеристики особи як стать, раса, емоції. При відновленні компоненти мають вигляд, схожий на обличчя, причому перші відображають найбільш загальну форму обличчя, останні - різні дрібні відмінності між особами (рис. 2). Такий метод добре застосуємо для пошуку схожих зображень облич у великих базах даних. Показана також можливість подальшого зменшення розмірності головних компонент за допомогою НС [6]. Оцінюючи якість реконструкції вхідного зображення можна дуже точно визначати його приналежність до класу осіб.

2. Нейронні мережі високого порядку

Нейронні мережі високого порядку (НСВП) відрізняються від МНС тим, що у них тільки один шар, але на входи нейронів надходять так само терми високого порядку, що є твором двох або більше розділів вхідного вектора [1]. Такі мережі так само можуть формувати складні розділяють поверхні.

У [12] показано застосування НСВП суворо третього порядку для розпізнавання зображень облич, що мають довільні масштаби і двовимірні повороти. Наведено методи навчання таких мереж. Особливість такої мережі полягають в тому, що для навчання певного класу досить пред'явити його образ без варіацій масштабів і поворотів - після навчання мережа буде розпізнавати відомі класи інваріантно до масштабу і поворотів. Така мережа не є повно-, швидко навчається і працює. Відзначено суттєве підвищення точності класифікації такою мережею повернених і масштабованих зображень у порівнянні з МНС.

3. Нейронні мережі Хопфілда

НС Хопфілда (НСХ) є одношарової та полносвязной (зв'язки нейронів на самих себе відсутні), її виходи пов'язані з входами. На відміну від МНС, НСХ є релаксаційної - тобто будучи встановленою в початковий стан, функціонує до тих пір, поки не досягне стабільного стану, який і буде її вихідним значенням. НСХ застосовуються в якості асоціативної пам'яті і для вирішення оптимізаційних завдань. У першому випадку НСХ навчається без вчителя (наприклад, за правилом Хебба), у другому випадку ваги між нейронами спочатку кодують вирішуване завдання. НСХ бувають синхронними, коли одночасно перераховуються всі нейрони і асинхронними, коли перераховується випадково обраний нейрон. Для дослідження динаміки функціонування НСХ використовуються методи Ляпунова. Показано [1], що асинхронна НСХ завжди збігається до стійким точкам, а аттракторами синхронної НСХ є стійкі стаціонарні точки і граничні цикли довжини два. Таким чином НСХ з початкового стану сходиться до найближчого локального мінімуму енергії мережі, стан нейронів в якому і буде відновленим чином для задач розпізнавання, і рішенням - для оптимізації задач. Для пошуку глобального мінімуму стосовно оптимізаційним завданням використовують стохастичні модифікації НСХ [1].

Застосування НСХ в якості асоціативної пам'яті дозволяє точно відновлювати образи, яким мережа навчена, при подачі на вхід викривленого образу. При цьому мережа "згадає" найбільш близький (у сенсі локального мінімуму енергії) образ, і таким чином розпізнає його. Таке функціонування так само можна представити як послідовне застосування автоасоціативною пам'яті, описаної вище. На відміну від автоасоціативною пам'яті НСХ ідеально точно відновить образ. Для уникнення інтерференційних мінімумів і підвищення ємності мережі використовують різні методи [1,13]. У роботі [13] описано застосування НСХ, де распознаваемое зображення особи спочатку подавалося на НСХ, вихід якої потім порівнювався з збереженими зображеннями. Відзначено, що попередня обробка вхідного зображення за допомогою НСХ істотно підвищує точність розпізнавання.

Застосування НСХ в якості оптимізаційного методу для відновлення просторової форми особи за двовимірного напівтонового зображення (а так само для детектування граней) описано в [14]. Тут використовується варіація НСХ - чарункова нейронна мережа (Янс), в якій нейрони пов'язані тільки з найближчими сусідами з двовимірної області. Матриця зв'язків однакова для всіх нейронів і визначається характером завдання. Відзначаються хороші результати відновлення тривимірної форми (зокрема для зображень облич) і висока швидкість роботи.

4. Самоорганізуються нейронні мережі Кохонена

Самоорганізуються нейронні мережі Кохонена (СНСК) забезпечують топологічний упорядкування вхідного простору образів. Вони дозволяють топологічно безперервно відображати вхідний n-мірний простір у вихідний m-мірний, m <<n. Вхідний образ проектується на деяку позицію в мережі, що кодується як положення активованого вузла. На відміну від більшості інших методів класифікації та кластеризації, топологічний упорядкування класів зберігає на виході подобу у вхідних образах [2,10], що є особливо корисним при класифікації даних, що мають велику кількість класів. Наприклад, при класифікації локальних ділянок зображень, може бути дуже велика кількість класів, в яких перехід від одного класу до іншого практично безперервний, ускладнюючи визначення границь класів. Мережі такого типу складаються з одного шару (не рахуючи вхідного), який так само може бути організований у n-мірну грати, в залежності від розмірності вихідного простору. Кожен нейрон зв'язаний з усіма вхідними нейронами. Налаштування ваг мережі здійснюється методом конкурентного навчання, в процесі якого змінюються тільки ваги нейрона-переможця, що має максимальну активність. Існує так само метод, в якому змінюються і ваги нейронів, сусідніх з переможцем. У самоорганізованих картах Кохонена (СКК), на відміну від векторних квантователь, нейрони решітки мають зв'язки з сусідніми нейронами, сила зв'язків залежить від відстані між ними. Для СНСК характерна висока швидкість навчання.

В [10] тривимірна СКК (по 5 вузлів на кожний вимір) застосовувалася для зменшення розмірності локальних ділянок зображення 5х5 (розмірність 25). Вхідний зображення відображається на одну з 125 вузлів, положення якого в тривимірній решітці кодує вектор вихідного простору. Три виміри СКК приймаються за три ключові характеристики (features [10]). Таке перетворення забезпечило часткову стійкість до зміни освітлення, зсувам і спотворень, позбавило від необхідності попередньої обробки зображення (перевага - прискорення роботи), а так само значно прискорило процес навчання і класифікації, роблячи цю систему застосовуваною в реальному часі (використовувалася для розпізнавання осіб). Відзначено так само невелику перевагу СКК перед методом аналізу головних компонент, яке полягало у вищій точності подальшої класифікації на основі даних зменшеної розмірності.

Нейронна мережа з радіально-базисної функцією (НСРБФ) є подальшим розвитком НС Кохонена, в якій після конкурентного шару доданий ще один шар, якого навчають за методом зворотного поширення. На відміну від НС Кохонена в НСРБФ виходами нейронів конкурентного шару є значення функції Гаусса з нормальним законом розподілу, і обнулення не перемогли нейронів не потрібно. Ширина радіально-базисної функції характеризує відстань між центром кластера, який утворюється кожним нейронних елементом і його найближчими сусідами.

У [9] застосовувалися дві різні архітектури НСРБФ для розпізнавання облич. На вхід мережі надходили попередньо витягнуті характеристики, отримані методом аналізу головних компонент або коефіцієнти вейвлетних перетворень. У першій архітектурі кількість виходів відповідала кількості класів, в другій застосовувався колектив мереж, кожна з яких була навчена розпізнавати тільки свій клас. Відзначено значні переваги класифікації НСРБФ перед безпосереднім порівнянням ключових характеристик.

В [15] застосовувалися дві різні архітектури ансамблів НСРБФ для попередньої класифікації зображень. На вхід мережі надходило зображення цілком, на виходах формувалася проміжна класифікація, яка потім подавалася на вирішальні дерева для контекстно-орієнтованого розпізнавання зображень облич (наприклад: "знайти всі зображення певної людини, де він в окулярах"). Різні мережі в ансамблях перший архітектури вчилися класифікувати зображення з різними типами змін, другий - з однаковими, але кількість нейронів змінювалося в процесі навчання. Вирішальний висновок робив "суддя", який приймав рішення на основі голосування ансамблю мереж.

5. Когнітрон

Когнітрон [3] своєю архітектурою схожий на будову зорової кори, має ієрархічну багатошарову організацію, в якій нейрони між шарами пов'язані тільки локально. Навчається конкурентним навчанням (без вчителя). Кожен шар мозку реалізує різні рівні узагальнення; вхідний шар чутливий до простих образів, таким, як лінії, і їх орієнтації в певних областях візуальній області, в той час як реакція інших верств є більш складною, абстрактної і незалежної від позиції образу. Аналогічні функції реалізовані в Когнітрон шляхом моделювання організації зорової кори.

Неокогнітрон [3] є подальшим розвитком ідеї Когнітрон і більш точно відображає будову зорової системи, дозволяє розпізнавати образи незалежно від їх перетворень, обертань, спотворень і змін масштабу. Неокогнітрон може як самонавчатися, так і навчатися з учителем. Неокогнітрон отримує на вході двовимірні образи, аналогічні зображенням на сітчастій оболонці, і обробляє їх у наступних шарах аналогічно тому, як це було виявлено в зоровій корі людини. Звичайно, в неокогнітроні немає нічого, що обмежує його використання тільки для обробки візуальних даних, він досить універсальний і може знайти широке застосування як узагальнена система розпізнавання образів.

У зоровій корі знайшли вузли, що реагують на такі елементи, як лінії і кути певної орієнтації. На більш високих рівнях вузли реагують на більш складні і абстрактні образи такі, як кола, трикутники і прямокутники. На ще більш високих рівнях ступінь абстракції зростає до тих пір, поки не визначаться вузли, що реагують на обличчя, і складні форми. У загальному випадку вузли на більш високих рівнях отримують вхід від групи низькорівневих вузлів і, отже, реагують на більш широку область візуального поля. Реакції вузлів більш високого рівня менше залежать від позиції і більш стійкі до спотворень.

Когнітрон є потужним засобом розпізнавання зображень, однак вимагає високих обчислювальних витрат, які на сьогоднішній день недосяжні [3].

6. Переваги і недоліки

Розглянуті нейромережеві методи забезпечують швидке та надійне розпізнавання зображень. Проте при застосуванні цих методів до зображень тривимірних об'єктів виникають труднощі, пов'язані з просторовими поворотами і зміною умов освітленості.

а

б

в

Рис. 3. З точки зору классифицирующей системи (в) більше схоже на (б) ніж на (а)

Рис. 4. Зображення одного і того ж особи істотно різниться при зміні освітлення.

Зображення для різних кутів повороту об'єкта суттєво різняться, частина інформації на зображенні втрачається, виникає нова, специфічна для даного кута. Наприклад, особа, повернене на деякий кут, з точки зору классифицирующей системи [16] більше схоже на обличчя іншої людини, повернене на такий же кут, ніж на потрібну особу, зображене в фас (рис. 3). Аналогічна проблема зі зміною освітлення (рис. 4). Такі обмеження зазвичай долаються шляхом пред'явлення всіляких варіацій зображення (різні повороти і освітленість) під час навчання, але побудова такого навчального набору - важке завдання, і частіше за все такі набори недоступні. Як показує світовий досвід, ці проблеми не можуть бути повністю вирішені вибором початкового представлення даних. Тому до класифікаційною системам пред'являється вимога - маючи кінцевий репрезентативний набір варіацій образів деяких класів, узагальнити свій досвід на всі інші класи, що не входили в навчальний набір. Тобто система повинна здобути характеристики, інваріантні до внутрікласові змін і максимально репрезентативні по відношенню до міжкласових змін. Таке завдання в загальному вигляді для систем розпізнавання осіб ще не вирішена, але існують методи, які показують можливості вирішення окремих її аспектів [17,18] (інваріантність до висвітлення, синтез повернених у просторі зображень облич на основі навчання). Перспективний підхід у цьому напрямку описаний в [10].

Так само існують труднощі, пов'язані з внутрікласові варіаціями. Для осіб це різні емоції, закриті / відкриті очі, наявність окулярів і борід, зміни в зачісці. Ці випадки система так само повинна вміти узагальнювати.

У загальному випадку, при розпізнаванні людина використовує інформацію від різних джерел, і крім того привертає величезний запас контекстних знань, який системам розпізнавання образів поки що недоступний.

7. Висновок

Дан огляд різних нейромережевих методів розпізнавання зображень. Розглянуто переваги і недоліки цих методів при розпізнаванні двовимірних і тривимірних об'єктів. Вказані проблеми при розпізнаванні тривимірних об'єктів. Виділено перспективні напрямки в розпізнаванні тривимірних об'єктів. Відзначено можливості застосування нейромережевих методів для задачі розпізнавання людини по зображенню особи.

8. Ресурси в мережі інтернет

У всесвітній мережі інтернет доступний великий обсяг інформації, присвяченій нейромережевої тематиці та проблемі розпізнавання зображень.

Російськомовні ресурси.

http://www.neuropower.de/ - ресурс, присвячений штучному інтелекту і нейромережевої тематиці, доступний великий обсяг літератури в архіві.

http://neurnews.iu4.bmstu.ru/ - статті та книги з нейромережевої тематики.

http://www.chat.ru/ ~ saisa - матеріали по генетичним алгоритмам.

http://nncourse.chat.ru/ - навчальний посібник "Нейронні мережі (основні моделі)".

Англомовні ресурси.

Більшість матеріалів має формат. Ps (PostScript), для перегляду яких потрібна програма GSView, адресу ресурсу - http://www.cs.wisc.edu/ ~ ghost, або потрібно скопіювати наступні файли:

o ftp://ftp.cs.wisc.edu/ghost/aladdin/gs650/gs650w32.exe,

o ftp://ftp.cs.wisc.edu/ghost/ghostgum/gsv34w32.exe.

http://www.cs.rug.nl/users/peterkr/FACE/face.html - ресурс, присвячений проблемі розпізнавання людини по зображенню особи. Дано безліч посилань на ресурси аналогічної тематики, на нейромережеві ресурси, посилання на ресурси наукових колективів, які займаються суміжними проблемами, посилання на тестові бази даних.

http://www.ks.informatik.uni-kiel.de/ ~ vok / research / research.html - ресурс професора Волькера Крюгера. Присвячений обробці зображень і проблемі розпізнавання людини по зображенню особи.

http://www.funet.fi/pub/sci/neural/neuroprose - архів статей по нейронних мереж.

http://www.neci.nec.com/ ~ lawrence - ресурс професора Стіва Лоренса. Доступна публікація по сверточних нейронних мереж.

http://www.cnl.salk.edu/ ~ wiskott / homepage.html - ресурс про застосування нейронних мереж до проблеми розпізнавання людини по зображенню особи.

Література Головко В.А. Нейроінтеллект: Теорія і застосування. Книга 1. Організація та навчання нейронних мереж з прямими та зворотними зв'язками - Брест: БПІ, 1999, - 260с. Головко В.А. Нейроінтеллект: Теорія і застосування. Книга 2. Самоорганізація, відмовостійкість і застосування нейронних мереж - Брест: БПІ, 1999, - 228с. Уоссермен Ф. Нейрокомп'ютерні техніка: Теорія і практика, 1992 - 184с. Petrou M. Learning in Pattern Recognition. Lecture Notes in Artificial Intelligence - Machine Learning and Data Mining in Pattern Recognition, 1999, pp. 1-12. Jacobsen X., Zscherpel U. and Perner P. A Comparison between Neural Networks and Decision Trees. Lecture Notes in Artificial Intelligence - Machine Learning and Data Mining in Pattern Recognition, 1999, pp. 144-158. Valentin D., Abdi H., O'Toole AJ and Cottrell GW Connectionist models of face processing: a survey. IN: Pattern Recognition 1994, Vol. 27, pp. 1209-1230. Aizenberg IN, Aizenberg NN and Krivosheev GA Multi-valued and Universal Binary Neurons: Learning Algorithms, Applications to Image Processing and Recognition. Lecture Notes in Artificial Intelligence - Machine Learning and Data Mining in Pattern Recognition, 1999, pp. 21-35. Yoon KS, Ham YK and Park R.-H. Hybrid approaches to frontal view face recognition using the Hidden Markov Model and Neural Network. Pattern Recognition 1998 Vol. 31, pp. 283-293. Ranganath S. and Arun K. Face recognition using transform features and neural networks. Pattern Recognition 1997, Vol. 30, pp. 1615-1622. Lawrence S., Giles CL, Tsoi AC and Back AD Face Recognition: A Convolutional Neural Network Approach. IEEE Transactions on Neural Networks, Special Issue on Neural Networks and Pattern Recognition, pp. 1-24. Rowley HA, Baluja S. and Kanade T. Neural Network-Based Face Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, Vol. 20, pp. 23-37. Foltyniewicz R. Efficient High Order Neural Network for Rotation, Translation and Distance Invariant Recognition of Gray Scale Images. Lecture Notes in Computer Science - Computer Analysis of Images and Patterns, 1995, pp. 424-431. Dai Y. and Nakano Y. Recognition of facial images with low resolution using a Hopfield memory model. Pattern Recognition 1998, Vol. 31, pp. 159-167. Milanova M., Almeida PEM, Okamoto J. and Simoes MG Applications of Cellular Neural Networks for Shape from Shading Problem. Lecture Notes in Artificial Intelligence - Machine Learning and Data Mining in Pattern Recognition, 1999, pp. 51-63. Gutta S. and Wechsler H. Face recognition using hybrid classifiers. Pattern Recognition 1997, Vol. 30, pp. 539-553. Самаль Д.І., Старовойтов В.В. - Підходи і методи розпізнавання людей по фотопортретів. - Мінськ, ІТК НАНБ, 1998. - 54с. Belhumeur PN, Hespanha JP and Kriegman DJ Eigenfaces vs Fisherfaces: Recognition Using Class Specific Linear Projection. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, pp. 711-720. Vetter T. and Poggio T. Linear Object Classes and Image Synthesis From a Single Example Image. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, pp. 733-742.

Додати в блог або на сайт

Цей текст може містити помилки.

Виробництво і технології | Доповідь
53.8кб. | скачати


Схожі роботи:
Обробка зображень розпізнавання образів
Непараметричні методи розпізнавання з гарантованим рівнем значущості
Структурні методи розпізнавання складноорганізованих історичних табличних форм
Методи покращення растрових зображень
Методи поліпшення растрових зображень
Розпізнавання мовлення
Ознаки радіолокаційного розпізнавання протирадіолокацій
Системи оптичного розпізнавання образів
Ознаки радіолокаційного розпізнавання протирадіолокацій 2
© Усі права захищені
написати до нас