Історія систем розпізнавання образів

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати


Зміст

Введення

1. Що таке розпізнавання образів?

2. Визначення

3. Методи розпізнавання образів

4. Історія розпізнавання образів.

5. Загальна характеристика задач розпізнавання образів та їх типи

Висновок

Список літератури

Введення

Із завданням розпізнавання образів живі системи, в тому числі і людина, стикаються постійно з моменту своєї появи. Зокрема, інформація, що надходить з органів почуттів, обробляється мозком, який у свою чергу сортує інформацію, забезпечує прийняття рішення, а далі за допомогою електрохімічних імпульсів передає необхідний сигнал далі, наприклад, органів руху, які реалізують необхідні дії. Потім відбувається зміна навколишнього оточення, і вищезгадані явища відбуваються заново. І якщо розібратися, то кожен етап супроводжується розпізнаванням.

З розвитком обчислювальної техніки стало можливим вирішити ряд завдань, що виникають у процесі життєдіяльності, полегшити, прискорити, підвищити якість результату. Наприклад, робота різних систем життєзабезпечення, взаємодія людини з комп'ютером, поява роботизованих систем і ін Тим не менш, відзначимо, що забезпечити задовільний результат у деяких завданнях (розпізнавання бистродвіжущихся подібних об'єктів, рукописного тексту) в даний час не вдається.

Мета роботи: вивчити історію систем розпізнавання образів.

Завдання:

- Вказати якісні зміни відбулися в області розпізнавання образів як теоретичні, так і технічні, з зазначенням причин;

- Обговорити методи і принципи, що застосовуються в обчислювальній техніці;

- Привести приклади перспектив, які очікуються в найближчому майбутньому.

1. Що таке розпізнавання образів?

Перші дослідження з обчислювальною технікою в основному слідували класичною схемою математичного моделювання - математична модель, алгоритм і розрахунок. Такими були завдання моделювання процесів, що відбуваються при вибухах атомних бомб, розрахунку балістичних траєкторій, економічних і інших додатків. Однак крім класичних ідей цього ряду виникали і методи засновані на абсолютно інший природі, і як показувала практика вирішення деяких завдань, вони часто давали кращий результат ніж рішення, засновані на переускладненою математичних моделях. Їхня ідея полягала у відмові від прагнення створити вичерпну математичну модель досліджуваного об'єкта (причому часто адекватні моделі було практично неможливо побудувати), а замість цього задовольнитися відповіддю лише на конкретні питання, що цікавлять нас питання, причому ці відповіді шукати із загальних для широкого класу задач міркувань. До досліджень такого роду ставилися розпізнавання зорових образів, прогнозування врожайності, рівня річок, задача розрізнення нафтоносних і водоносних пластів за непрямими геофізичними даними і т.д. Конкретний відповідь у цих завданнях вимагалось в досить простій формі, як наприклад, належність об'єкта одному з заздалегідь фіксованих класів. А вихідні дані цих завдань, як правило, ставили у вигляді уривчастих відомостей про досліджуваних об'єктах, наприклад у вигляді набору заздалегідь расклассифицировать об'єктів. З математичної точки зору це означає, що розпізнавання образів (а так і було названо в нашій країні цей клас завдань) представляє собою далеко, що йде узагальнення ідеї екстраполяції функції.

Важливість такої постановки для технічних наук не викликає ніяких сумнівів і вже це саме по собі виправдовує численні дослідження в цій області. Проте завдання розпізнавання образів має і більш широкий аспект для природознавства (втім, було б дивно якщо щось настільки важливе для штучних кібернетичних систем не u1080 мало б значення для природних). У контекст даної науки органічно увійшли і поставлені ще древніми філософами питання про природу нашого пізнання, нашої здатності розпізнавати образи, закономірності, ситуації навколишнього світу. У дійсності, можна практично не сумніватися в тому, що механізми розпізнавання найпростіших образів, типу образів наближається небезпечного хижака або їжі, сформувалися значно раніше, ніж виникло елементарний мову і формально-логічний апарат. І не викликає жодних сумнівів, що такі механізми достатньо розвинені і у вищих тварин, яким так само в життєдіяльності вкрай необхідна здатність розрізнення досить складної системи знаків природи. Таким чином, в природі ми бачимо, що феномен мислення і свідомості явно базується на здібностях до розпізнавання образів і подальший прогрес науки про інтелект безпосередньо пов'язаний з глибиною розуміння фундаментальних законів розпізнавання. Розуміючи той факт, що перераховані вище питання виходять далеко за рамки стандартного визначення розпізнавання образів (в англомовній літературі більш поширений термін supervised learning), необхідно так само розуміти, що вони мають глибокі зв'язки з цим відносно вузьким (але все ще далеко невичерпаний) напрямом [9 , c. 53].

Вже зараз розпізнавання образів щільно увійшло у повсякденне життя і є одним з найбільш насущних знань сучасного інженера. У медицині розпізнавання образів допомагає лікарям ставити більш точні діагнози, на заводах воно використовується для прогнозу шлюбу в партіях товарів. Системи біометричної ідентифікації особистості в якості свого алгоритмічного ядра так само засновані на результатах цієї дисципліни. Подальший розвиток штучного інтелекту, зокрема проектування комп'ютерів п'ятого покоління, здатних до більш безпосереднього спілкування з людиною на природних для людей мовах і за допомогою мови, немислимі без розпізнавання. Тут рукою подати і до робототехніки, штучних систем управління, що містять як життєво важливих підсистем системи розпізнавання.

Саме тому до розвитку розпізнавання образів з самого початку була прикута чимало уваги з боку фахівців самого різного профілю - кібернетиків, нейрофізіологів, психологів, математиків, економістів і т.д. Багато в чому саме з цієї причини сучасне розпізнавання образів саме харчується ідеями цих дисциплін. Не претендуючи на повноту (а на неї в невеликому есе претендувати неможливо) опишемо історію розпізнавання образів, ключові ідеї [5, c. 107].

2. Визначення

Перш, ніж приступити до основних методів розпізнавання образів, наведемо кілька необхідних визначень.

Розпізнавання образів (об'єктів, сигналів, ситуацій, явищ або процесів) - завдання ідентифікації об'єкта або визначення будь-яких його властивостей за його зображенню (оптичне розпізнавання) або аудіозапису (акустичне розпізнавання) та інші характеристики.

Одним з базових є не має конкретного формулювання поняття безлічі. У комп'ютері безліч представляється набором неповторюваних однотипних елементів. Слово "неповторюваних" означає, що якийсь елемент у безлічі або є, або його там немає. Універсальне безліч включає всі можливі для розв'язуваної задачі елементи, порожнє не містить жодного.

Образ - класифікаційне угруповання в системі класифікації, яка об'єднує (виділяє) певну групу об'єктів за певною ознакою. Образи володіють характерною властивістю, що виявляється в тому, що ознайомлення з кінцевим числом явищ з одного і того ж безлічі дає можливість дізнаватися як завгодно велике число його представників. Образи володіють характерними об'єктивними властивостями в тому сенсі, що різні люди, що навчаються на різному матеріалі спостережень, здебільшого однаково і незалежно один від одного класифікують одні й ті самі об'єкти. У класичній постановці задачі розпізнавання універсальне безліч розбивається на частини-образи. Кожне відображення будь-якого об'єкта на сприймаючі органи розпізнавальної системи, незалежно від його положення щодо цих органів, прийнято називати зображенням об'єкта, а безлічі таких зображень, об'єднані будь-якими загальними властивостями, являють собою образи.

Методика віднесення елемента до якого-небудь образом називається вирішальним правилом. Ще одне важливе поняття - метрика, спосіб визначення відстані між елементами універсальної множини. Чим менше ця відстань, тим більше схожими є об'єкти (символи, звуки та ін) - те, що ми розпізнаємо. Звичайно елементи задаються у вигляді набору чисел, а метрика - у вигляді функції. Від вибору представлення образів і реалізації метрики залежить ефективність програми, один алгоритм розпізнавання з різними метриками буде помилятися з різною частотою.

Навчанням зазвичай називають процес вироблення в деякій системі тієї чи іншої реакції на групи зовнішніх ідентичних сигналів шляхом багаторазового впливу на систему зовнішньої коригування. Таку зовнішню коригування у навчанні прийнято називати "заохоченнями" і "покараннями". Механізм генерації цієї коригування практично повністю визначає алгоритм навчання. Самонавчання відрізняється від навчання тим, що тут додаткова інформація про вірність реакції системі не повідомляється.

Адаптація - це процес зміни параметрів і структури системи, а можливо - і керуючих впливів, на основі поточної інформації з метою досягнення певного стану системи при початковій невизначеності і змінних умовах роботи.

Навчання - це процес, в результаті якого система поступово набуває здатність відповідати потрібними реакціями на певні сукупності зовнішніх впливів, а адаптація - це підстроювання параметрів і структури системи з метою досягнення необхідної якості управління в умовах безперервних змін зовнішніх умов.

Приклади завдань розпізнавання образів: - Розпізнавання букв;

- Розпізнавання штрих-кодів;

- Розпізнавання автомобільних номерів;

-Розпізнавання осіб та інших біометричних даних;

- Розпізнавання мови [7, c. 26].

3. Методи розпізнавання образів

У цілому, можна виділити три методи розпізнавання образів: Метод перебору. У цьому випадку проводиться порівняння з базою даних, де для кожного виду об'єктів представлені всілякі модифікації відображення. Наприклад, для оптичного розпізнавання образів можна застосувати метод перебору виду об'єкта під різними кутами, масштабами, зміщеннями, деформаціями і т. д. Для літер треба перебирати шрифт, властивості шрифту і т. д. У випадку розпізнавання звукових образів, відповідно, відбувається порівняння з деякими відомими шаблонами (наприклад, слово, вимовлене декількома людьми).

Другий підхід - проводиться більш глибокий аналіз характеристик образу. У разі оптичного розпізнавання це може бути визначення різних геометричних характеристик. Звуковий зразок у цьому випадку піддається частотного, амплітудному аналізу і т. д.

Наступний метод - використання штучних нейронних мереж (ШНМ). Цей метод вимагає або великої кількості прикладів задачі розпізнавання при навчанні, або спеціальної структури нейронної мережі, що враховує специфіку даної задачі. Тим не менш, його відрізняє більш висока ефективність і продуктивність. Докладно нейронні мережі ми розглядали в "КД" N 15, 16, 17 за 2005 р [9, c. 84].

4. Історія розпізнавання образів

Розглянемо коротко математичний формалізм розпізнавання образів. Об'єкт в розпізнаванні образів описується сукупністю основних характеристик (ознак, властивостей). Основні характеристики можуть мати різну природу: вони можуть братися з впорядкованої множини типу дійсної прямої, або з дискретного безлічі (яке, втім, так само може бути наділена структурою). Таке розуміння об'єкта узгоджується як потребою практичних додатків розпізнавання образів, так і з нашим розумінням механізму сприйняття об'єкта людиною. Дійсно, ми вважаємо, що при спостереженні (вимірі) об'єкта людиною, відомості про нього надходять за кінцевим числом сенсорів (аналізованих каналів) у мозок, і кожному сенсору можна зіставити відповідну характеристику об'єкта. Крім ознак, відповідних нашими вимірами об'єкта, існує так само виділений ознака, або група ознак, які ми називаємо класифікуючими ознаками, і в з'ясуванні їх значень при заданому векторі Х і полягає завдання, яку виконують природні та штучні системи розпізнавання.

Зрозуміло, що для того, щоб встановити значення цих ознак, необхідно мати інформацію про те, як пов'язані відомі ознаки з класифікуючими. Інформація про цей зв'язок задається у формі прецедентів, тобто безлічі описів об'єктів з відомими значеннями класифікуючих ознак. І з цієї прецедентної інформації і потрібно побудувати вирішальне правило, яке буде ставити безпідставного опису об'єкта значення його класифікуючих ознак.

Таке розуміння задачі розпізнавання образів затвердилося в науці починаючи з 50-х років минулого століття. І тоді ж було відмічено що така постановка зовсім не є новою. З таким формулюванням стикалися і вже існували цілком не погано зарекомендували себе методи статистичного аналізу даних, які активно використовувалися для багатьох практичних завдань, таких як наприклад, технічна діагностика. Тому перші кроки розпізнавання образів пройшли під знаком статистичного підходу, який і диктував основну проблематику [8, c. 176].

Статистичний підхід грунтується на ідеї, що початковий простір об'єктів є ймовірнісний простір, а ознаки (характеристики) об'єктів являють собою випадкові величини задані на ньому. Тоді завдання дослідника даних полягала в тому, щоб з деяких міркувань висунути статистичну гіпотезу про розподіл ознак, а точніше про залежність класифікуючих ознак від інших. Статистична гіпотеза, як правило, представляла собою параметрично задану безліч функцій розподілу ознак. Типовою і класичної статистичної гіпотезою є гіпотеза про нормальність цього розподілу (різновидів таких гіпотез статистики придумали безліч). Після формулювання гіпотези залишалося перевірити цю гіпотезу на прецедентних даних. Це перевірка складалася у виборі деякого розподілу з спочатку заданої множини розподілів (параметра гіпотези про розподіл) та оцінки надійності (довірчого інтервалу) цього вибору. Власне ця функція розподілу і була відповіддю до задачі, тільки об'єкт класифікувався вже не однозначно, але з деякими ймовірностями приналежності до класу. Статистиками були розроблено так само і асимптотичні обгрунтування таких методів. Такі обгрунтування робилися за наступною схемою: встановлювався деякий функціонал якості вибору розподілу (довірчий інтервал) та показувалося, що при збільшенні числа прецедентів, наш вибір з імовірністю прямує до 1 ставав вірним у сенсі цього функціонала (довірчий інтервал прагнув до 0). Забігаючи наперед скажемо, що статистичний погляд на проблему розпізнавання виявився дуже плідним не тільки в сенсі розроблених алгоритмів (у число яких входять методи кластерного, дискримінантного аналізів, непараметричні регресія і т.д.), але й привів згодом Вапніка до створення глибокої статистичної теорії розпізнавання [2, c. 7].

Тим не менше існує серйозна аргументація на користь того, що задачі розпізнавання образів не зводяться до статистики. Будь-яку таку задачу, в принципі, можна розглядати зі статистичної точки зору і результати її рішення можуть інтерпретуватися статистично. Для цього необхідно лише припустити, що простір об'єктів задачі є імовірнісним. Але з точки зору інструменталізму, критерієм успішності статистичної інтерпретації деякого методу розпізнавання може служити лише наявність обоснаванія цього методу на мові статистики як розділу математики. Під обоснаваніем тут розуміється вироблення основних вимог до задачі які забезпечують успіх в застосуванні цього методу. Проте на даний момент для більшої частини методів розпізнавання, в тому числі і для тих, які безпосередньо виникли в рамках статистичного підходу, подібних задовільних обгрунтувань не знайдено. Крім цього, найбільш часто застосовуються на даний момент статистичні алгоритми, типу лінійного дискриминанта Фішера, парзеновского вікна, EM-алгоритму, методу найближчих сусідів, не кажучи вже про байєсівських мережах довіри, мають сильно виражений евристичний характер і можуть мати інтерпретації відмінні від статистичних. І нарешті, до всього вищесказаного варто додати, що крім асимптотичної поведінки методів розпізнавання, яке і є основним питанням статистики, практика розпізнавання ставить питання обчислювальної та структурної складності методів, які виводять далеко за рамки однієї лише теорії ймовірностей.

Разом, всупереч прагненням статистиків розглядати розпізнавання образів як розділ статистики, в практику та ідеологію розпізнавання входили зовсім інші ідеї. Одна з них була викликана дослідженнями в області розпізнавання зорових образів і заснована на наступному аналогії [2, c. 20].

Як вже зазначалося, в повсякденному житті люди постійно вирішують (найчастіше несвідомо) проблеми розпізнавання різних ситуацій, слухових і зорових образів. Така здатність для ЕОМ являє собою в кращому разі справа майбутнього. Звідси деякими піонерами розпізнавання образів був зроблений висновок, що вирішення цих проблем на ЕОМ повинно в загальних рисах моделювати процеси людського мислення. Найбільш відомою спробою підійти до проблеми з цього боку було знамените дослідження Ф. Розенблатта по перцептрона [8, c. 183].

До середини 50-х років здавалося, що нейрофізіологами були зрозумілі фізичні принципи роботи мозку (у книзі "Новий Розум Короля" знаменитий британський фізик-теоретик Р. Пенроуз цікаво ставить під сумнів нейрос_тьовий модель мозку, обгрунтовуючи істотну роль у його функціонуванні квантово-механічних ефектів ; хоча, втім, ця модель піддавалася сумніву з самого початку. Відштовхуючись від цих відкриттів Ф. Розенблатт розробив модель навчання розпізнаванню зорових образів, названу ним персептроном. Персептрон Розенблатта являє собою таку функцію (рис. 1) [6, c. 41]:

Рис 1. Схема Персептрон

На вході персептрон отримує вектор об'єкта, який у роботах Розенблатта представляв собою бінарний вектор, що показував який з пікселів екрану затемнена зображенням а який ні. Далі кожен з ознак подається на вхід нейрона, дія якого представляє собою просте множення на деякий вага нейрона. Результати подаються на останній нейрон, який їх складає і загальну суму порівнює з деяким порогом. У залежності від результатів порівняння вхідний об'єкт Х визнається потрібним чином або ні. Тоді завдання навчання розпізнаванню образів полягала в такому підборі ваг нейронів і значення порога, щоб персептрон давав на прецедентних зорових образах правильні відповіді. Розенблатт вважав, що вийшла, функція буде непогано розпізнавати потрібний зоровий образ навіть якщо вхідного об'єкта і не було серед прецедентів. З біонічних міркувань їм так само був придуманий і метод підбору ваг і порогу, на якому зупинятися ми не будемо. Скажемо лише, що його підхід виявився успішним в ряді задач розпізнавання і породив собою цілий напрям досліджень алгоритмів навчання заснованих на нейронних мережах, окремим випадком яких і є персептрон [6, c. 147].

Далі були придумані різні узагальнення персептрона, функція нейронів була ускладнена: нейрони тепер могли не тільки множити вхідні числа або складати їх і порівнювати результат з порогами, але застосовувати по відношенню до них більш складні функції. На малюнку 2 зображено одне з подібних ускладнень нейрона:

Рис. 2 Схема нейронної мережі.

Крім того топологія нейронної мережі могла бути значно складніша за ту, що розглядав Розенблатт, наприклад такий:

Рис. 3. Схема нейронної мережі Розенблатта.

Ускладнення приводили до збільшення числа параметрів, що настроюються при навчанні, але при цьому збільшували можливість налаштовуватися на дуже складні закономірності. Дослідження в цій області зараз йдуть по двох тісно пов'язаних напрямками - вивчаються і різні топології мереж і різні методи налаштувань.

Нейронні мережі на даний момент є не тільки інструментом вирішення завдань розпізнавання образів, але отримали застосування в дослідженнях з асоціативної пам'яті, стиску зображень. Хоча цей напрям досліджень і перетинається сильно з проблематикою розпізнавання образів, але являє собою окремий розділ кібернетики. Для розпізнавача на даний момент, нейронні мережі не більше ніж дуже специфічно певне, параметрично задану множина відображень, яке в цьому сенсі не має яких-небудь істотних переваг над багатьма іншим подібними моделями навчання які далі будуть коротко перераховані.

У зв'язку з даною оцінкою ролі нейронних мереж для власне розпізнавання (тобто не для біоніки, для якої вони мають першорядне значення вже зараз) хотілося б відзначити наступне: нейронні мережі, будучи надзвичайно складним об'єктом для математичного аналізу, при грамотному їх використанні, дозволяють знаходити дуже нетривіальні закони в даних. Їх труднощі для аналізу, в загальному випадку, пояснюється їхньою складною структурою і як наслідок, практично невичерпними можливостями для узагальнення самих різних закономірностей. Але ці достоїнства, як це часто і буває, є джерелом потенційних помилок, можливості перенавчання. Як буде розказано далі, подібний двоякий погляд на перспективи будь-якої моделі навчання є одним з принципів машинного навчання [6, c .163].

Ще одним популярним напрямком в розпізнаванні є логічні правила і дерева рішень. У порівнянні з вищезгаданими методами розпізнавання ці методи найбільш активно використовують ідею висловлення наших знань про предметну область у вигляді, ймовірно самих природних (на свідомому рівні) структур - логічних правил. Під елементарним логічним правилом мається на увазі висловлювання типу «якщо не класифікуються ознаки знаходяться в співвідношенні X то класифікуються знаходяться в співвідношенні Y». Прикладом такого правила в медичній діагностиці є наступна: якщо вік пацієнта вище 60 років і раніше він переніс інфаркт, то операцію не робити - ризик негативного результату великий [2, c. 43].

Для пошуку логічних правил в даних необхідні 2 речі: визначити міру «інформативності» правила і простір правил. І завдання пошуку правил після цього перетворюється у завдання повного або часткового перебору в просторі правил з метою знаходження найбільш інформативних з них. Визначення інформативності може бути введено самими різними способами і ми не будемо зупинятися на цьому, вважаючи що це теж певний параметр моделі. Простір же пошуку визначається стандартно.

Після знаходження досить інформативних правил настає фаза «збірки» правил у кінцевий класифікатор. Не обговорюючи глибоко проблеми які тут виникають (а їх виникає чимала кількість) перерахуємо 2 основних способи «збірки». Перший тип - лінійний список. Другий тип - зважене голосування, коли кожного правила ставиться у відповідність деякий вагу, і об'єкт відноситься класифікатором до того класу за який проголосувало найбільше правил.

У дійсності, етап побудови правил і етап «збірки» виконуються спільно і, при побудові зваженого голосування або списку, пошук правил на частинах прецедентних даних викликається знову і знову, щоб забезпечити краще узгодження даних і моделі [4, c. 142].

5. Загальна характеристика задач розпізнавання образів та їх типи

Загальна структура системи розпізнавання і етапи в процесі її розробки показані на рис. 4.

Рис. 4. Структура системи розпізнавання

Завдання розпізнавання мають такі характерні риси.

Це інформаційні завдання, що складаються з двох етапів: - перетворення вихідних даних до виду, зручному для розпізнавання; - власне розпізнавання (вказівка ​​приналежності об'єкта певного класу).

У цих завданнях можна вводити поняття аналогії чи подоби об'єктів і формулювати правила, на підставі яких об'єкт зараховується в один і той же клас або в різні класи.

У цих завданнях можна оперувати набором прецедентів-прикладів, класифікація яких відома і які у вигляді формалізованих описів можуть бути пред'явлені алгоритмом розпізнавання для налаштування на завдання в процесі навчання.

Для цих завдань важко будувати формальні теорії і застосовувати класичні математичні методи (часто недоступна інформація для точної математичної моделі чи виграш від використання моделі і математичних методів непорівнянний з витратами).

Виділяють такі типи завдань розпізнавання: - Завдання розпізнавання - віднесення пред'явленого об'єкта з його опису до одного з заданих класів (навчання з учителем); - Завдання автоматичної класифікації - розбиття множини об'єктів, ситуацій, явищ за їх описами на систему непересічних класів (таксономія, кластерний аналіз, самонавчання);

- Завдання вибору інформативного набору ознак при розпізнаванні; - Завдання приведення вихідних даних до виду, зручному для розпізнавання; - Динамічне розпізнавання і динамічна класифікація - задачі 1 і 2 для динамічних об'єктів;

- Завдання прогнозування - суть попередній тип, в якому рішення має ставитися до деякого моменту в майбутньому [5, c. 216].

Висновок

Розпізнавання образів (а часто говорять - об'єктів, сигналів, ситуацій, явищ або процесів) - найпоширеніша завдання, яку людині доводиться вирішувати практично щомиті від першого до останнього дня свого існування. Для цього він використовує величезні ресурси свого мозку, які ми оцінюємо таким показником як кількість нейронів, рівне 10 10.

Можна навіть не утрудняючи себе прикладами помітити, що схожі дії спостерігаються в біології, в живій природі, а іноді навіть у неживий. Крім того, розпізнавання постійно зустрічається в техніці. А якщо це так, то, очевидно, слід вважати механізм розпізнавання всеосяжним [5, c. 347].

З більш загальних позицій можна стверджувати, і це цілком очевидно, що в повсякденній діяльності людина постійно стикається з завданнями, пов'язаними з прийняттям рішень, зумовлених безперервно мінливою навколишнім оточенням. У цьому процесі беруть участь: органи чуття, за допомогою яких людина сприймає інформацію ззовні; центральна нервова система, що здійснює відбір, переробку інформації і прийняття рішень; рухові органи, реалізують прийняте рішення. Але в основі рішень цих завдань лежить, в чому легко переконатися, розпізнавання образів [8, c. 197].

У своїй практиці люди вирішують різноманітні завдання щодо класифікації та розпізнавання об'єктів, явищ і ситуацій (миттєво впізнають один одного, з великою швидкістю читають друковані і рукописні тексти, безпомилково водять автомобілі в складному потоці вуличного руху, здійснюють відбраковування деталей на конвеєрі, розгадують коди, давню єгипетську клинопис і т.д.) [7, c. 68].

Обчислення в мережах формальних нейронів, багато в чому нагадують обробку інформації мозком. В останнє десятиліття нейрокомпьютинг придбав надзвичайну популярність на Заході, де він вже встиг перетворитися на інженерну дисципліну, тісно пов'язану з виробництвом комерційних продуктів. Щорічно виходять десятки книг, присвячених практичним аспектам нейрокомп'ютингу. Інтенсивно ведуться роботи зі створення нової - аналогової елементної бази для нейровичісленій.

У Росії ж, де в силу загального зниження тонусу наукових досліджень структура науки виявилася «замороженої», до цих пір існує думка, що традиційні математичні методи в принципі достатні для вирішення будь-яких завдань розпізнавання образів. Нейрокомпьютинг ж сприймається як надмірність і данина короткочасної моді. Однак на тлі численних практичних успіхів нейротехнологій твердження, що будь-яка конкретна задача може бути в принципі вирішена і без них виглядають дещо схоластично. Раз нейрокомпьютинг на ділі доводить свою конкурентоспроможність розумніше уважніше придивитися до цього феномена. Чи не ризикуємо ми зі своїм скептицизмом знайти початок нового етапу комп'ютерної революції? Не відстане чи російська комп'ютерна наука від світової, цього разу остаточно, у цій надзвичайно швидко розвивається і стратегічно важливої ​​галузі?

Перспективи в найближчому майбутньому. Основною рисою, що відрізняє нейрокомп'ютери від сучасних комп'ютерів і забезпечує майбутнє цього напрямку, на думку автора, є здатність вирішувати неформалізовані проблеми, для яких в силу тих чи інших причин ще не існує алгоритмів рішення. Нейрокомп'ютери пропонують відносно просту технологію породження алгоритмів шляхом навчання. У цьому їх основна перевага, їх «місія» в комп'ютерному світі.

Можливість породжувати алгоритми виявляється особливо корисною для задач розпізнавання образів, в яких часто не вдається виділити значимі ознаки апріорі. Ось чому нейрокомпьютинг виявився актуальним саме зараз, в період розквіту мультимедіа, коли розвиток глобальної мережі Internet вимагає розробки нових технологій, тісно пов'язаних з розпізнаванням образів. Однак - про все по порядку [2, c. 115].

Одна з основних проблем розвитку та застосування штучного інтелекту залишається проблема розпізнавання звукових і візуальних образів. Однак інтернет і розвинені комунікаційні канали вже дозволяють створювати системи, які вирішують цю проблему за допомогою соціальних мереж, готових прийти на допомогу роботам 24 години на добу.

Професія інженера систем розпізнавання образів на базі соціальних мереж буде затребувана вже в найближчому майбутньому і до тих пір, поки системи ШІ не будуть здатні самі пройти тест Тьюринга.

Екстраполюючи експонентний ріст рівня технології протягом декількох десятиліть, футурист Реймонд Курцвейл припустив, що машини, здатні пройти тест Тьюринга, будуть виготовлені не раніше 2029 року.

Проте системи ШІ не можуть чекати так довго - всі інші технології вже готові до того, щоб знайти своє застосування в медицині, біології, системах безпеки і т.д. Їх очима і вухами стануть мільйони людей по всьому світу, готові розпізнати фотографію терориста, напис на бульбашці з ліками або слова про допомогу.

Аудиторія соціальних мереж росте гиганскими темпами. Згідно з результатами дослідження ComScore, у травні 2009 року аудиторія користувачів однієї тільки Facebook в США налічувала 70280 тисяч чоловік. І це практично в два рази вище аналогічного показника за травень 2008 року.

Робота інженера буде полягати в тому, щоб організувати процес передачі користувачам нерозпізнаних візуальних або звукових образів у вигляді MMS, поп-апів на сайтах, символів CAPTCHA на формах у блогах тощо, верифікації отриманих даних і відправки розпізнаного слова або образу назад системі ШІ [ 6, c. 487].

Список літератури

Айзерман М.А., Браверман Е.М., Розоноер Л.І. Метод потенційних функцій в теорії навчання машин. - М.: Наука, 2004. - 384 с.

Горбань А., Россиев Д. Нейронні мережі на персональному комп'ютері. / / Новосибірськ, Наука, 1996. - C 114 - 119.

Журавльов Ю.І. Про алгебраїчному підході до вирішення задач розпізнавання та класифікації / / Проблеми кібернетики. М.: Наука, 2005. - Вип. 33. С. 5-68

Журавльов Ю.І. Вибрані наукові праці. - Вид. Магістр, 2002. - 420 с.

Мазуров В.Д. Комітети систем нерівностей та завдання розпізнавання / / Кібернетика, 2004, № 2. С. 140-146.

Потапов А.С. Розпізнавання образів та машинне сприйняття. - С-Пб.: Політехніка, 2007. - 548 з

Мінський М., Пейперт С. персептрон. - М.: Світ, 2007. - 261 с.

Растрігін Л. А., Еренштейн Р. Х. Метод колективного розпізнавання. 79 с. мул. 20 см., М. Енергоіздат, 2006. - 80 с.

Рудаков К.В. Про алгебраїчної теорії універсальних і локальних обмежень для задач класифікації / / Розпізнавання, класифікація, прогноз. Математичні методи та їх застосування. Вип. 1. - М.: Наука, 2007. - С. 176-200.

Фу К. Структурні методи в розпізнаванні образів. - М.: Світ, 2005. - 144 с.

Додати в блог або на сайт

Цей текст може містити помилки.

Програмування, комп'ютери, інформатика і кібернетика | Реферат
82.6кб. | скачати


Схожі роботи:
Обробка зображень розпізнавання образів
Системи оптичного розпізнавання образів
Ускладнення вирішального правила при управлінні у задачах розпізнавання образів
Історія педагогічних систем
Історія розвитку бібліотечно бібліографічних класифікаційних систем
Історія автоматизованих систем управління підприємствами АСУП
Історія розвитку бібліотечно-бібліографічних класифікаційних систем
Розпізнавання мовлення
Історія виникнення і розвитку методів реконструкції математичних моделей динамічних систем
© Усі права захищені
написати до нас