Основні можливості та класифікація нейронних мереж

1 2 3 4 5 6 7 8 9 ... 23

Ім'я файлу: Богайчук Нейронні мережі.docx
Розширення: docx
Розмір: 1578кб.
Дата: 14.03.2021
скачати
Пов'язані файли:
strategichniy_menedzhment_.doc

Міністерство освіти і науки України

ІФНТУНГ

Кафедра ІТТС

Основні можливості та класифікація нейронних мереж

Виконав:

Ст. гр. АКС-19-1К

Богайчук Б.М

Перевірив:

Шатан М.В.

Івано-Франківськ

2020

ВСТУП

На сьогоднішній день існують дві взаємно збагачуючі одна одну мети нейронного моделювання: перша – зрозуміти функціонування нервової системи людини на рівні фізіології і психології і друга – створити обчислювальні системи (штучні нейроні мережі), що виконують функції, подібні до функцій мозку. Нейроні мережі можна розглядати як сучасні обчислювальні системи, що перетворять інформацію з образа процесів, що відбуваються в мозку людини.

Оброблювана інформація має числовний характер, що дозволяє використовувати нейрону мережу, наприклад, як модель об'єкта з зовсім невідомими характеристиками. Інші типові додатки нейроних мереж охоплюють задачі розпізнавання, класифікації, аналізу образів. Понад 80 % усіх додатків нейроних мереж відноситься до так називаних багатошарових мереж без зворотних зв'язків. У них сигнал пересилається в напрямку від вхідного шару через сховані шари (якщо вони існують) до вихідного шару. Інтелектуальні системи на основі штучних нейроних мереж дозволяють з успіхом розв’язувати проблеми розпізнавання образів, виконання прогнозів, оптимізації, асоціативній пам'яті і керування.

Традиційні підходи до розв’язання цих проблем не завжди дають необхідну гнучкість і багато додатків виграють від використання нейромереж. Штучні нейромережи є електронними моделями нейроної структури мозку, який, головним чином, вчиться на досвіді. Природна аналогія доводить, що множина проблем, що не піддаються розв’язанню традиційними комп'ютерами, можуть бути ефективно вирішені за допомогою нейромереж. Тривалий період еволюції додав мозкові людини багато якостей, відсутніх у сучасних комп'ютерах з архітектурою фон Неймана.

До них відносяться:

розподілене представлення інформації і паралельні обчислення
здатність до навчання й узагальнення
адаптивність
толерантність до помилок
низьке енергоспоживання

Системи, побудовані на принципах біологічних нейронів, мають перераховані характеристики, які можна вважати істотним досягненням в індустрії обробки даних. Біологічний мозок розглядається як множина елементарних елементів — нейронів, з'єднаних один з одним численними зв'язками. Нейрони бувають трьох типів: рецептори (приймаючі сигнали з зовнішнього середовища і передавальні іншим нейронам), внутрішні нейрони (приймаючі сигнали від інших нейронів, що перетворюють їх і передають іншим нейронам) і реагуючі нейрони (приймаючі сигнали від нейронів і сигнали, що виробляють, у зовнішнє середовище).

Як і обчислювальні штучні нейронні мережі, є й інші технології, що продовжують невпинно набирати популярність.

. Особлива увага в дослідженні приділяється саме аспектам оптимізації роботи з нейронною мережею на усіх етапах. Обмеження в доступній флеш-пам’яті призводить до того, що навчання необхідно проводити на мінімально доступній вибірці, намагаючись отримати задовільні результати.

СТВОРЕННЯ МНОЖИНИ НАВЧАЛЬНИХ ДАНИХ ДЛЯ ШТУЧНИХ НЕЙРОННИХ МЕРЕЖ

За останні роки машинне навчання не тільки набрало популярності, а й сформувалося як окрема дисципліна з досліджень розпізнавання образів та теорії обчислювального навчання в галузі штучного інтелекту. Репрезентативні вхідні дані високої якості є ключем до якісних моделей машинного навчання, а їх дефіцит може перешкоджати розвитку моделі. Формування множини навчальних даних має принципово важливе значення для успішного вирішення завдань машинного навчання. Часто завдання машинного навчання зводяться саме до правильного формування навчальної множини. Помилки у формуванні навчальної множини зазвичай виявляються критичними і здатні звести нанівець ефективність самих алгоритмів навчання. Серед фахівців по машинному навчанню загальновизнаним вважається, що наявність якісних навчальних даних часто набагато важливіше якості алгоритму навчання. У зв'язку з активним розвитком глибоких нейронних мереж в останнє десятиліття питання формування множини навчальних даних приймає особливо важливе значення, оскільки в багатьох задачах глибокі нейронні мережі демонструють якість, що істотно переверщує інші алгоритми, однак, щоб отримати подібний виграш в якості, необхідно використовувати навчальну множину дуже великого розміру (до декількох мільйонів зображень, при цьому навчання вимагає великого обсягу обчислювальних ресурсів і може займати кілька тижнів на багатопроцесорному кластері), а також спеціальні методи розширення та імітації розширення навчальної множини, які будуть розглянуті далі. У той же час, в сучасній літературі по машинному навчанню, питанню формування навчальної множини приділяється недостатня увага, недостатньо розвинена теоретична база, що пояснює явища, що виникають в процесі формування множини навчальних даних.

Найпершим та одним з найважливіших етапів навчання нейронної мережі є збір даних, які сформують навчальну множину. Навчальні множини повинні бути досить великими, щоб містити всю необхідну інформацію для виявлення

важливих особливостей і зв'язків. Але і навчальні приклади повинні містити широке різноманіття даних. Якщо мережа навчається лише для одного прикладу, ваги старанно встановлені для цього прикладу, радикально змінюються у навчанні для наступного прикладу. Попередні приклади при навчанні наступних просто забуваються. В результаті система повинна навчатись всьому разом, знаходячи найкращі вагові коефіцієнти для загальної множини прикладів. Наприклад, у навчанні системи розпізнавання піксельних образів для десяти цифр, які представлені двадцятьма прикладами кожної цифри, всі приклади цифри "сім" не доцільно представляти послідовно. Краще надати мережі спочатку один тип представлення всіх цифр, потім другий тип і так далі. Головною компонентою для успішної роботи мережі є представлення і кодування вхідних і вихідних даних. Штучні мережі працюють лише з числовими вхідними даними, отже, необроблені дані, що надходять із зовнішнього середовища повинні перетворюватись. Додатково необхідне масштабування, тобто нормалізація даних відповідно до діапазону всіх значень. Попередня обробка зовнішніх даних, отриманих за допомогою сенсорів, у машинний формат спільна для стандартних комп'ютерів і є легко доступною. Якщо після контрольованого навчання нейромережа ефективно опрацьовує дані навчальної множини, важливим стає її ефективність при роботі з даними, які не використовувались для навчання. У випадку отримання незадовільних результатів для тестової множини, навчання продовжується. Тестування використовується для забезпечення запам'ятовування не лише даних заданої навчальної множини, але і створення загальних образів, що можуть міститись в даних.

При підготовці даних для навчання нейронної мережі необхідно звертати увагу на декілька суттєвих моментів. Кількість спостережень в наборі даних. Слід враховувати той фактор, що чим більше розмірність даних, тим більше часу буде потрібно для навчання мережі. Робота з викидами. Слід визначити наявність викидів і оцінити необхідність їх присутності в вибірці. Навчальна вибірка повинна бути представницької (репрезентативною). Навчальна вибірка

не повинна містити протиріч, так як нейронна мережа однозначно зіставляє вихідні значення вхідним.

Нейронна мережа працює тільки з числовими вхідними даними, тому важливим етапом при підготовці даних є перетворення і кодування даних. При використанні на вхід нейронної мережі слід подавати значення з того діапазону, на якому вона навчалася. Наприклад, якщо при навчанні нейронної мережі на один з її входів подавалися значення від 0 до 10, то при її застосуванні на вхід слід подавати значення з цього ж діапазону або прилеглі. Існує поняття нормалізації даних. Метою нормалізації значень є перетворення даних до виду, який найбільш підходить для обробки, тобто дані, що надходять на вхід, повинні мати числовий тип, а їх значення повинні бути розподілені в певному діапазоні. Нормалізатор може призводити дискретні дані до набору унікальних індексів або перетворювати значення, що лежать в довільному діапазоні, в конкретний діапазон, наприклад, [0..1]. Нормалізація виконується шляхом ділення кожної компоненти вхідного вектора на довжину вектора, що перетворює вхідний вектор в одиничний [18].

1 2 3 4 5 6 7 8 9 ... 23

скачати

© Усі права захищені
написати до нас