1   2   3   4   5   6   7   8   9   ...   23
Ім'я файлу: Богайчук Нейронні мережі.docx
Розширення: docx
Розмір: 1578кб.
Дата: 14.03.2021
скачати
Пов'язані файли:
strategichniy_menedzhment_.doc

Передобробка даних



Після знайомства з базовими принципами нейромережевої обробки, можна приступати до застосувань отриманих знань для вирішення конкретних завдань. Перше, з чим стикається користувач будь-якого нейропакета - це необхідність підготовки даних для нейромережі. Майже в усіх матеріалах по роботі з нейронними мережами не торкаються цього, взагалі кажучи, непростого питання, мовчазно припускаючи, що дані для навчання вже є і представлені у вигляді, доступному для нейромережі. На практиці ж саме предобробка даних може стати найбільш трудомістким елементом нейромережевого аналізу. Причому, знання основних принципів і прийомів передобробки даних не менше, а може бути навіть більш важливе, ніж знання власне нейромережевих алгоритмів. Останні як правило, вже "зашиті" в різних

нейроемуляторах, доступних на ринку. Сам же процес вирішення прикладних завдань, в тому числі і підготовка даних, цілком лягає на плечі користувача. Спробуємо заповнити цю прогалину в описі технології нейромережевого аналізу.

Для початку випишемо з невеликими коментарями весь технологічний ланцюжок, тобто необхідні етапи нейромережевого аналізу:

  • Кодування входів-виходів: нейромережі можуть працювати тільки з числами.

  • Нормування даних: результати нейроаналізу не повинні залежати від вибору одиниць виміру.

  • Передобробка даних: видалення очевидних регулярностей з даних полегшує нейромережі виявлення нетривіальних закономірностей.

  • Навчання декількох нейромереж з різною архітектурою: результат навчання залежить як від розмірів мережі, так і від її початкової конфігурації.

  • Відбір оптимальних мереж: тих, які дадуть найменшу помилку передбачення на невідомих поки даних.

  • Оцінка значущості пророкувань: оцінка помилки прогнозів не менш важлива, ніж саме передбачене значення.

Зазвичай розглядають, в основному, останні етапи, пов'язані з навчанням власне нейромереж, але цьому розділі зосередимося на перших етапах нейромережевого аналізу - передобробці даних. Хоча перобробка не пов'язана безпосередньо з нейромережами, вона є одним з ключових елементів цієї інформаційної технології. Успіх навчання нейромережі може вирішальним чином залежати від того, в якому вигляді представлена інформація для її навчання.

Буде розглянута передобробка даних для навчання з учителем і, головним чином, буде виділено і проілюстровано на конкретних прикладах основний принцип такої передобробки: збільшення інформативності прикладів для підвищення ефективності навчання.
      1. Кодування входів-виходів



На відміну від звичайних комп'ютерів, здатних обробляти будь-яку символьну інформацію, нейромережеві алгоритми працюють тільки з числами, бо їх робота базується на арифметичних операціях множення і складання. Саме таким чином набір синаптичних ваг визначає хід обробки даних.

Тим часом, не всяка вхідна або вихідна змінна в початковому вигляді може мати чисельне вираження. Відповідно, всі такі змінні слід закодувати - перевести в чисельну форму, перш ніж почати власне нейромережеву обробку. Розглянемо, перш за все основний керівний принцип, загальний для всіх етапів попередньої обробки даних.

      1. Максимізація ентропії як мета передобробки



Припустимо, що в результаті переведення всіх даних в числову форму і подальшого нормування всі вхідні і вихідні змінні відображаються в одиничному кубі. Завдання нейромережевого моделювання - знайти статистично достовірні залежності між вхідними та вихідними змінними. Єдиним джерелом інформації для статистичного моделювання є приклади з навчальної вибірки. Чим більше біт інформації принесе кожен приклад - тим краще використовуються наявні в нашому розпорядження дані.

Розглянемо довільну компоненту нормованих (предоброблених) даних: Середня кількість інформації, принесеної кожним прикладом , так само ентропії розподілу значень цієї компоненти . Якщо ці значення зосереджені у відносно невеликій області одиничного інтервалу, інформаційного змісту такої компоненти мало. У межі нульової ентропії, коли всі значення змінної збігаються, ця змінна не несе ніякої інформації. Навпаки, якщо значення змінної рівномірно розподілені в одиничному інтервалі, інформація такої змінної максимальна [32].

Загальний принцип передобробки даних для навчання, таким чином, полягає в максимізації ентропії входів і виходів. Цим принципом слід керуватися і на етапі кодування нечислових змінних.


      1. 1   2   3   4   5   6   7   8   9   ...   23

        скачати

© Усі права захищені
написати до нас