Прогнозування за допомогою виїзних моделей

Ім'я файлу: лаб 10-11 Гарбуза В.О. 122м-22-3 .docx
Розширення: docx
Розмір: 2884кб.
Дата: 14.12.2022
скачати
Пов'язані файли:
лаб 8-9 Гарбуза В.О. 122м-22-3 .docx

Міністерство освіти і науки України

НТУ «Дніпровська політехніка»

ФАКУЛЬТЕТ ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ

Кафедра програмного забезпечення комп'ютерних систем
ІАСБОТ
Практичні роботи №10-11

Виконав:

Студент групи 122-19ск-1

Гарбуз В.О.

Прийняв:

Мороз Б.І.

2022 н.р.

Практична робота № 10
Тема: Прогнозування за допомогою виїзних моделей
Завдання. Побудова користувальницької моделі.

Побудуйте прогноз продажу на наступні 3 періоди, якщо щомісяця спостерігається постійний приріст обсягу продажу на 160000 од. та спад продажів на 12% за аналогією з періодом минулого року, а також приріст у 2% порівняно з окремим місяцем:

Прогноз = ОбсягПопереднього Місяця * 1,02 + 160000 - ОбсягМісяцяРікНазад * 0,12

Порядок виконання робіт:

Конфігурація папки ПР10 Користувацька модель. Скопіюйте в неї та імпортуйте в Deductor дані з демонстраційного файлу Trade.txt. Збережіть проект у файлі Ваше_прізвище ПР10 Користувальницька модель.

Видаліть аномалії та виконайте згладжування.

Налаштуйте ковзаюче вікно.

Запустіть обробку даних користувача модель.

• Налаштуйте поля вихідних даних.

• Напишіть формулу отримання схожого вигляду:

160000 - 0.12 * COL2B12 + 1.02 * COL2B1

(де COL2B12 та COL2B1 – відповідно імена полів Кількість – 12 та Кількість - 1).

• Відобразіть діаграму розсіювання та таблицю сполучення.

На підставі отриманої моделі проведіть прогнозування на наступні 3 періоди.

Збережіть файл проекту. Заархівуйте Вашу папку ПР10 Модель користувача в архівний файл Ваше_прізвище ПР10 Модель.zip. Скопіюйте його в папку control.

Практична робота № 11
Тема: Класифікація за допомогою дерев рішень
Завдання 1. Класифікація результатів голосування.

Знайдіть правила віднесення політиків до однієї з партій на підставі їхньої підтримки серії законопроектів.

Порядок виконання роботи:

1. Створіть папку ПР11 Дерева рішень. Скопіюйте в неї та імпортуйте в Deductor дані з демонстраційного файлу Vote.txt. Збережіть проект у файлі Ваше_прізвище ПР11 Дерева рішень.

2. Запустіть Майстер обробки та виберіть Дерево рішень.

• Вкажіть поле Код – інформаційним стовпцем, Клас – вихідним, інші – вхідними. Перевірте, як Deductor пропонує конвертувати типи вихідних даних (Налаштування нормалізації).

• Далі поставте випадковий спосіб розбиття.

• Налаштуйте параметри процесу навчання: мінімальна кількість прикладів, при якому буде створено новий вузол – 2; увімкніть Опції Будувати дерево з більш достовірними даними та Відсікати вузли дерева. Встановіть рівень довіри 20%.

• Увімкніть у розділі Data Mining візуалізатори Таблицю сполученості, Дерево рішень, Правила

3. Проаналізуйте Таблицю сполучення – з'ясуйте кількість помилок роботи алгоритму. Позначте її у вигляді відсотків по вертикалі. З'ясуйте, які частки партійців були віднесені не до свого класу в навчальній множині, у тестовій кількості даних.

4. Порівняйте способи подання правил у візуалізаторах Правила та Дерево рішень. Визначте правила, за якими можна зарахувати депутата до тієї чи іншої партії. Виберіть правила, які викликають найбільшу довіру.

Додайте до візуалізації даних Значення атрибутів. Визначте найвагоміший чинник, яким можна судити про належність депутата до тієї чи іншої партії.

Завдання 2. Скоринговий аналіз.

З наявних даних про позичальниках банку побудувати дерево рішень віднесення позичальника до класу надійних чи ненадійних.

Порядок виконання роботи:

1. Скопіюйте у папку та імпортуйте в Deductor дані з демонстраційного файлу Credit.txt. Під час імпорту визначте для поля Давати кредит (число) (який містить лише значення 0 або 1) тип даних – ціле дискретне. Саме це поле буде потрібно для поділу позичальників на два класи, а обробник Дерево рішень працює тільки з дискретними вихідними полями.

2. Викличте Дерево рішень.

• Вкажіть вихідним поле Давати кредит (число), а вхідними – всі поля, крім Дати кредитування, Кількості та Давати кредит.

• Виберіть випадкове виділення навчальної множини, мінімальна кількість прикладів у вузлі – 4, інші параметри за замовчуванням.

• Увімкніть у розділі Data Mining всі візуалізатори, крім Навчального набору.

3. Проаналізуйте результат класифікації:

• Ознайомтеся зі знайденими правилами (візуалізатор Правила). Знайдіть правила із найслабшою підтримкою (відсортуйте таблицю підтримки). Відкрийте деталізацію, з'ясуйте інформацію про цих клієнтів.

• Розгорніть усі гілки в Дерево рішень. Продумайте, для яких цілей зручніше подання правил у Правилах чи Дереві рішень.

• Порівняйте свої емпіричні уявлення про значущість даних із розрахунковими значеннями (Значність атрибутів).

• Скористайтеся візуалізатором Що-небудь, введіть свої (або віртуальні) дані про позичальника та визначте клас його кредитоспроможності. Не забудьте про необхідність введення даних із тих самих діапазонів, що й вихідні. Для зручності такого введення відобразіть статистику.

• З'ясуйте кількість помилок роботи алгоритму (Таблиця поєднання). Відобразіть таблицю як відсотків по горизонталі. З'ясуйте для тестової множини, яка частка неблагонадійних позичальників була схвалена як позитивні (замість значення 0 було запропоновано значення 1).

4. Скопіюйте вузол дерева рішень і переналаштуйте копію – обмежте мінімальну кількість правил у вузлі рівним 3. (Не забудьте перейменувати новий вузол.)

• Наскільки побільшало правил?

Число правил зменшилося на 3 правила.

• Порівняйте значні поля у цьому та попередньому дереві.

Нові значимості

Старі значимості

Збережіть файл проекту. Заархівуйте Вашу папку ПР11 Дерева рішень в архівний файл Ваше_прізвище ПР11 Дерева рішень.zip. Скопіюйте його в папку control.
скачати

© Усі права захищені
написати до нас