Ім'я файлу: Рибкін_Реферат_ВП.docx
Розширення: docx
Розмір: 1212кб.
Дата: 17.06.2022
скачати
Пов'язані файли:
Портфоліо.pdf

ВСП «Слов'янський фаховий коледж Національного авіаційного університету»

Циклова комісія «Інформатика та програмування»

Виробнича (переддипломна) практика
РЕФЕРАТ – ДОСЛІДЖЕННЯ

На тему:

«Дослідження алгоритмів обчислення кореляції за допомогою пакета

аналізу в табличному процесорі Microsoft Excel 2016 різними способами»

спеціальність 121 «Інженерія програмного забезпечення»

освітня програма «Розробка програмного забезпечення»»

Виконав студент гр. 1РПЗ18

Рибкін Даніл Васильович

Перевірив керівник практики

від ВСП «СФКНАУ «

_________________ О.Є. Чиримпей

Оцінка ________________________

2022

Зміст

Вступ 3

1.Кореляція 4

1.1. Визначення кореляції 4

1.2. Кореляція та взаємозв'язок величин 4

1.3. Коефіцієнт кореляції 5

2.Кореляційний аналіз 6

2.1. Обмеження кореляційного аналізу 6

2.2. Галузь застосування 7

3.Хибна кореляція 7

4.Кореляційний аналіз в Excel 8

Метод 1: функція КОРРЕЛ 8

Метод 2: «Пакет аналізу» 11

Висновок 16

Список використаних джерел 17



Вступ

Кореляція або кореляційна залежність - статистичний взаємозв'язок двох або більше випадкових величин (або величин, які можна з деяким допустимим ступенем точності вважати такими). При цьому зміни значень однієї або кількох із цих величин супроводжують систематичну зміну значень іншої або інших величин

Кореляції корисні, бо вони можуть вказувати на передбачальний зв'язок, який можливо використовувати на практиці. Наприклад, енергогенерувальна компанія може виробляти менше електроенергії в день з помірною погодою на основі кореляції між попитом на електроенергію та погодою. У цьому прикладі існує причинно-наслідковий зв'язок, оскільки екстремальна погода змушує людей використовувати більше електроенергії для опалення чи кондиціювання. Проте в загальному випадку, щоби зробити висновок про наявність причинно-наслідкового зв'язку, наявності кореляції недостатньо (тобто, кореляція не означає спричинювання).

Вперше у науковий обіг термін кореляція ввів французький палеонтолог Жорж Кюв'є у XVIII столітті. Він розробив «закон кореляції» частин 17-ї та органів живих істот, з допомогою якого можна відновити образ викопної тварини, маючи лише частину його останків. У статистиці слово «кореляція» першим став використовувати англійський біолог і статистик Френсіс Гальтон наприкінці ХІХ століття.

  1. Кореляція

    1. Визначення кореляції

Найбільш загальновідомою мірою залежності між двома величинами є коефіцієнт кореляції Пірсона (англ. Pearson product-moment correlation coefficient, PPMCC, або англ. Pearson's correlation coefficient), який зазвичай називають просто «коефіцієнт кореляції». Його отримують взяттям відношення коваріації двох розгляданих змінних нашого чисельного набору даних, унормованої квадратним коренем їхніх дисперсій. Математично, коваріацію цих двох змінних просто ділять на добуток їхніх стандартних відхилень. Карл Пірсон розробив цей коефіцієнт на основі подібної, але дещо відмінної ідеї Френсіса Гальтона.

    1. Кореляція та взаємозв'язок величин

Значна кореляція між двома випадковими величинами завжди є свідченням існування деякого статистичного зв'язку в даній вибірці, але цей зв'язок не обов'язково повинен спостерігатися для іншої вибірки та мати причинно-наслідковий характер.

Часто приваблива простота кореляційного дослідження підштовхує дослідника робити помилкові інтуїтивні висновки про наявність причинно-наслідкового зв'язку між парами ознак, тоді як коефіцієнти кореляції встановлюють лише статистичні взаємозв'язки. Наприклад, розглядаючи пожежі у конкретному місті, можна виявити дуже високу кореляцію між збитком, який завдав пожежі, і кількістю пожежників, які брали участь у ліквідації пожежі, причому ця кореляція буде позитивною. З цього, однак, не випливає висновок «збільшення кількості пожежників призводить до збільшення завданих збитків», і тим більше не буде успішною спроба мінімізувати збитки від пожеж шляхом ліквідації пожежних бригад. Кореляція двох величин може свідчити існування загальної причини, хоча самі явища безпосередньо не взаємодіють. Наприклад, зледеніння стає причиною як зростання травматизму через падіння, і збільшення аварійності серед автотранспорту. У цьому випадку дві величини (травматизм через падіння пішоходів та аварійність автотранспорту) корелюватимуть, хоча вони не пов'язані причинно-наслідково один з одним, а лише мають сторонню загальну причину — ожеледицю.

    1. Коефіцієнт кореляції

Коефіцієнт кореляції - показник, який використовують для вимірювання щільності зв'язку між результативними і факторними ознаками у кореляційно-регресійній моделі за лінійної залежності. За абсолютною величиною коефіцієнту кореляції коливається в межах від -1 до +1. Чим ближчий цей показник до 0, тим менший зв'язок, чим ближчий він до ±1 – тим зв'язок тісніший. Знак «плюс» при коефіцієнті кореляції означає прямий зв'язок між ознаками х і у, знак «мінус» – обернений.

Уперше коефіцієнт кореляції як показник щільності зв'язку використав К. Пірсон. Спочатку досліджувалася прямолінійна залежність, пов'язана із законом нормального розподілу (А. Браве, К. Пірсон, В. Шеппард та ін.), відтак виникла потреба в дослідженні й нелінійних залежностей. Для вимірювання щільності зв'язку нелінійних залежностей Пірсон запропонував кореляційне відношення із розробкою методів аналізу взаємозв'язку двох змінних було запропоновано теорію часткових і чистих коефіцієнтів кореляції, а також теорію множинної (багатофакторної) кореляції.

Коефіцієнт кореляції між досліджуваними ознаками повинен мати високий рівень достовірності (надійності). Для оцінки достовірності коефіцієнту кореляції обчислюють відношення коефіцієнта до його середньої помилки. Якщо воно дорівнює або більше 3, коефіцієнт кореляції вважають достовірним, тобто зв'язок між досліджуваними ознаками доведений. Якщо відношення менше 3, то не можна зробити висновку про достовірність зв'язку між досліджуваними ознаками. Для більшої надійності досліджень спід брати величину відношення коефіцієнту кореляції до його середньої помилки не 3, а 4. Якщо відношення коефіцієнту кореляції до його середньої помилки більше 3, а число спостережень більше 50, то вважають, що розрахований лінійний коефіцієнту кореляції відображає істотний тісний зв'язок.


  1. Кореляційний аналіз

Кореляційний аналіз - метод обробки статистичних даних, за допомогою якого вимірюється тіснота зв'язку між двома або більше змінними. Кореляційний аналіз тісно пов'язаний із регресійним аналізом (також часто зустрічається термін «кореляційно-регресійний аналіз», який є більш загальним статистичним поняттям), з його допомогою визначають необхідність включення тих чи інших факторів до рівняння множинної регресії, а також оцінюють отримане рівняння регресії на відповідність до виявлених зв'язків (використовуючи коефіцієнт детермінації)

Мета кореляційного аналізу – забезпечити отримання деякої інформації про одну змінну за допомогою іншої змінної. У випадках, коли можливе досягнення мети, кажуть, що змінні корелюють. У самому загальному вигляді прийняття гіпотези про наявність кореляції означає, що зміна значення змінної А, відбудеться одночасно з пропорційною зміною значення Б: якщо обидві змінні зростають, то кореляція позитивна, якщо одна змінна зростає, а друга зменшується, кореляція негативна.

Кореляція відбиває лише лінійну залежність величин, але з відбиває їх функціональної зв'язності. Наприклад, якщо обчислити коефіцієнт кореляції між величинами A = sin(x) і B = cos(x), він буде близький до нуля, т. е. залежність між величинами відсутня. Тим часом величини A і B очевидно пов'язані функціонально за законом sin2(x) + cos2(x) = 1.



    1. Обмеження кореляційного аналізу



Графіки розподілів пар (x, y) з відповідними коефіцієнтами кореляцій x та y для кожного з них. Зверніть увагу, що коефіцієнт кореляції відображає лінійну залежність (верхній рядок), але не визначає криву залежності (середній рядок), і зовсім не підходить для опису складних, нелінійних залежностей (нижній рядок).

  1. Застосування можливе у разі достатньої кількості випадків вивчення: для конкретного виду коефіцієнта кореляції становить від 25 до 100 пар спостережень.

  2. Друге обмеження випливає з гіпотези кореляційного аналізу, у якій закладено лінійну залежність змінних. У багатьох випадках, коли відомо, що залежність існує, кореляційний аналіз може дати результатів просто з огляду на те, що залежність нелінійна (виражена, наприклад, як параболи).

  3. Сам собою факт кореляційної залежності не дає підстави стверджувати, яка зі змінних передує або є причиною змін, або що змінні взагалі причинно пов'язані між собою, наприклад, через дії третього фактора.

    1. Галузь застосування

Даний метод обробки статистичних даних дуже популярний в економіці та соціальних науках (зокрема в психології та соціології), хоча сфера застосування коефіцієнтів кореляції велика: контроль якості промислової продукції, металознавство, агрохімія, гідробіологія, біометрія та інші.

Популярність методу обумовлена ​​двома моментами: коефіцієнти кореляції щодо прості у підрахунку, їх застосування вимагає спеціальної математичної підготовки. У поєднанні з простотою інтерпретації, простота застосування коефіцієнта призвела до його поширення у сфері аналізу статистичних даних.

  1. Хибна кореляція

Часто приваблива простота кореляційного дослідження підштовхує дослідника робити помилкові інтуїтивні висновки про наявність причинно-наслідкового зв'язку між парами ознак, тоді як коефіцієнти кореляції встановлюють лише статистичні взаємозв'язки.

У сучасній кількісній методології соціальних наук, фактично, відбулася відмова від спроб встановити причинно-наслідкові зв'язки між спостережуваними змінними емпіричними методами. Тому, коли дослідники в соціальних науках говорять про встановлення взаємозв'язків між змінними, що вивчаються, мається на увазі або загальнотеоретичне припущення, або статистична залежність.

  1. Кореляційний аналіз в Excel

Для демонстрації кореляційного аналізу в Microsoft Excel буде використана дана таблиця:



Тут вказані дані щодо середньодобової температури та середньої вологості за місяцями року. Завдання – з'ясувати, чи існує зв'язок між цими параметрами і якщо так, то наскільки сильний.

Метод 1: функція КОРРЕЛ

В Excel передбачена спеціальна функція, що дозволяє зробити кореляційний аналіз – КОРРЕЛ. Її синтаксис виглядає так:

КОРРЕЛ(массив1;массив2).

Порядок дій під час роботи з цим інструментом наступний:

  1. Натискаємо у вільну комірку таблиці, в якій плануємо розрахувати коефіцієнт кореляції. Потім клацаємо по значку "fx (Вставити функцію)" зліва від рядка формул. Вставка функції в комірку таблиці Excel.



  1. У вікні вставки функції, що відкрилося, вибираємо категорію "Статистичні" (або "Повний алфавітний перелік"), серед запропонованих варіантів відзначаємо "КОРРЕЛ" і клацаємо OK.Вибір оператора КОРРЕЛ для вставки в комірку таблиці Excel.



  1. На екрані з'явиться вікно аргументів функції із встановленим курсором у першому полі напроти “Масив 1”. Тут ми вказуємо координати осередків першого стовпця (без шапки таблиці), дані якого потрібно проаналізувати (у разі – B2:B13). Зробити це можна вручну, надрукувавши потрібні символи за допомогою клавіатури. Також виділити необхідний діапазон можна безпосередньо в самій таблиці за допомогою лівої кнопки миші. Потім переходимо до другого аргументу "Масив 2", просто натиснувши всередині відповідного поля або натиснувши клавішу Tab. Тут вказуємо координати діапазону осередків другого аналізованого стовпця (у таблиці – це C2:C13). По готовності клацаємо OK. Заповнення аргументів функції КОРРЕЛ у програмі Excel.



  1. Отримуємо коефіцієнт кореляції в осередку з функцією. Значення "-0,63" свідчить про помірно-сильну зворотну залежність між аналізованими даними.





Метод 2: «Пакет аналізу»

Альтернативним способом виконання кореляційного аналізу є використання Пакету аналізу, який попередньо потрібно включити. Для цього:

  1. Заходимо в меню "Файл". Перехід в меню Файл в Excel.

  2. У переліку зліва вибираємо пункт "Параметри". Перехід до параметрів Excel.



  1. У вікні, що клікаємо по підрозділу "Надбудови". Потім у правій частині вікна в самому низу для параметра "Керування" вибираємо "Надбудови Excel" і клацаємо "Перейти". Перехід до управління надбудовами в параметрах Excel.



  1. У вікні, що відкривається, відзначаємо "Пакет аналізу" і підтверджуємо дію натисканням кнопки OK.Включення надбудови Пакет аналізу в Excel.



Все готово, "Пакет аналізу" активовано. Тепер можна перейти до виконання нашого основного завдання:

  1. Натискаємо кнопку “Аналіз даних”, яка знаходиться у вкладці “Дані”. Застосування аналізу даних Excel.



  1. З'явиться вікно, у якому представлено список доступних варіантів аналізу. Відзначаємо "Кореляцію" і клацаємо OK. Вибір Кореляції для аналізу даних в Excel.



  1. На екрані з'явиться вікно, в якому потрібно вказати такі параметри:

    • "Вхідний інтервал". Виділяємо весь діапазон аналізованих осередків (тобто відразу обидва стовпці, а не по одному,

    • як це було описано вище методі).

    • "Угруповання". На вибір запропоновано два варіанти: по стовпчикам та рядкам. У разі підходить перший варіант, т.к. саме так розташовані аналізовані дані в таблиці. Якщо у виділений діапазон включені заголовки, слід поставити галочку напроти пункту "Мітки у першому рядку".

    • "Параметри виведення". Можна вибрати варіант "Вихідний інтервал", у цьому випадку результати аналізу будуть вставлені на поточному аркуші (потрібно вказати адресу комірки, починаючи з якої будуть виведені підсумки). Також пропонується виведення результатів на новому аркуші або в новій книзі (дані будуть вставлені на самому початку, тобто починаючи з осередку A1).Як приклад залишаємо "Новий робочий лист" (вибраний за замовчуванням).

    • Коли все готово, клацаємо OK. Налаштування параметрів кореляційного аналізу в Excel.



  1. Отримуємо той самий коефіцієнт кореляції, що й у першому методі. Це говорить про те, що в обох випадках ми все зробили правильно.



Висновок

Отже, під кореляцією розуміють статистичну залежність між двома випадковими величинами, що не має, взагалі кажучи, строго функціонального характеру.

Слід зауважити, що кореляційний аналіз не дозволяє визначити вид функціонального зв'язку між випадковими величинами, а тільки наявність або відсутність передбачуваної зв'язку, наприклад лінійної, параболічної, експоненційної і т.д.

Даний метод обробки статистичних даних дуже популярний в економіці та соціальних науках (зокрема в психології та соціології), хоча сфера застосування коефіцієнтів кореляції велика: контроль якості промислової продукції, металознавство, агрохімія, гідробіологія, біометрія та інші. У різних прикладних галузях прийнято різні межі інтервалів для оцінки тісноти та значущості зв'язку.

Популярність методу обумовлена ​​двома моментами: коефіцієнти кореляції щодо прості у підрахунку, їх застосування вимагає спеціальної математичної підготовки. У поєднанні з простотою інтерпретації, простота застосування коефіцієнта призвела до його поширення у сфері аналізу статистичних даних.

Виконання кореляційного аналізу в Excel - досить автоматизована і проста в освоєнні процедура. Все, що потрібно знати - де знайти і як налаштувати необхідний інструмент.

Список використаних джерел

  1. https://blogchain.com.ua/koreliatsijnyj-analiz-u-excel-pryklad-vykonannia-koreliatsijnoho-analizu/

  2. https://uk.wikipedia.org/wiki/Кореляція

  3. https://macerayarislari.com/uk/300-examples/19-correlation-in-excel.html

  4. http://www.ukr.vipreshebnik.ru/entsiklopediya/56-k/1501-koefitsient-korelyatsiji.html

  5. https://exceltable.com/funkcii-excel/primery-funkcii-korrel

скачати

© Усі права захищені
написати до нас