Ім'я файлу: Звіт ЛР1 .docx
Розширення: docx
Розмір: 1059кб.
Дата: 03.05.2022
скачати

Тема: «Візуалізація наборів даних. Загальна статистика».

Мета: вивчення можливостей і основних принципів роботи в пакеті Statistica. Графічний розвідувальний аналіз даних. Первинний аналіз даних в статистичних системах.

Варіант 1

Дані: Досліджується ринок споживачів послуги «Підключення до мережі Інтернет». В першу групу включені користувачі Інтернет зі стажем роботи менш 1 року, в другу – зі стажем 1 рік і більш.

Виконання роботи

  1. Імпорт даних в Statistica для подпльшого аналізу.



Рис. 1.1. Дані завантажені в STATISTICA для аналізу

  1. Графічне представлення категаризованих гістограм та радіальних діаграм.



Рис. 1.2. Гістограма розподілу користувачів Інтернету по групам в залежності від віку та від часу використання Інтернету в професійній діяльності



Рис. 1.3. Гістограма розподілу користувачів Інтернету по групам в залежності від статі та від часу використання Інтернету в професійній діяльності



Рис. 1.4.



Рис. 1.5. Радіальна діаграма співвідношення часу використання Інтернету в професійній діяльності для чоловіків і жінок



Рис. 1.6. Радіальна діаграма співвідношення середньої кількість годин використання Інтернету в тиждень для кожної із груп відповідно і відповідно до часу використання Інтернету в професійній діяльності

  1. Визначення статистичних показників заданого набору даних.

На цьому етапі було визначено наступні показники: математичне сподівання, оцінка медіани, оцінка середньоквадратичного відхилення, оцінка дисперсії, оцінка коефіцієнта асиметрії, оцінку коефіцієнта ексцесу, мінімальне та максимальне вибіркові значення.

Середнє (Mean) – середнє значення ряду даних. Середнє — це «центр тяжіння» розподілу, і кожне значення дає внесок у визначення середнього значення, коли поширення значень є симетричними довкола центральної точки.

Медіана (Median) – це значення, що ділить впорядкований ряд навпіл.

Дисперсія (Variance) є мірою відхилення значень випадкової величини від центру розподілу (середнього).

Середньоквадратичне відхилення (Standard Deviation) – це позитивний квадратний корінь з дисперсії.

Коефіцієнт асиметрії (Skewness) – числова характеристика розподілу ймовірностей дійсної випадкової величини.

Коефіцієнт ексцесу (Kurtosis) – числова характеристика розподілу ймовірностей дійсної випадкової величини. Коефіцієнт ексцесу характеризує «крутість», тобто, стрімкість підвищення кривої розподілу у порівнянні з нормальною кривою.



Рис. 1.7.



Рис. 1.8.



Рис. 1.9. Відображення показника Математичне сподівання для 1-групи та 2-групи

Висновки

У даній лабораторній роботі відбулось ознайомлення з можливостями і основними принципами роботи в пакеті Statistica. Було проведено графічний розвідувальний аналіз даних, а саме побудовано категаризовані гістограмм та радіальні діаграми засобами пакету Statistica. Також здійснено розрахунок параметрів описової статистики за допомогою модуля Descriptive statistics (Описова статистика).
скачати

© Усі права захищені
написати до нас