Тема: «Візуалізація наборів даних. Загальна статистика». Мета: вивчення можливостей і основних принципів роботи в пакеті Statistica. Графічний розвідувальний аналіз даних. Первинний аналіз даних в статистичних системах. Варіант 1 Дані: Досліджується ринок споживачів послуги «Підключення до мережі Інтернет». В першу групу включені користувачі Інтернет зі стажем роботи менш 1 року, в другу – зі стажем 1 рік і більш. Виконання роботи Імпорт даних в Statistica для подпльшого аналізу. Рис. 1.1. Дані завантажені в STATISTICA для аналізу Графічне представлення категаризованих гістограм та радіальних діаграм. Рис. 1.2. Гістограма розподілу користувачів Інтернету по групам в залежності від віку та від часу використання Інтернету в професійній діяльності Рис. 1.3. Гістограма розподілу користувачів Інтернету по групам в залежності від статі та від часу використання Інтернету в професійній діяльності Рис. 1.4. Рис. 1.5. Радіальна діаграма співвідношення часу використання Інтернету в професійній діяльності для чоловіків і жінок Рис. 1.6. Радіальна діаграма співвідношення середньої кількість годин використання Інтернету в тиждень для кожної із груп відповідно і відповідно до часу використання Інтернету в професійній діяльності Визначення статистичних показників заданого набору даних. На цьому етапі було визначено наступні показники: математичне сподівання, оцінка медіани, оцінка середньоквадратичного відхилення, оцінка дисперсії, оцінка коефіцієнта асиметрії, оцінку коефіцієнта ексцесу, мінімальне та максимальне вибіркові значення. Середнє (Mean) – середнє значення ряду даних. Середнє — це «центр тяжіння» розподілу, і кожне значення дає внесок у визначення середнього значення, коли поширення значень є симетричними довкола центральної точки. Медіана (Median) – це значення, що ділить впорядкований ряд навпіл. Дисперсія (Variance) є мірою відхилення значень випадкової величини від центру розподілу (середнього). Середньоквадратичне відхилення (Standard Deviation) – це позитивний квадратний корінь з дисперсії. Коефіцієнт асиметрії (Skewness) – числова характеристика розподілу ймовірностей дійсної випадкової величини. Коефіцієнт ексцесу (Kurtosis) – числова характеристика розподілу ймовірностей дійсної випадкової величини. Коефіцієнт ексцесу характеризує «крутість», тобто, стрімкість підвищення кривої розподілу у порівнянні з нормальною кривою. Рис. 1.7. Рис. 1.8. Рис. 1.9. Відображення показника Математичне сподівання для 1-групи та 2-групи Висновки У даній лабораторній роботі відбулось ознайомлення з можливостями і основними принципами роботи в пакеті Statistica. Було проведено графічний розвідувальний аналіз даних, а саме побудовано категаризовані гістограмм та радіальні діаграми засобами пакету Statistica. Також здійснено розрахунок параметрів описової статистики за допомогою модуля Descriptive statistics (Описова статистика). |