Поняття та розрахунки в математичній статистиці

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

  1. Яка шкала називається шкалою відносин? Наведіть приклади

Шкала відносин або шкала рівних відносин - найбільш часто використовувана в природних науках і, насамперед, у фізиці. Це ще більш гнучка шкала, тут крім визначення рівності, рангового порядку, рівності інтервалів відомо ще й рівність відносин. Шкала відносин дозволяє визначити не тільки, на скільки більше (менше) один об'єкт іншого щодо вимірюваного властивості, а й у скільки разів більше (менше).

Наприклад, для чотирьох об'єктів з відгуками 3, 4, 6 і 8 виконується відношення 3 / 4 = 6 / 8. Це обумовлено тим, що в шкала відносин на відміну від інтервальної шкали, нульове значення відгуку вказує на повну відсутність вимірюваної властивості.

2. Стратифікована, або розщеплену, вибірка

(Stratified sampling) - це процес, що складається з двох етапів, в якому сукупність ділиться на підгрупи (верстви, страти, strata). Шари повинні взаємно виключати і взаємно доповнювати один одного, щоб кожен елемент сукупності ставився до одного і тільки одного шару, і жоден елемент не був упущений. Далі, з кожного шару випадковим чином вибираються елементи, при цьому зазвичай використовується метод простий випадкової вибірки. Формально, вибір елементів із кожного шару може здійснюватися тільки за допомогою SRS. Однак на практиці іноді застосовується систематичний відбір та інші імовірнісні вибіркові методи. Відмінність стратифікованої вибірки від квотною полягає в тому, що елементи в ній вибираються скоріше випадково, а не з зручності або на підставі думки дослідника. Головне завдання стратифікованої вибірки - збільшення точності без збільшення витрат.

Стратифікаційний метод забезпечує наявність у вибірці всіх важливих підгруп. Це особливо важливо, якщо досліджувана характеристика нерівномірно розподілена серед елементів генеральної сукупності. Наприклад, розподіл доходу сімей нерівномірно, оскільки річний дохід більшості сімей складає менше 50 тисяч доларів, і лише деякі сім'ї мають річний дохід, що дорівнює 125 тисяч доларів і вище. Якщо застосувати просту випадкову вибірку, сім'ї з доходом 125 тисяч доларів і вище можуть не бути адекватно представлені. Стратифікована вибірка дозволяє забезпечити відповідну кількість таких сімей у вибірці. Вона поєднує в собі простоту методу SRS з можливістю підвищення точності. Тому даний метод формування вибірки

  1. Медіана

один з показників центру розподілу для порядкових і кількісних змінних; позначається Ме. Являє собою значення змінної, яке ділить вибірку навпіл таким чином, щоб для 50% об'єктів з вибірки значення змінної не перевершували Ме, а для інших 50% об'єктів - були не менше, ніж Ме.

  1. Охарактеризуйте поняття «потужність критерію»

Для визначення поняття потужності критерію введемо поняття альтернативної гіпотези H 1, тобто гіпотези, яка виконується, якщо не виконується нульова гіпотеза H 0. Тоді в термінах правильності чи помилковості прийняття H 0 і H 1 можна вказати чотири потенційно можливих результату застосування критерію до вибірки, представлені в табл. 3. Як ми бачимо потужність критерію - це ймовірність прийняття при застосуванні цього критерію альтернативної гіпотези H 1 за умови, що вона вірна. Очевидно, що при фіксованій помилку 1-го роду (її ми задаємо самі, і вона не залежить від властивостей критерію) критерій буде тим краще, чим більше його потужність (тобто чим менше помилка 2-го роду).

Проведемо наступні розгляду для того, щоб формально визначити поняття потужності критерію. Критерій розбиває вибіркове простір на два додаткових безлічі (Безліч точок, для яких гіпотеза приймається) і . (Безліч точок, для яких гіпотеза відкидається). Безліч називають областю прийняття гіпотези, а - Областю її відхилення чи критичної областю. Ймовірність попадання вибірки в критичну область при заданій функції распеределенія, називають функцією потужності критерію. Якщо альтернативною до випробуваної є проста гіпотеза, то вона однозначно визначає распеределеніе. Значення функції потужності для цього розподілу називають потужністю критерію.

Повернемося до розгляду приклада з оцінкою ймовірності правильної класифікації. Помилка першого роду полягає в тому, що, коли ймовірність правильної класифікації дійсно дорівнює , Число правильних классіфкацій . Значення помилки першого роду може бути обчислено наступним чином:

Помилка другого роду полягає в тому, що при ймовірності правильної класифікації , Число правильних класифікацій . Ця ймовірність обчислюється за формулою:



Якщо заданий рівень значимості , То порогове значення , Що задає критичну область, визначається з нерівності:

Функція потужності критерію - це ймовірність попадання в критичну область:

Нехай тепер альтернативної гіпотезою для : буде проста гіпотеза : ., Тоді потужність критерію, рівна ймовірності попадання в критичну область, коли вірна альтернативна гіпотеза, обчислюється б за формулою.

.

Імовірність помилки другого роду дорівнює в цьому випадку дорівнює .



  1. Охарактеризуйте термін процентилі

Процентиль (цей термін був вперше використаний Галтон в 1885 р.) розподілу - це таке число x p, що значення p-ї частини сукупності менше або дорівнюють x p. Наприклад, 25-а процентиль (також звана квантиль 0.25 або нижньої квартиль) змінної - це таке значення (x p), що 25% (p) значень змінної потрапляють нижче цього значення.

Аналогічним чином обчислюється 75-я процентиль (також звана квантиль 0.75 або верхньої квартиль) - таке значення, нижче якого потрапляють 75% значень змінної. Спосіб розрахунку процентиль можна задати на вкладці Загальні настройки в діалоговому вікні Параметри за замовчуванням (це вікно викликається натисканням кнопки Параметри в меню Сервіс).

  1. Якщо коефіцієнт кореляції позитивний, то між досліджуваними величинами є пряма залежність

  1. Коли необхідно використовувати поняття «зона значущості»?

Поняття «зона значимості« використовується при оцінці випробувань при використанні різних критеріїв (наприклад. G-критерій), коли отримується число потрапляє в зону. Коли приймається альтернативна гіпотеза.

  1. Вирішити задачу, використовуючи парний критерій тенденцій Т-Вілкоксона

У 19 піддослідних визначили кількість помилок при виконанні коректурної проби до і після корекційних вправ. Психолог визначає чи буде зменшуватися кількість помилок уваги у респондентів після спеціальних корекційних вправ.



До

24

12

42

30

40

55

50

52

50

22

після

22

12

41

31

32

44

50

32

32

21

До

33

78

79

25

28

16

17

12

25

Після

34

56

78

23

22

12

16

18

25

Рішення

1. перевіримо здійснимість обмежень: 5 ≤ 19 ≤ 50;

2. запишемо дані в таблицю і зробимо необхідні обчислення:

випробувальний.

Замір 1

Замір 2

di = «після» - «до»

| Di |

Ранг | di |

Ранг «нетипов."

1

24

22

-2

2

7,5

7,5

2

12

12

0

0



3

42

41

-1

1

3,5

3,5

4

30

31

1

1

3.5


5

40

32

-8

8

12

12

6

55

44

-11

11

13

13

7

50

50

0

0



8

52

32

-20

20

15

15

9

50

32

-18

18

14

14

10

22

21

-1

1

3,5

3,5

11

33

34

1

1

3,5


12

78

56

-22

22

16

16

13

79

78

-1

1

3,5

3,5

14

25

23

-2

2

7.5

7.5

15

28

22

-6

6

3,5

3,5

16

16

12

-4

4

3,5

3,5

17

17

16

-1

1

3,5

3,5

18

12

18

6

6

3,5


19

25

25

0

0



Суми

-

-

-

-

151

106

Виключимо нульові зрушення і підрахуємо новий обсяг вибірки: n .= 19-3 = 16;



3. запишемо модулі зрушень в ряд по зростанню і вкажемо їх місця в цьому ряду, а потім припишемо відповідні ранги:

випробувальний.

| Di |

Ранг | di |

1

1

3,5

2

1

3,5

3

1

3,5

4

1

3,5

5

1

3,5

6

1

3,5

7

2

7,5

8

2

7,5

9

4

9

10

6

10

11

6

11

12

8

12

13

11

13

14

18

14

15

20

15

16

22

16

Суми


151

4. визначимо, які зрушення є «типовими», а які - «нетиповими». Позитивних зрушень більше, їх шість, значить, вони «типові». Негативних - менше, їх всього два, значить, вони «нетипові»;

5. сформулюємо гіпотези:

Н 0: інтенсивність зсуву в типовому напрямку не перевершує інтенсивність зсуву в нетиповому напрямку;

Н 1: інтенсивність зсуву в типовому напрямку перевершує інтенсивність зсуву в нетиповому напрямі.

6. підрахуємо Т ЕМП. = Σ R нетипов. = 106;

7. по числу n і таблиці 2 додатка знайдемо Т кр. (P ≤ 0,05) = 5 і Т кр. (P ≤ 0,0 1) = 1. Побудуємо вісь значимості і відзначимо на ній всі знайдені значення:




зона значимості зона невизначеності зона не значимості

T кр. (P ≤ 0,01) Т ЕМП. T кр. (P ≤ 0,05)

Так як Т ЕМП. <Т кр. (P ≤ 0,05), то Н 0 відхиляється і приймається Н 1, на рівні значущості p ≤ 0,05, тобто зрушення в типовому напрямку більш інтенсивний, ніж зрушення в нетиповому напрямі, що ми можемо стверджувати з імовірністю, більше 95 %.

Відповідь

Навчання можна вважати ефективним (з ймовірністю, більшою 95%).

  1. Розв'яжіть задачу, використовуючи критерій Фішера

Психолог провів експеримент, в якому з'ясувалося, що з 23 учнів математичної спецшколи 15 впоралися із завданням, а з 28 звичайної школи з тими ж завданнями впорався 11 осіб. Чи можна вважати, що відмінності в успішності вирішення завдань учнями спецшколи і звичайної школи достовірними?

Рішення

1. перевіримо здійснимість обмежень:

(N 1 = 23> 5 і n 2 = 28> 5);



2. розділимо групи дітей на частини за допомогою ознаки «впорався із завданням" і "не впорався з завданням». Заповнимо таблицю:

«Є ефект»

«Ні ефекту»

Сума

Спецшкола

15

8

23

Звичайна школа

11

17

28

3. підраховуємо процентні частки кількості дітей, «впоралися з завданням» в експериментальній і контрольній групах. В експериментальній групі 23 людини, які становлять 100%, з них впоралися із завданням 15 осіб, вони становлять 60%.

Значить, не впоралися із завданням в експериментальній групі 100% -60% = 40%.

Аналогічно, в контрольній групі 28 осіб, які становлять 100%, з них впоралися із завданням 11 осіб, які становлять 39%.

Тоді частка, не впоралися із завданням в контрольній групі дорівнює 61%.

Заповнимо четирехклеточную таблицю:

«Є ефект»

«Ні ефекту»

Спецшкола

60%

40%

Звичайна школа

39%

61%

Звідси видно, що жодна з процентних часток не дорівнює нулю.

4. Сформулюємо гіпотези:

Н 0: частка випробовуваних в експериментальній групі, у яких «є ефект», не перевершує частки таких же випробовуваних в контрольній групі;

Н 1: частка випробовуваних в експериментальній групі, у яких «є ефект», переважає частку таких же випробовуваних в контрольній групі.

5. за таблицею 3.1 додатка знайти значення φ 1 і φ 2 по процентному змісту тих піддослідних, у яких «є ефект»:



φ 1 (60%) = 1,772;

φ 2 (39%) = 1,369.

6. підрахуємо

φ ЕМП. = (Φ1 - φ2) √ n 1 * n 2 = (1,772 - 1,369) √ 23 * 28 = 1,43;

n 1 + n 23 лютого + 28

7. за таблицею 3.2 додатка знайдемо рівень значимості відмінності процентних часток: φ ЕМП. = 1,43 відповідає рівню значущості p = 0,09.

Для практики цей рівень малий, тому слід порівняти φ ЕМП. з φ кр. (P ≤ 0,05) = 1,64 і φ кр. (P ≤ 0,01) = 2,31 (їх теж знайти по таблиці 3.2 додатка).

Вісь значущості має наступний вигляд:


зона значимості зона невизначеності зона не значимості

1,34 1,64 2,31

φ ЕМП. φ кр. (P ≤ 0,05) φ кр. (P = 0,01)

Так як φ ЕМП. кр. (P ≤ 0,05), а тим більше φ ЕМП. кр. (P ≤ 0,01), то приймається Н 0 з ймовірністю ≥ 99%.

Частка дітей в експериментальній групі, які впоралися із завданням, не вище, ніж частка таких дітей у контрольній групі. Статистично такий відсоток відмінностей недостатній (хоча, на перший погляд, різниця в показниках у них велика - 20%).



Відповідь

Відмінності в результатах груп статистично незначні.

  1. Охарактеризуйте поняття «регресійний аналіз»

Завдання регресійного аналізу лежать у сфері встановлення форми залежності, визначення функції регресії, використання рівняння для оцінки невідомих значенні залежною змінною.

Метод множинної регресії використовувався для оцінки функції попиту. Економічні тимчасові ряди досліджувалися для виявлення бізнес-циклів і циклічних процесів в економіці. У динаміці різних елементів економіки є такі показники, зміна яких розвивається з випередженням деяких інших показників, і тому вони можуть розглядатися як передвісники відповідних змін відстаючих показників (основа концепції економічних барометрів), дозволяючи вирішувати завдання прогнозу.

15

Додати в блог або на сайт

Цей текст може містити помилки.

Математика | Контрольна робота
54.5кб. | скачати


Схожі роботи:
Курсова по статистиці
Абсолютні величини в статистиці
Метод середніх величин у статистиці
Статистичне спостереження у правовій статистиці
Середньозважені індекси їх застосування в статистиці
Розподіл спостереження і залежність в статистиці
Об єкти статистичного спостереження у правовій статистиці
Особливості застосування варіаційних рядів в статистиці
Індекси у статистиці суть принципи обчислення
© Усі права захищені
написати до нас