Тести гіпотез Параметричні тести Економічна статистика Тести гіпотез Параметричні тести
Параметричні тести Двовибіркові тести
Двовиборні випробування Двовиборні випробування, включаючи спеціальні випробування парних зразків, можуть бути використані для дослідження питання, чи відрізняються досліджувані параметри (очікувані значення, стандартні відхилення) у двох різних наборах (наприклад, різні зміни, машини тощо). ). один від одного. Двовиборчі тести використовуються для порівняння двох популяцій між собою. Населення може відрізнятися в часі, просторі чи будь-якому іншому відношенні. Тест із двома вибірками на відповідність дисперсіям популяції Пара вибірки, тест на різницю в очікуваних значеннях Два незалежних вибірки на відповідність очікуваним значенням z-, відповідно. t-тест
Тести з двома зразками - тест для порівняння стандартних відхилень сукупності Умова застосування: нормально розподілений, незалежний базис сукупностей Нульова гіпотеза: Контргіпотеза: H1: 12> 22 Тестова функція F-розподілена (DF1, DF2, DF1,2 = n1,2 -1) застосовуються до одностороннього тесту (наводяться критичні значення F, DF1, DF2) Виправлені емпіричні стандартні відхилення зразків елементів n1 та n2, взяті з двох основних розподілів, є неупередженими оцінками базові стандартні відхилення сукупності. де s1 * 2> s2 * 2
Приклад І чоловіки, і жінки ходять до перукаря. Для 12 випадково відібраних чоловіків та 15 випадково відібраних жінок ми виміряли тривалість служби за нормальним розподілом. Для чоловіків середній час користування послугою становить 35 хвилин із стандартним відхиленням 26 хвилин. Для жінок середній час на зачіску становить 48 хвилин з розподілом 30 хвилин. Ми перевіряємо на рівні 5% значущості, чи є різниця між стандартним відхиленням часу служби для чоловіків та жінок! Рішення: багатовимірний тест зі стандартним відхиленням із двома зразками Гіпотези:
Приклад Визначення розрахункового значення: Визначення критичного значення: α = 5% DFженщина = 15-1 = 14 = DF1 DFman = 12-1 = 11 = DF2 Fkrit = 2,72 Оскільки розрахункове значення (1,33) менше критичного значення (2,72 ), тож ми не маємо права відкинути нульову гіпотезу на рівні 5% значущості, тобто немає суттєвої різниці між стандартним відхиленням часу служби чоловіків та жінок.
Приклад Індекс сподобань двох фільмів порівнює інститут опитування. Для першого фільму «Роман дівчинки» було відібрано 104 предмети, з них 40 жінок. Середнє значення балів становило 65, а стандартне відхилення - 3,6 у вибірці. Жах c. для фільму відібрано 140 одиниць зразка, в якому кількість чоловіків становила 96, середній бал тут - 74, а стандартне відхилення - 4,4. Можна припустити нормальний розподіл балів в обох групах. Ми перевіряємо на рівні значущості 1%, чи є різниця між стандартними відхиленнями балів для двох фільмів! Рішення: Оскільки можна припустити нормальність оцінок, наданих фільму, ми можемо використовувати F-тест для вивчення відповідності стандартних відхилень сукупності. Позначаємо індексом 1 жах c. фільм з індексом 2 Роман дівчини c. фільм.
Приклад Визначення розрахункового значення: Визначення критичного значення: α = 1% DF1 = 140-1 = 139 DF2 = 104-1 = 103 Fkrit = 1,53 Оскільки розрахункове значення (1,449) менше критичного значення (1,53), тому ми не маємо права відкинути нульову гіпотезу на рівні 1% значущості, тобто немає значної різниці між стандартними відхиленнями балів для двох фільмів.
Тести з двома зразками - тести для порівняння очікуваних значень популяції НЕЗАЛЕЖНІ ЗРАЗКИ Залежно від умов використання, існує два типи тестів: двовибірковий z-тест, якщо ми знаємо основні стандартні відхилення популяції (1 та 2) або якщо ми не знаємо, але працюємо з великою вибіркою (n1,2> 30, а невідомі дисперсії сукупності оцінюються з виправленими емпіричними дисперсіями), двовибірковий t-тест, якщо ми не знаємо дисперсій популяції і маємо невеликі вибірки.: H0: 1 = 2 (тобто обидва очікувані значення сукупності рівні) Можливі зустрічні гіпотези: H1: 1 ≠ μ2 H1: 1> μ2 H1: 1 2 zsz -z
Приклад Погляньмо ще раз на наш попередній приклад порівняння показників уподобань двох фільмів. А тепер давайте перевіримо рівень значущості 1%, щоб побачити, чи є різниця між середніми оцінками сподобань двох фільмів! Нагадуємо, для першого фільму «Роман дівчинки» було відібрано 104 предмети, з яких 40 жінок. Середнє значення балів становило 65, а стандартне відхилення - 3,6 у вибірці. Жах c. для фільму відібрано 140 одиниць зразка, в якому кількість чоловіків становила 96, середній бал тут - 74, а стандартне відхилення - 4,4. Можна припустити нормальний розподіл балів в обох групах. Рішення: Оскільки кількість зразків перевищує 30 для обох фільмів, і можна припустити нормальний розподіл балів, можна використовувати z-тест із двох зразків (Індекс 1 - Жах, Індекс 2 - Роман Дівчини) .
Приклад Оскільки розраховане значення не знаходиться в діапазоні прийнятності, існує значна різниця на рівні 1% значущості між показниками сподобань двох плівок. Гіпотези: H0: 1 = 2 H1: 1 ≠ 2 Визначення розрахункового значення: Визначення критичних значень: α = 1% zα/2 = ± 2,58
Тести з двома зразками - тести для порівняння очікуваних значень популяції Двовибірковий t-тест Умова застосування: нормально розподілена сукупність, невідомі дисперсії популяції для невеликих зразків можна лікувати, якщо відомо, що невідомі стандартні відхилення рівні (F-TEST) Нульова гіпотеза: H0: 1 = 2 Можливі зустрічні гіпотези та діапазони прийняття: Тестова функція розподілена за Стьюдентом (DF = n1 + n2-2): H1: 1 ≠ 2 -t/2 2 tsz - t
Приклад Наш попередній приклад перукарського мистецтва (див. Тест на відповідність дисперсії популяції) досліджує, чи існує різниця між очікуваним значенням часу служби для чоловіків та жінок на рівні 5% значущості! жінки = 15 чоловіки = 12 Умови застосування двовибіркового t-критерію: нормальність розподілу населення (а саме розподіл часу служби є нормальним як для чоловіків, так і для жінок, це вже передбачалося при виконанні F -тест) відомий та жіночий чоловік Визначення розрахункового значення: Визначення критичного значення: α = 5% DF = 15 + 12-2 = 25 t0,95 = 1,708 Оскільки tsz = 1,185 μu (μe-μu> 0) Серійний номер обстеженої особи Вага тіла - дієта до Вага після дієти 1 95 90 2 75 72 3 110 100 4 81 5 92 88 6 83 7 94 93 8 82 9 105 99
Приклад номера дослідження Оскільки розраховане значення (1511) перевищує критичне значення (2896), нульова гіпотеза відхиляється, тобто існує значна різниця у масі тіла пацієнта до та після дієти. Визначення розрахункового значення: Критичне значення: α = 1% tα = 2896 Діапазон прийому: tsz 30, зразки незалежні H0: 1 = 2 H1: (1) 1 ≠ 2 (2) 1> 2 ( 3) 1 δ0) (μd s2 * 2 F-розподіл (DF1 = n1-1; DF2 = n2-1)
Багатовибіркові тести Багатовибіркові тести можуть бути використані для вивчення питання, чи відрізняються досліджувані параметри (очікувані значення, стандартні відхилення) також у декількох різних наборах (наприклад, різні зміни, машини тощо). Тести з кількома вибірками використовуються для порівняння більше двох популяцій. Порівняння кількох дисперсій популяції Порівняння очікуваного значення кількох популяцій (дисперсійний аналіз)
Тести з кількома вибірками - порівняння множинних стандартних відхилень популяції Тест Кокрана: ми можемо вирішити, чи можна вважати, що найбільше значення серед стандартних відхилень походить від того самого розподілу, що й інші. Умова застосування: нормально розподілені основні сукупності, зразки з однаковою кількістю n елементів (у нас r вибірок з r наборів) Нульова гіпотеза: Лічильник гіпотези: H1: не всі дисперсії однакові Функція тесту: DF = n-1 Діапазон прийому: gsz> Fkr, нульова гіпотеза 5% - на рівні значущості, тобто засобів і принаймні одне середнє суттєво відрізняється від інших. У нашому випадку це, звичайно, 3-й магазин, де сума, сплачена за одну покупку, в середньому менше половини середньої кількості інших двох магазинів. = 0,05 Ступінь свободи чисельника (DF1) = 2 Ступінь свободи знаменника (DF2) = 15 Критичне значення: Fkr = 3,68
Приклад Ми розглядаємо процедури схуднення, також протестовані за допомогою тесту Кокрана, щоб побачити, чи є різниця між окремими процедурами на рівні 5% значущості з точки зору ефективності! (тобто чи є такий, що призводить до більшої середньої втрати ваги, ніж інші?) Припустимо, що дисперсія втрат ваги, спричинених процедурами, вважається однаковою, тому ми можемо продовжити, досліджуючи узгодження очікуваних значень. Процедура Втрата ваги (кг) в середньому становить стандартні відхилення A 13 16 15 1 104 B 7 4 8 9 1368 C 12 6 10 1536 D 5 E 11 1187
H1: будь-які два очікувані значення не рівні між собою Приклад H1: будь-які два очікувані значення не рівні між собою Основне середнє: Оскільки обчислене значення більше критичного значення, нульова гіпотеза відхиляється. На рівні 5% значущості існує різниця між очікуваним значенням зниження ваги, спричиненого кожною процедурою схуднення, тобто, ймовірно, є одне, яке є більш ефективним, ніж інше. α = 5% DF1 = 4 DF2 = 20 Fkrit = 2,87 Процедура Втрата ваги (кг) в середньому становить стандартні відхилення A 13 16 15 1 104 B 7 4 8 9 1386 C 12 6 10 1,536 D 5 E 11 1187
Приклад - Збір завдань (37.) На бетонному заводі цемент закуповують на 4 цементних заводах (A, B, C, D). Якість цементу перевіряють виготовленням пробних кубиків. Відбір зразків вхідних партій "500 цементу", дані про міцність на стиск випробовуваних кубів [в кг/см2] такі: Постачальник A: 512, 716, 668, 726, 580 Постачальник B: Постачальник 516, 664, 614, 586, 590 C: 542, 684, 722, 600, 642 Постачальник D: 566, 744, 546, 610, 672. Чи існує різниця між постачальниками? (Тобто, чи існує різниця між очікуваними значеннями міцності на стиск цементу (кубиків), що постачається різними виробниками цементу?) Дисперсійний аналіз, якому передує тест Кокрана!
Приклад - Набір задач (37.) Вивчення схожості дисперсій популяції - Гіпотези тесту Кокрана: H0: A = B = D = C H1: найбільше середнє стандартне відхилення відрізняється для вибірки постачальника Середня корекція. харчування. стандартне відхилення A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 640.4 92, 113 594 53.5 638 70.44 627,6 81,06
Приклад - набір задач (37.) Тест Кокрана Визначення розрахункового значення Критичне значення: α = 5% n = 5 DF = 4 r = 4 gkrit = 0,63 Рішення: оскільки обчислене значення менше критичного значення, нульова гіпотеза є прийнято При рівні значущості 5% стандартні відхилення популяції однакові. Зразок постачальника Зразок Середня корекція харчування. стандартне відхилення A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 640.4 92, 113 594 53.5 638 70.44 81,06 627,6
Приклад. харчування. стандартне відхилення A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 640.4 92, 113 594 53.5 638 70.44 627,6 81,06
Приклад - Збір завдань (37.) Аналіз вибірки постачальника зразка Середня вибірка харчування. стандартне відхилення A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 640.4 92, 113 594 53.5 638 70.44 627,6 81,06