Економічна статистика Тести гіпотез Параметричні тести 19 листопада, 20 листопада, 26 листопада.

статистика

1. Формулювання нульової (H 0) та альтернативної (H 1) гіпотез 2. Пошук тестової функції, розподіл якої можна чітко визначити, припустивши правильність нульової гіпотези та враховуючи умови застосування тест. 3. Вибір рівня значущості (α) та розподіл можливого діапазону значень тестової функції на діапазони прийняття та відхилення. 4. Вибірка, на основі цього визначає числове значення тестової функції як змінну ймовірності. 5. Рішення щодо правильності гіпотез: - якщо значення тестової функції потрапляє в заданий діапазон прийняття, ми приймаємо нульову гіпотезу, - якщо значення тестової функції потрапляє в діапазон відхилення, ми відхиляємо нульову гіпотезу . Етапи перевірки гіпотез

Класифікація тестів  Що є предметом їх нульової гіпотези? - Тести на параметри та розподіл  Які умови застосування проти розподілу населення? - Умови застосування параметричних тестів включають вимоги до типу та певних параметрів розподілу сукупності. - Використання непараметричних тестів вимагає щонайбільше безперервності розподілу сукупності.  Скільки та скільки вибірок потрібно для їх реалізації ? - Одиночні, подвійні або багаторазові випробування - Незалежні та рівномірні зразки - Тести на малі та великі зразки (межа n = 30)

Параметричні тести  Параметричні тести вимагають більш суворих умов застосування.  Пропорція або доступні дані зі шкали вимірювань на рівні інтервалу. Strength Їх сила (ймовірність відхилення помилкової нульової гіпотези) вища.  Тести на параметри нормального розподілу  Вони згруповані в: - Одинарна вибірка, дві вибірки, багато вибірки - Незалежна і рівна вибірка - Очікуване значення, стандартне відхилення, співвідношення сукупності

Tests Тести з однією вибіркою завжди використовуються для перевірки правильності припущень про характеристику даної сукупності. З цією метою характеристику, визначену з однієї доступної вибірки (середнє, стандартне відхилення), порівнюють із передбачуваною або бажаною умовою.  Таким чином, вони підходять для відповіді на питання, чи може сукупність, з якої походить вибірка, бути такою, як ми припускаємо в нульовій гіпотезі. - Тести на очікуване значення з однієї вибірки - Тест на стандартне відхилення популяції з однієї вибірки Тести на одну вибірку

Тести з однією вибіркою - тест на стандартне відхилення сукупності  Умови застосування: нормально розподілена сукупність  Нульова гіпотеза:  Можливі зустрічні гіпотези та діапазони прийняття: function Тестова функція χ має 2 розподіли (DF = n-1):

Приклад На ринку садових карликів середня висота карликів за останні десятиліття становила 120 см, однак дисперсія коливалась. Умовою передбачуваного постачання сировини є те, щоб стандартне відхилення не перевищувало 10 см. Торішнє опитування показало, що стандартне відхилення випадкової вибірки з 25 предметів становило 12 см. Нормальний розподіл висоти відомий. Перевірте з 95% надійністю, чи не загрожує постачання сировини? Рішення: n = 25  DF = 24 с * = 12 σ 0 = 10 Діапазон прийняття: Критичне значення: (α = 5%, DF = 24) ˂ Оскільки обчислене значення менше критичного значення, то 5% на рівень значущості, нульова гіпотеза є прийнятною, тобто немає суттєвої різниці щодо стандартного відхилення.

Приклад Погляньмо ще раз на приклад, який був використаний в авіації для припущення середньої маси тіла та дисперсії ваги пасажирів (див. Тест на придатність, де нормальність вже перевірена). Авіакомпанія планує навантаження на середню масу тіла 78 кг і стандартне відхилення 11 кг. Для перевірки гіпотези було виміряно вагу 100 випадково вибраних пасажирів, у тому числі 44 жінок. Результати вимірювань наведені в наступній таблиці. Характеристики, розраховані за зразком: На рівні значущості 5% ми зараз перевіряємо припущення про стандартне відхилення маси тіла пасажирів! Вага тіла (кг) Кількість клієнтів (осіб) Всього100

 Рішення: n = 100 (DF = 99)  Гіпотези: H 0: σ = 11kg H 1: σ> 11kg H 1: σ ≠ 11kg Приклад Діапазон прийнятності: Критичне значення: (α = 5%, DF = 99) ˂ Оскільки розраховане значення менше критичного, ми приймаємо нульову гіпотезу на рівні 5% значущості, тобто припущення про дисперсію популяції є прийнятним. Діапазон прийнятності: Критичні значення: (α/2 = 2,5%, DF = 99) Оскільки обчислене значення потрапляє між двома критичними значеннями, ми приймаємо нульову гіпотезу на рівні 5% значущості, тобто припущення про дисперсію популяції є прийнятним.

 Залежно від умов застосування існує два типи тестів: - z-тест з одним зразком , якщо ми знаємо дисперсію сукупності ( 0), або якщо ми її не знаємо, але працюємо з великою вибіркою (n> 30 і  0 оцінюється виправленим емпіричним стандартним відхиленням) - одновибірковий t-тест , якщо ми не знаємо стандартного відхилення сукупності і маємо невелику вибірку  Нульова гіпотеза: H 0:  = m 0, тобто, очікуване значення дорівнює заданому значенню m 0. Можливі зустрічні гіпотези: Тести з одним зразком - тест на багатовимірне очікуване значення H 1:  ≠ m 0 H 1: > m 0 H 1:  m 0 z sz 78kg H 1: μ ≠ 78kg Приклад Діапазон прийняття: Критичне значення: (α = 5%) ˂ Оскільки розраховане значення потрапляє між двома критичними значеннями, то приймається нульова гіпотеза, тобто при рівні значущості 5% прийнятно, щоб очікуване значення маси тіла пасажирів становило 78 кг . Діапазон прийнятності: Критичне значення: (α/2 = 2,5%) Оскільки розраховане значення (0,49) менше критичного значення, то приймається нульова гіпотеза, тобто при рівні значущості 5% прийнятно, щоб кількість популяції становила 78 кг.

Тести з одним зразком - t-тест з одним зразком  Умова застосування: нормально розподілена сукупність, невідоме стандартне відхилення сукупності (і невелика кількість зразків)  Нульова гіпотеза:  Контргіпотези та діапазони прийняття: function Тестова функція розподілена студентом (DF = n-1): H 0: m 0 H 1:  ≠ m 0 -t /2 m 0 t sz m 0 (3)  m 0 (3)  σ 0 (3) σ 30  один -вибірка z-тесту n = 200

 Гіпотези: H 0: μ = 299h H 1: μ> 299h Приклад - Збір завдань (27.) Діапазон прийняття: Критичне значення (α = 1%): Оскільки z sz 5 Приклад - Збір завдань (29.) Діапазон прийняття: Критичні значення: (α/2 = 0,05%, DF = 100) Оскільки розраховане значення знаходиться в межах відхилення, нульову гіпотезу можна відхилити, для виробника B стандартне відхилення розміру картоплі суттєво відрізняється (1%) від σ = 5 грам. Діапазон прийнятності: Критичне значення: (α = 1%, DF = 100) Оскільки розраховане значення знаходиться в межах відхилення, нульову гіпотезу можна відхилити, для виробника B стандартне відхилення розміру картоплі значно (на 1%) більше ніж 5 грам.

Автоматична машина для різання труб повинна вирізати шматки труб довжиною 1200 мм. Завдання перевірки в процесі - визначити, чи відповідають розміри деталей, вироблених машиною, технічним характеристикам. З попередніх даних відомо, що довжина відрізків труб, вироблених машиною, є нормально розподіленою змінною ймовірності зі стандартним відхиленням 3 мм. Для контролю в процесі було обрано 16 зразків. Довжина шматочків пробірок у зразку: а) Перевірте на рівні 5% значущості, щоб стандартне відхилення основного розподілу не перевищувало 3 мм! б) Перевірте, чи довжина виготовлених деталей відповідає технічним умовам! Приклад - Збірник завдань (30.)

Вивчіть на рівні 5% значущості, що стандартне відхилення базового розподілу не перевищує 3 мм на основі вибірки! Рішення: Тест на стандартне відхилення з однією вибіркою n = 16 Гіпотези: H 0: σ = 3 H 1: σ> 3 Приклад - Набір проблем (30.) Діапазон прийнятності: Критичне значення: (α = 5%, DF = 15) Оскільки обчислене значення є відхиленням, тому нульова гіпотеза відхиляється на рівні 5% значущості. Стандартне відхилення довжини відрізків труб перевищує 3 мм при рівні значущості 5%.

Переконайтеся, що довжина виготовлених деталей відповідає технічним умовам (1200 мм, 5%)! Рішення: одновибірковий t-тест (n  2 2  Тестова функція розподілена F (DF 1, DF 2, DF 1,2 = n 1,2 -1)  Наші таблиці також застосовуються до одностороннього тест (наведено F , DF 1, DF 2)  Виправлені емпіричні стандартні відхилення зразків з n 1 та n 2 елементами, взяті з двох основних розподілів, є неупередженими оцінками стандартних відхилень сукупності Двовиборчі тести - тест для порівняння стандартних відхилень популяції, де s 1 * 2> s 2 * 2

Приклад І чоловіки, і жінки ходять до перукаря. Для 12 випадково відібраних чоловіків та 15 випадково відібраних жінок ми виміряли тривалість служби за нормальним розподілом. Для чоловіків середній час користування послугою становить 35 хвилин із стандартним відхиленням 26 хвилин. Для жінок середній час на зачіску становить 48 хвилин з розподілом 30 хвилин. Ми перевіряємо на рівні 5% значущості, чи є різниця між стандартним відхиленням часу служби для чоловіків та жінок! Рішення: багатовимірний тест зі стандартним відхиленням із двома зразками Гіпотези:

Визначення розрахункового значення: Визначення критичного значення: α = 5% DF жіночий = 15-1 = 14 = DF 1 DF чоловічий = 12-1 = 11 = DF 2 F критичний = 2,72 Приклад Оскільки розрахункове значення (1,33), менше ніж критичне значення (2,72), тож ми не маємо права відхилити нульову гіпотезу на рівні 5% значущості, тобто немає значної різниці між стандартним відхиленням часу служби для чоловіків та жінок.

Індекс сподобань двох фільмів порівнює інститут опитування. Для першого фільму «Роман дівчинки» було відібрано 104 предмети, з них 40 жінок. Середнє значення балів становило 65, а стандартне відхилення - 3,6 у вибірці. Жах c. для фільму відібрано 140 одиниць зразка, в якому кількість чоловіків становила 96, середній бал тут - 74, а стандартне відхилення - 4,4. Можна припустити нормальний розподіл балів в обох групах. Ми перевіряємо на рівні значущості 1%, чи є різниця між стандартними відхиленнями балів для двох фільмів! Рішення: Оскільки можна припустити нормальність оцінок, наданих фільму, ми можемо використовувати F-тест для вивчення відповідності стандартних відхилень сукупності. Позначаємо індексом 1 жах c. фільм з індексом 2 Роман дівчини c. фільм. Приклад

Визначення розрахункового значення: Визначення критичного значення: α = 1% DF 1 = 140-1 = 139 DF 2 = 104-1 = 103 F крит = 1,53 Приклад Оскільки розраховане значення (1,449) менше критичного значення (1,53 ), тож ми не маємо права відкинути нульову гіпотезу на рівні значущості 1%, тобто немає значної різниці між стандартними відхиленнями оцінок, що даються для двох фільмів.

НЕЗАЛЕЖНІ ЗРАЗКИ Двовибіркові тести - тести для порівняння очікуваних значень сукупності  Залежно від умов використання, два типи тестів: - двовибірковий z-тест , якщо ми знаємо стандартні відхилення сукупності ( 1 та  2) або якщо ми не знаємо, але працюємо з великою вибіркою (n 1,2> 30, а невідомі дисперсії популяції оцінюються з виправленими емпіричними дисперсіями) - двовибірковий t-тест , якщо ми не знаємо дисперсій популяції і маємо малі зразки  Нульова гіпотеза: H 0:  1 =  2 (тобто очікуються дві сукупності) значення рівне)  Можливі зустрічні гіпотези: H 1:  1 ≠ μ 2 H 1:  1> μ 2 H 1:  1  2 z sz  2 t sz  чоловік  Визначення розрахункового значення:  Визначення критичного значення: α = 5% DF = = 25 t 0,95 = 1,708 Приклад Оскільки t sz = 1,185 μ u (μ e -μ u> 0) Приклад Серійний номер обстежуваного Вага тіла перед дієтою Вага тіла після дієти

 Визначення розрахункового значення:  Критичне значення: α = 1% t α = 2,896 range Діапазон прийому: t sz 30, зразки незалежні H 0:  1 =  2 H 1: (1)  1 ≠  2 (2 )  1>  2 (3)  1  2 (3)  1  2 (μ d> δ 0) (3)  1 s 2 * 2 F-розподіл (DF 1 = n 1 -1; DF 2 = n 2 -1)

Приклад - Збірник завдань (32.) Ми хочемо порівняти значення рН двох розчинів (А і В). Аналіз шестиелементної проби дав середній рН 7,52 з розчину А зі стандартним відхиленням 0,024. На основі зразка з п’яти зразків середній рН розчину В становив 7,49 при стандартному відхиленні 0,032. Дослідіть різницю в рН двох розчинів (α = 5%). Рішення: T-тест для набору з двох зразків очікуваних значень (n μ B (μ d> 0) Приклад - Набір проблем (31.)

 Визначення розрахункового значення:  Визначення критичного значення: DF = 4α = 5% t krit = 2,13  Діапазон прийнятності: t sz> F kr, нульова гіпотеза відхиляється на рівні 5% значущості, тобто засоби та принаймні одне середнє суттєво відрізняється від інших. У нашому випадку це, звичайно, 3-й магазин, де сума, сплачена за одну покупку, в середньому менше половини середньої кількості інших двох магазинів. 13.23

Давайте розглянемо процедури схуднення, також протестовані за допомогою тесту Кокрана, і з’ясуємо, чи є різниця між кожною процедурою на рівні 5% значущості щодо ефективності! (тобто, чи є такий, який призводить до більшої середньої втрати ваги, ніж інші?) Припустимо, що можна припустити дисперсію втрат ваги, спричинену процедурами, тому ми можемо продовжити вивчення узгодження очікуваних значень. Приклад Вага Ваги Втрати (кг) Середні розбіжності A, 22 B, 87 C, 36 D, 87 E, 41

 Основне середнє: Приклад H 1: будь-які два очікувані значення не рівні між собою Процедура Втрата ваги (кг) означає стандартні відхилення A, 22 B, 87 C, 36 D, 87 E, 41 α = 5% DF 1 = 4 DF 2 = 20 F крит = 2, 87 Оскільки розраховане значення більше критичного значення, нульова гіпотеза відхиляється. На рівні 5% значущості існує різниця між очікуваним значенням втрати ваги, спричиненої кожною процедурою схуднення, тобто, ймовірно, є одна, яка є більш ефективною, ніж інша.

На бетонному заводі цемент закуповують на 4 цементних заводах (A, B, C, D). Якість цементу перевіряють виготовленням пробних кубиків. Відбір зразків вхідних партій "500 цементу", дані про міцність на стиск випробовуваних кубів [у кг/см 2] такі: Постачальник A: 512, 716, 668, 726, 580 Постачальник B: 516, 664, 614, 586, Постачальник 590 C: 542, 684, 722, 600, 642 Постачальник D: 566, 744, 546, 610, 672. Чи існує різниця між постачальниками? (Тобто, чи існує різниця між очікуваними значеннями міцності на стиск цементу (кубиків), що постачається різними виробниками цементу?) Дисперсійний аналіз, якому передує тест Кокрана! Приклад - Збірник завдань (37.)

 Вивчення подібності дисперсій популяції - Гіпотези тесту Кокрана: H 0:  A =  B =  D =  C H 1: різниця з найбільшим стандартним відхиленням Приклад - Збір завдань (37.) Постачальник Зразок Зразок середній Corr. харчування. стандартне відхилення A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, 6 92,113 53,5 70,44 81,06

Test Тест Кокрана  Визначення розрахункового значення  Критичне значення: α = 5% n = 5 DF = 4r = 4g крит = 0,63  Рішення: оскільки обчислене значення менше критичного значення, ми приймаємо нульову гіпотезу, 5% - На рівні значущості стандартні відхилення популяції однакові. Приклад - Збір завдань (37.) Постачальник SampleSample AverageCorr. харчування. стандартне відхилення A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, 6 92,113 53,5 70,44 81,06

 Аналіз дисперсії  Гіпотези: H 0:  A =  B =  C =  D H 1: або два не є рівними Приклад - Збір завдань (37.) Постачальник Зразок Зразок середній Corr. харчування. стандартне відхилення A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, 6 92,113 53,5 70,44 81,06

 Приклад дисперсійного прикладу - Збір завдань (37.) Постачальник Зразок Зразок середній кор. харчування. стандартне відхилення A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, 6 92,113 53,5 70,44 81,06

Table Таблиця ANOVA Приклад - Набір задач (37.) Квадрати градусів Ступінь свободи Оцінка стандартного відхилення Значення F Між групами всередині групи - Разом, 57 r-1 = 4-1 = 3 Nr = 20-4 = 16 N-1 = 19  = 0,05 DF 1 = 3 DF 2 = 16 Критичне значення: F kr = 3,24 Оскільки F sz = 0,4 Зворотній зв'язок: Політика конфіденційності Зворотній зв'язок
Про Projectum: Умови використання SlidePlayer