М. дослідження

Покажчик змісту

Вступ

При аналізі даних, зібраних для розслідування, вибір відповідного методу аналізу має вирішальне значення, щоб уникнути помилкових висновків. Вибір найбільш підходящої техніки аналізу повинен бути зроблений з урахуванням різних аспектів, пов'язаних із конструкцією дослідження та характером даних, що підлягають кількісному вимірюванню. Кількість груп спостережень, що підлягають порівнянню, характер тих самих (залежно від того, незалежні вони чи повторні спостереження за тими самими особами), тип даних (безперервні/якісні змінні) або їх розподіл ймовірності є визначальними елементами для час дізнатися про статистичні методи, які можна використовувати.

інветигаці

При аналізі кількісних даних статистичні методи, найбільш відомі та застосовувані на практиці, такі як t-тест Стьюдента або дисперсійний аналіз, ґрунтуються на припущеннях, які не завжди перевіряються наявними даними. Таким чином, прийнято вважати, що цікава змінна слід, наприклад, за гауссовим розподілом. Коли відсутність нормальності очевидна або не може бути повністю передбачена зменшеним обсягом вибірки, перетворення змінної, що цікавить (наприклад, логарифмічне перетворення), як правило, використовується для симетризації її розподілу або виправдання використання методів звичного вдавання до їх міцності (тобто низької чутливості до відсутності нормальності). Існують і інші методи, які зазвичай називають непараметричними, які не вимагають такого типу гіпотези щодо розподілу даних, їх легко реалізувати і їх можна обчислити навіть при невеликих розмірах вибірки. У цій роботі будуть описані деякі непараметричні методи, які найбільш часто використовуються на практиці.

Дві незалежні вибірки: тест Манна-Уітні та тест суми рангу Вілкоксона

У багатьох ситуаціях бажано перевірити, чи є розподіл змінної X рівним у двох сукупностях, чи зазначена змінна має тенденцію бути більшою (або меншою) в одній з двох груп, виходячи з даних вибірки. Наприклад, може бути цікавим порівняти втрату ваги у пацієнтів, які дотримуються двох різних дієт, або рівень болю у пацієнтів з остеоартритом, які отримують лікування порівняно з плацебо. У "традиційній" статистичній теорії тестом, який застосовувався б для такого типу порівняння, був би тест t Стьюдента для двох незалежних вибірок, тобто U-тест Манна-Уітні або несимвольні тести за сумою рангу Вількоксона. Параметричні еквіваленти що також може бути використано у цій ситуації.

Припустимо більш формальним чином, що існують спостереження однієї і тієї ж змінної X (втрата ваги, оцінка болю тощо) у двох різних популяціях на зразках розмірами n1 та n2 відповідно:

Населення 1:
Населення 2:

Інтуїтивний спосіб продовжити - упорядкувати отримані спостереження, незалежно від їх популяції, від найнижчого до найвищого значення та призначити діапазони для упорядкованих таким чином даних. Таким чином, спостереженню з меншим значенням присвоюється ранг 1, наступний ранг 2 тощо. У разі зв’язку (якщо два або більше спостережень збігаються за значенням), кожному з цих спостережень буде присвоєно середнє значення діапазонів, яке було б призначено, якби не було зв’язку.

Якщо немає відмінностей у розподілі між двома популяціями, діапазони слід випадково змішувати між двома вибірками. З іншого боку, якщо сума діапазонів, присвоєних спостереженням однієї з популяцій, набагато більша за суму діапазонів, призначених спостереженням іншої сукупності, це вказувало б на різницю у розподілі змінної X між обома.

Позначимо через ранг, присвоєний кожному з доступних спостережень. Суму рангів в одній із сукупностей ми будемо розглядати як статистику контрасту для тесту суми рангу Вілкоксона:

Розподіл ймовірностей попередньої статистики складено в таблицях для малих розмірів вибірки та за відсутності зв'язків (Таблиця 1). Таким чином, таблицю 1 корисно знати, чи є результат значним двостороннім при роботі з 95% достовірністю та розміром вибірки ≤15.

Для більших розмірів вибірки (> 15) доцільно використовувати нормальне наближення, отримуючи від T змінну:

де і - середнє та стандартне відхилення T, якщо нульова гіпотеза відповідає дійсності, і задаються наступними формулами:

Y

Кількість зв'язків також має бути невеликою по відношенню до загальної кількості спостережень. У випадку зв’язків дисперсію статистики T потрібно змінити, щоб попередній вираз був таким:

Отримавши значення z, його слід віднести до таблиць нормального розподілу, щоб отримати відповідне значення значимості.

Щоб проілюструвати використання цього тесту, ми розглянемо дані в таблиці 2, що відповідають значенням вимірювання болю (за шкалою від 0 до 10) у двох групах з 11 пацієнтів, які проходили дві різні анальгетичні процедури. У цьому випадку n1 = n2 = 11. Сума діапазонів, призначених для спостережень першої групи, дорівнює Т = 171, і її середнє значення

Оскільки сума отриманих звань перевищує очікувану, ми будемо вважати T = 171-126,5 = 44,5 остаточною статистикою, і ми віднесемо її до значень, наведених у Таблиці 1. Працюючи з двостороннім підходом та 95% безпекою, область відторгнення відповідає значенням Т, меншим або рівним 96, для яких нульова гіпотеза рівного рівня болю в обох групах лікування буде відхилена за допомогою рівня значущості р-тесту суми рангу Вілкоксона з U-критерієм Манна-Уітні ім'я. Насправді це два різні тести, хоча по суті еквівалентні один одному. Для розрахунку тесту Манна-Уітні U замість суми рангів будуть розраховані значення:

U12: кількість пар, для яких спостереження з першої популяції менше, ніж спостереження з другої популяції, .

U21: кількість пар, для яких спостереження з першої сукупності перевищує спостереження з другої сукупності, .

У разі рівного результату, у кожну з вищезазначених сум буде зараховано 0,5 вищих одиниць. Подібно до того, що сталося з попереднім тестом, низькі значення U12 означатимуть різницю до вищих значень змінної в першій сукупності, тоді як високі значення означатимуть, що вони, як правило, вищі у друге населення.

Вищевказані параметри пов'язані зі статистикою T, описаною вище, за допомогою наступного рівняння:

Таким чином, із статистики U можна негайно отримати значення статистики Вілкоксона, а попередню методологію використати для отримання відповідного значення значимості. Насправді більшість статистичних програм, таких як SPSS, показують у своїх результатах значення обох статистичних даних, разом із загальним значенням p, або розрахованим з асимптотичного наближення через нормальний розподіл, або з відповідних таблиць, виправляючи можливість зв'язків. Іншим еквівалентним тестом, хоча і менш відомим, є S Кендалла, розрахований за S = U12- U21.

Нарешті, сказати, що так само, як дисперсійний аналіз «традиційного» статистичного підходу поширює критерій Стьюдента на випадок, коли слід порівнювати більше двох груп, тест Крускалла-Уолліса є природним продовженням Тест Уітні на цю ситуацію. Для його обчислення отримані N спостережень будуть впорядковані, незалежно від популяції їх походження, від найнижчого до найвищого значення і будуть призначені відповідні діапазони. Статистика контрасту для тесту Крускалла-Уолліса буде дана:

де N позначає загальну кількість спостережень у k групах, що порівнюються, це середнє значення діапазонів спостережень i-ї групи та середнє всіх діапазонів. Таким чином, статистика H відповідає розподілу з k-1 ступенями свободи.

Два зв’язані зразки: тест на знаки та тест на підписання суми рангу за Уілкоксоном

Інша дуже часта ситуація - ситуація, коли бажано порівняти розподіл змінної X у двох вибірках спарених випадків, як правило, на одних і тих самих людей у ​​два різні моменти часу. Наприклад, вам може знадобитися порівняти рівень болю в суглобі до та після лікування з інфільтраціями, або вагу до та після проходження програми схуднення. У цих ситуаціях логічно працювати з різницею у спостереженнях між двома моментами (втрата ваги, зниження рівня болю тощо):

де тут вони позначають спостережувані значення змінної X у n індивідуумів у перший момент і спостережувані значення у пізніший момент.

Простий спосіб продовжити - підрахувати число r позитивних різниць і число s негативних різниць (не враховуючи 0 значень). За нульової гіпотези про відсутність різниць однаково ймовірно буде отримати позитивну чи негативну різницю, тому обидва значення будуть розподілені відповідно до біноміального розподілу параметрів Bi (r + s, 1/2). Використовуючи таблиці біноміального розподілу, ми можемо отримати з r (або, що еквівалентно, з s), точне пов'язане значення значимості (табл. 3).

Як приклад, ми використаємо дані в таблиці 4, яка показує втрату ваги, досягнуту 20 суб'єктами, які проходили програму схуднення. Кількість позитивних спостережень (пацієнти, які фактично схудли) становить r = 14, тоді як кількість негативних спостережень (пацієнти, які набрали вагу) s = 6. Посилаючись на ці значення до значень біноміального розподілу параметрів Bi (20,1/2), отримують значення p = 2x0,058 = 0,116, тому не можна зробити висновок про значну втрату ваги у досліджуваних пацієнтів.

Для великих розмірів зразків (n≥20) у якості тестової статистики можна використовувати наступне:

який приблизно дотримуватиметься стандартного нормального розподілу N (0,1).

У наведеному вище прикладі:

Якщо ми віднесемо отримане значення до функції ймовірності розподілу N (0,1), то отримаємо p = 0,075, не приводячи до значущого значення, як це сталося з наближенням до бінома.

Тест на ознаки, як називають щойно описаний тест, представляє як основне обмеження той факт, що він не враховує величину (позитивну чи негативну) спостережень. Таким чином, може трапитися так, що є багато позитивних відмінностей, але невеликої величини (пацієнти, які втрачають вагу, але в невеликому обсязі) і небагато негативних відмінностей, але мають набагато більше значення (пацієнти, які набирають багато ваги). Цей тип ситуації повинен зменшити можливість виявлення значних відмінностей між спостереженнями.

Підписаний тест Уїлкоксона на суму рангу враховує вищезазначений недолік. Спостереження впорядковуються від найнижчого до найвищого абсолютного значення і їм присвоюються ранги (ігноруючи нульові значення і діючи так само, як у випадку тесту на суми рангів перед зв’язками). Сума T + діапазонів, присвоєних позитивним значенням, або T-сума діапазонів, призначених негативним значенням, буде використана як статистика контрасту. Для малих значень n розподіл T + і T- повністю подано в таблиці, і його можна використовувати для отримання критичних значень тесту (табл. 5). У випадку великих зразків (n≥20) розподіл T + і T- може бути апроксимований розподілом нормальної змінної. Таким чином, виконуючи перетворення:

пов'язаний розподіл - це розподіл стандартної нормалі (де n '- кількість ненульових спостережень).

Як і в тесті суми рангів для незалежних зразків, у разі рівного значення дисперсія статистики змінюється, і слід внести певну корекцію в попередній вираз. Подібним чином, критичні значення в таблиці 5 для випадку зв'язків, як правило, є дещо консервативними, тобто при зв'язках нульова гіпотеза про відсутність відмінностей, як правило, буде прийнята, коли насправді її слід відкинути.

Додано

N1 визначається як найменший розмір вибірки,. T обчислюється як сума діапазонів, призначених спостереженням у зразку 1. Так, беремо .
Результат є значним на 5% двосторонньому рівні, якщо T менше або дорівнює табличному значенню.


k