М. дослідження

Покажчик змісту

Вступ

Зазвичай при цьому типі аналізу ми можемо встановити вихідну гіпотезу (нульову гіпотезу), яка, як правило, припускає, що цікавий ефект є нульовим, наприклад, що артеріальний тиск однаковий у чоловіків і жінок або що два способи лікування гіперхолестеринемії однаково ефективні. Пізніше можна оцінити ймовірність отримання спостережуваних даних, якщо ця гіпотеза є правильною. Значення цієї ймовірності збігається з р-значенням, наданим кожним статистичним тестом, так що чим нижче воно, тим менше ймовірність перевірки початкової гіпотези.

методи

У першому розділі буде представлений тест t Стьюдента для двох незалежних зразків, що вносить необхідні модифікації у випадку, коли мінливість обох груп відрізняється. Далі буде введено t-тест Стьюдента для випадку двох залежних зразків.

T студента для двох незалежних вибірок

Одним з найпоширеніших статистичних аналізів на практиці є, мабуть, той, який використовується для порівняння двох незалежних груп спостережень щодо числової змінної. Як приклад, давайте розглянемо дані, наведені в Таблиці 1, що відповідають 75 особам із надмірною вагою, яким піддавали дві різні дієти, так що ми хочемо порівняти вагу осіб, які починали кожну з дієт.

Як вже було висунуто, застосування параметричного тесту вимагає нормальності спостережень для кожної з груп. Перевірка цієї гіпотези може бути здійснена як графічними методами (за допомогою гістограм, графіків графіків або графіків нормальності), так і за допомогою статистичних тестів (тест Колмогорова-Смірнова, тест Шапіро-Вількса). Однак достатня кількість спостережень (скажімо, більше 30), як це відбувається в наведеному прикладі, виправдовує використання того самого www. Так само для цього типу методології буде потрібно, щоб відхилення в обох групах спостережень були однаковими. Перш за все, буде розроблений тест Стьюдента для випадку, коли обидві умови перевірені, пізніше буде обговорено, як офіційно вирішити той випадок, коли відхилення не є подібними.

Згідно з гіпотезами нормальності та рівної дисперсії порівняння обох груп може бути здійснено з точки зору одного параметра, такого як середнє значення (рис. 1а), так що у наведеному прикладі вихідною гіпотезою буде:

H0: Середня початкова вага однакова в обох групах

Це буде позначено < X 1, X 2. X n> і < Y 1, Y 2. Y m> до ваги, що спостерігається у кожного з суб'єктів, підданих дієті А та дієті В відповідно. Загалом, кількість спостережень у кожній із груп, що порівнюється, не буде збігатися, так що в прикладі n = 40 та m = 35.

Тест t для двох незалежних зразків базується на статистиці:

(1)

де e позначають середню вагу в кожній з груп:

та відповідні зразки квазіваріанів:

З яким, у цьому конкретному випадку, значення контрасту буде:

Якщо вихідна гіпотеза відповідає дійсності, статистика (1) буде відповідати розподілу Стьюдента з n + m-2 ступенями свободи. Якщо так, отримане значення повинно знаходитися в межах найвищої ймовірності відповідно до цього розподілу (рис. 2). Зазвичай діапазон даних, в якому зосереджено 95% ймовірності, береться за еталон. Значення р, про яке зазвичай повідомляють більшість статистичних пакетів, є не що інше, як ймовірність отримання, відповідно до цього розподілу, більш екстремальних даних, ніж надані www. Як уже зазначалося, це також відображає ймовірність отримання спостережуваних даних, якщо початкова гіпотеза була істинною. Якщо значення р дуже мало (зазвичай враховується р 0,05. У поданому прикладі відповідне значення р дорівнює 0,425, тому немає статистичних доказів того, що середня вага в обох групах різниться. У таблиці 2, градуси свободи (у першому стовпці) і значення α (у першому рядку). Число, яке визначає їх перетин, є відповідним критичним значенням. Таким чином, якщо отримана статистика приймає значення, тим більшим буде сказано, що різниця суттєва.

Інший спосіб отримати ту саму інформацію - це обчислення довірчих інтервалів для різниці середньої реакції в обох групах. На більш високих рівнях довірчий інтервал є мірою невизначеності, з якою оцінюється ця різниця за зразком, що дає можливість оцінити як статистичну значимість, так і клінічну величину цієї різниці. У цьому випадку довірчий інтервал буде подаватися як:

де позначає значення, яке відповідно до розподілу t Стьюдента з n + m-2 ступенями свободи залишає 2,5% даних праворуч. У цьому прикладі 95% довірчий інтервал для різниці у вазі визначається як:

що в кінцевому рахунку виражає діапазон значень, між якими можна знайти реальне значення різниці між вагами обох груп. Він також надає ту саму інформацію, яку ми отримали із статистичного контрасту. Той факт, що нульове значення належить інтервалу, свідчить про відсутність доказів того, що вага в обох групах різниться.

Зі збільшенням обсягу вибірки розподіл статистичних даних (1) стає ближчим до розподілу стандартної змінної Normal. Таким чином, у деяких текстах вибрано використовувати цей розподіл для порівняння засобів. Хоча це наближення є правильним для досить великих вибірок, обидва методи дають практично однакові результати в цьому випадку, полегшуючи використання, незалежно від розміру вибірки, однакової методології з розподілу t. Той самий підхід може бути використаний у випадку різних дисперсій або парних зразків.

Дві незалежні вибірки з різною дисперсією

У випадку, коли доступні дві групи незалежних спостережень з різними дисперсіями, розподіл даних у кожній групі не можна порівнювати лише з точки зору середнього значення (рис. 1b). Статистичний контраст, піднятий у попередньому розділі, вимагає певної модифікації, яка враховує мінливість даних у кожній сукупності. Очевидно, що першою проблемою, яку потрібно вирішити, є пошук статистичного методу, який дозволяє вирішити, однакова чи не є дисперсія в обох групах. Для вирішення цієї проблеми приходить F-тест або тест співвідношення дисперсій. За умови припущення, що дві популяції дотримуються нормального розподілу та мають однакову дисперсію, очікується співвідношення дисперсій:

дотримуйтесь розподілу Snedecor F з параметрами (n-1) та (m-1).

Припустимо, що в попередньому прикладі ми хочемо порівняти втрату ваги у суб’єктів, яким піддавали кожну з двох дієт. Застосування статистики (1) буде неможливим, оскільки відхилення в обох групах істотно різняться. У цьому випадку співвідношення дисперсій становить 3,97/0,80 = 4,96, значення, яке необхідно порівняти з розподілом F 39,34. Відповідне значення p буде p f ступенів свободи, що залежатиме від дисперсій вибірки відповідно до виразу:

Дві залежні зразки

Вже було прокоментовано, що коли йдеться про порівняння двох груп спостережень, важливо розрізняти випадок, коли вони незалежні від випадку, коли дані поєднуються. Залежні ряди зазвичай виникають, коли одні й ті ж дані оцінюються більше одного разу для кожного суб'єкта у вибірці. Ви також можете знайти цей тип спостереження в дослідженнях з контролем випадків, коли кожен випадок індивідуально поєднується з контролем.

Припустимо, що ми хочемо перевірити, згідно з даними таблиці 1, чи справді спостерігається значна втрата ваги у цих осіб, для якої їх вага збирається у кожного суб’єкта до та після дієти. У цьому типі аналізу інтерес зосереджений не на мінливості, яка може існувати між окремими людьми, а на відмінностях, які спостерігаються у одного і того ж предмета між одним моментом та іншим. З цієї причини інтуїтивно зрозуміло працювати з різницею обох спостережень (у прикладі це буде втрата ваги), тому ми хочемо перевірити гіпотезу:

H0: Втрата ваги дорівнює нулю

проти альтернативи, що втрата ваги є значною (тобто ненульовою).

Правдивість цієї гіпотези також можна перевірити за допомогою критерію t Стьюдента. Як вже було сказано, цей тип методів має нормальність даних як фундаментальну гіпотезу. Однак у цьому випадку не буде потрібно, щоб спостереження в обох групах походили від нормальних популяцій, а лише для перевірки нормальності їх відмінності. Позначаючи середньою втратою ваги гіпотеза полягає в тому, що:

проти альтернативи

Зі зразків спостережень < Y 1, Y 2. Y n> і < Y 1, Y 2. Y n> у кожній із груп різниця у вазі розраховується для кожного випробуваного < d 1, d 2. d n> з dj = Xj-Yj j = 1,2. n. Зауважте, що в цьому випадку фундаментальною вимогою є однакова кількість спостережень в обох групах. З цих даних контраст базується на статистиці:

або при обчисленні 95% довірчого інтервалу:

де позначає середню втрату ваги, оцінену за зразком:

і позначає квазі-дисперсію вибірки різниці, задану:

У нашому прикладі значення статистики буде задано: