М. дослідження
Покажчик змісту
Вступ
У попередній роботі концепції систематичного огляду та мета-аналізу були представлені в процесі синтезу результатів, досягнутих різними дослідженнями стосовно даної теми. Ця публікація головним чином зосереджувалась на викладі обмежень та етапів систематичного огляду з коротким описом статистичних методів, які зазвичай використовуються на етапі метааналізу. У цій роботі буде зроблена спроба додатково описати статистичні методи, доступні для об'єднання результатів у цьому виді досліджень.
Аналіз неоднорідності.
Перш ніж вибрати будь-який із різних статистичних методів, що дозволяють поєднувати окремі результати кожного дослідження, щоб отримати комбінований оцінювач ефекту, потрібно буде визначити:
Оцінка ступеня неоднорідності може бути проведена за допомогою статистичних тестів, найбільш широко використовуваним є Q-тест Der Simonian і Laird. Цей тест заснований на обчисленні зваженої суми різниць між ефектом, визначеним у кожному з досліджень (співвідношення шансів, відносний ризик, різниця в середніх показниках тощо) та загальносвітовим середнім:
з | . |
Таким чином, якщо дослідження є однорідними, статистика слідує приблизно розподілу зі ступенями свободи. Отримані значення для зазначеної статистики у кожному конкретному випадку порівнюють із відповідним теоретичним розподілом, отримуючи таким чином значення значимості, яке дозволяє відхилити (р 0,05) гіпотезу однорідності. Однак це тест з низькою статистичною потужністю, тому незначний результат зазвичай є недостатнім для висновку про відсутність неоднорідності досліджень, і цю можливість слід дослідити за допомогою інших методів, переважно графічного типу, таких як діаграми Гелбрейта або діаграми L'Abbé.
З одного боку, графік Гелбрейта представляє точність кожного дослідження (обернену до стандартної похибки оцінки ефекту) порівняно зі стандартизованим ефектом (тобто оцінка ефекту, поділена на його стандартну похибку). Також представлена лінія регресії, прикріплена до цих точок, і смуга довіри, так що всі точки повинні знаходитися в межах цієї смуги. Моменти поза межами довіри - це ті, які вносять найбільшу варіативність в аналіз. Крім того, ті дослідження, що мають більшу вагу при мета-аналізі, будуть дослідженнями з найвищою точністю, і тому їх можна ідентифікувати праворуч від графіка.
Графік L’Abbé - ще один корисний інструмент у випадку роботи з бінарною відповіддю (наприклад, відповідь на нову обробку проти іншого стандарту). Він представляє частку подій у контрольній групі проти частки подій у групі лікування. Таким чином, кожна з точок на графіку представляє відносний ризик, що відповідає різним дослідженням, так що діагональ, що розділяє графік на два розділи, залишатиме дослідження, сприятливі для групи лікування з одного боку, а ті, що сприятливі для групи лікування, з іншого контрольна група. Наявність розсіяних точок, які не розташовані паралельно зазначеній діагоналі, буде вказувати на можливу неоднорідність.
Для ілюстрації вищевикладеного ми розглянемо гіпотетичний приклад, в якому ми хочемо виконати мета-аналіз 10 клінічних випробувань, які намагаються оцінити ефективність нового препарату для лікування певного захворювання. У всіх дослідженнях пацієнти рандомізовані для отримання експериментального препарату (група лікування) або звичайного лікування (група контролю), підраховуючи в кожній групі кількість пацієнтів, які одужали від захворювання. Отже, змінна реакції є лікуванням, а мірою ефекту є відносний ризик (). Дані, використані для цього прикладу, наведені в таблиці 1.
Тест Дер Сімоніана та Лейрда не виявляє із рівнем довіри 95% статистичних доказів неоднорідності (Q = 14.401; p = 0.109). Однак графіки Галбрейта і Л'Аббе припускають певний ступінь неоднорідності, причому одне з досліджень поза першим діапазоном довіри (те, що забезпечує нижчу оцінку ефекту) і з точками, які не вирівнюються навколо пряма лінія на графіку Л'Аббе (рисунки 1 і 2).
Статистичні методи комбінування результатів
Незважаючи на різницю між різними методами, доступними для мета-аналізу, всі вони дотримуються подібної схеми. У більшості випадків оцінювач комбінованого ефекту обчислюється як середньозважене значення оцінювачів кожного дослідження, де ваги присвоюються на основі точності кожної роботи. Таким чином, дослідження з більшою мінливістю відповіді або з меншим обсягом вибірки матимуть менший внесок у глобальний оцінювач.
По суті, статистичні методи, які найбільш часто використовуються на практиці, можна класифікувати на дві групи, залежно від того, чи враховується при аналізі неоднорідність між дослідженнями: моделі випадкових ефектів та моделі з фіксованим ефектом.
а) Моделі з фіксованим ефектом.
Модель фіксованих ефектів передбачає відсутність неоднорідності між дослідженнями, включеними в огляд, так що всі вони оцінюють однаковий ефект, а спостерігаються відмінності обумовлені виключно випадковістю.
Позначаючи ще раз мірою ефекту (коефіцієнт шансів, середня різниця тощо), отриманий за даними i-го дослідження, в моделі фіксованих ефектів передбачається, що існує фіксований глобальний ефект:
помилка, допущена під час наближення .
Глобальний ефект можна оцінити як середньозважену оцінку індивідуальних ефектів кожного дослідження:
де ваги наведені як обернена до дисперсії відповідної оцінки:
Глобальний показник отриманого таким чином ефекту матиме дисперсію, яка визначається як:
так що якщо припустити, що воно слідує нормальному розподілу, відповідний довірчий інтервал можна розрахувати як .
б) Моделі випадкових ефектів.
Навпаки, за допомогою моделі випадкових ефектів передбачається, що дослідження, включені в огляд, становлять випадкову вибірку всіх існуючих досліджень. Зараз вважається, що ефект кожного дослідження має три компоненти:
де загальний ефект, який слід оцінити, це ефект, який слід оцінити в i-му дослідженні (залежно від його конкретних характеристик), і помилка, допущена в оцінці.
Як і в моделі фіксованих ефектів, загальний ефект тут оцінюється як середньозважене значення окремих оцінювачів, де зараз ваги розраховуються як обернена до суми дисперсії окремого дослідження плюс дисперсії між дослідженнями:
Глобальний показник отриманого таким чином ефекту матиме дисперсію, яка визначається як:
можливість розрахувати відповідний довірчий інтервал як .
Загальноприйнятими є роботи, в яких результати метааналізу представлені спільно як із моделлю фіксованих ефектів, так і з моделлю випадкових ефектів. Хоча деякі автори виступають за використання моделі випадкових ефектів у всіх випадках, інші наголошують на її можливих недоліках, таких як той факт, що вона є менш точною, забезпечуючи ширші довірчі інтервали, ніж модель фіксованих ефектів. Загалом, слід мати на увазі, що основною метою мета-аналізу не завжди буде отримання комбінованої оцінки ефекту. Коли результати розглянутих досліджень однозначно неоднорідні, аналіз та виявлення причин такої неоднорідності має стати нашою основною метою. Якщо розбіжності не дуже великі, модель випадкових ефектів стає альтернативою простішій моделі з фіксованими ефектами для поєднання результатів. У разі більшої мінливості результатів найкращим варіантом буде не проводити мета-аналіз, з’ясувати причини неоднорідності та проводити аналіз підгрупи.
Презентація результатів.
Після того, як були зроблені вищезазначені розрахунки, результати мета-аналізу зазвичай представляються на графіку («лісова ділянка»), на якому відображається оцінений ефект у кожному дослідженні разом із значенням, отриманим шляхом об'єднання результатів усіх досліджень, що супроводжується відповідними довірчими інтервалами. Крім того, вертикальна лінія значення, що відповідає відсутності ефектів (RR = 1 або Різниця середніх = 0), як правило, представлена на графіку. Також може бути корисним встановити межі клінічної значимості, щоб визначити, чи відмінності, крім досягнення статистичної значущості, мають відповідну величину.
Звернувшись ще раз до попереднього прикладу, в Таблиці 2 та Рисунку 3 показані результати мета-аналізу з використанням як моделі фіксованих ефектів, так і моделі випадкових ефектів. Усі дослідження, крім одного, демонструють однорідні результати із сприятливим ефектом експериментального лікування та коефіцієнтом ризику від 1,04 до 1,57. У випадках, коли довірчі інтервали перетинають межу відсутності ефекту (RR = 1), різниця в частоті відповіді не була статистично значущою. З будь-яким із двох методів аналізу результати дозволяють зробити висновок, що нове лікування є значно кращим за стандартне лікування для досягнення вилікування пацієнтів, отримуючи дуже схожі глобальні показники ефекту, RR = 1,21 з моделлю фіксованих ефектів і RR = 1,29 за моделлю випадкових ефектів.
Аналіз чутливості та упередженості вибору.
Після проведення мета-аналізу доцільно вивчити вплив кожного з досліджень на отримані результати. Аналіз чутливості складається з тиражування результатів мета-аналізу, виключаючи на кожному кроці одне з досліджень, включених до огляду. Якщо отримані таким чином результати є подібними як за напрямком, так і за величиною ефекту та статистичною значимістю, це вказує на надійність аналізу. Цей самий процес можна повторити, усуваючи одночасно декілька досліджень (наприклад, дослідження з гіршою методологічною якістю, ті, що не публікувались тощо), щоб визначити їх можливий вплив на результати.
Разом з аналізом чутливості після отримання результатів мета-аналізу необхідно проаналізувати існування можливого упередженого відбору, яке може поставити під сумнів отримані результати. Серед найбільш широко використовуваних методів оцінки існування цього типу упередженості найпопулярнішим є воронковий графік, який базується на представленні розміру вибірки кожної роботи проти розміру виявленого ефекту. Нормально було б, щоб усі дослідження виявляли ефект подібної величини навколо горизонтальної лінії, при більшій дисперсії, чим менший розмір вибірки. Таким чином, точки, як правило, розподіляються у вигляді перевернутої воронки. Якби, навпаки, існував ухил публікації, для досліджень з меншим обсягом вибірки, були б опубліковані лише ті, які виявили значні відмінності між групами, так що хмара точок могла б виглядати деформованою в одній із своїх крайнощів. Існують і інші статистичні методи, такі як тест Бегга чи Еггера, впроваджені в більшості програм для проведення метааналізу, які дозволяють більш об'єктивно оцінювати наявність можливого упередження публікації.
Для даних попереднього прикладу результати аналізу чутливості та графік воронки показані на малюнках 4 та 5 відповідно. Як видно, жодне з досліджень, судячи з усього, істотно не змінює результати, якщо їх виключити з мета-аналізу. Аналогічно, на малюнку 5 не показано існування упередженості публікації, що підтверджується результатами тестів Бегга (p = 0,720) та Еггера (p = 0,316).
Коротше кажучи, методи мета-аналізу, таким чином, становлять інструмент без надмірної статистичної складності, що дозволяє синтезувати результати різних досліджень щодо даної теми. Його застосування було спрощене в останні роки завдяки розповсюдженню комп’ютерних програм, що реалізують цей тип методології, як у випадку з програмним забезпеченням EPIDAT. Однак його доступність не повинна покращувати невибіркове використання, ігноруючи той факт, що іноді конструкції досліджень, включені до огляду, їх методологічна якість або результати, яких вони досягають, мають високий ступінь неоднорідності, що не рекомендує проводити мета-аналіз.
- Методологія; до інветигаці; n Шукайте Medline за допомогою посібника користувача Pubmed іспанською мовою
- Методологія; до інветигаці; n Параметричні методи порівняння двох засобів
- Методологія; до інветигаці; n Заходи згоди щодо індексу Каппи
- Відгуки про найкращі дієти 2020 - Щоденник Contankburvie
- ПАКЕТ ДЛЯ Схуднення ПЕРША КОНСУЛЬТАЦІЯ 4 ОГЛЯДИ