М. дослідження

Покажчик змісту

Вступ

Будь-яке епідеміологічне дослідження повинно гарантувати якість його вимірювань не тільки тому, що воно значною мірою визначатиме обгрунтованість його висновків, а й через важливість клінічних рішень, які ґрунтуються на цьому дослідженні. Якість міри залежить як від її дійсності, так і від її надійності. Хоча валідність виражає ступінь, якою насправді вимірюється явище, що цікавить, надійність вказує на ступінь отримання однакових значень при вимірюванні більше одного разу за подібних умов. Однак той факт, що вимірювання є дуже точним, не означає, що воно обов'язково є дійсним. Таким чином, якщо два послідовних вимірювання артеріального тиску пацієнта проводяться за допомогою погано відкаліброваного сфігмоманометра, отримані значення, безумовно, будуть подібними, хоча і абсолютно неточними.

інветигаці

У дослідженнях, які намагаються оцінити валідність міри, її результати порівнюються з результатами, отриманими за допомогою еталонного тесту (золотого стандарту), який, як відомо, є достовірним та надійним для вимірювання явища, що цікавить. Коли мета орієнтована на надійність вимірювання, процес вимірювання повторюється для оцінки узгодженості між різними вимірами. У дослідженні надійності можна оцінити такі аспекти:

Коефіцієнт кореляції внутрішнього класу

З математичної точки зору, найбільш підходящим індексом для кількісної оцінки узгодженості між різними вимірами числової змінної є так званий коефіцієнт кореляції внутрішнього класу (ICC). Цей коефіцієнт оцінює середнє значення кореляцій між усіма можливими впорядкуваннями пар доступних спостережень і, отже, дозволяє уникнути проблеми залежності від порядку коефіцієнта кореляції. Подібним чином він поширює своє використання на той випадок, коли є більше двох спостережень на кожного суб'єкта.

Однак одним з основних обмежень МКК є складність його розрахунку, оскільки його потрібно оцінювати по-різному залежно від плану дослідження. Найбільш поширена форма розрахунку базується на моделі дисперсійного аналізу (ANOVA) з повторними вимірами (Таблиця 2). Ідея полягає в тому, що загальну мінливість вимірювань можна розкласти на два компоненти: мінливість через різницю між різними суб'єктами та що через різницю між вимірами для кожного суб'єкта. Останнє, у свою чергу, залежить від мінливості між спостереженнями та залишкової або випадкової мінливості, пов'язаної з помилкою, яку тягне за собою будь-яке вимірювання. Потім ICC визначається як частка загальної мінливості, яка обумовлена ​​мінливістю суб'єктів.

В даний час значення ІСН можна отримати безпосередньо за допомогою деяких комп'ютерних програм, таких як SPSS. Ще одним простим способом отримання значення ICC є таблиця ANOVA для повторних вимірювань. Як приклад, у таблиці 3 представлені дані гіпотетичного дослідження, в якому систолічний артеріальний тиск визначали у 30 пацієнтів за допомогою двох різних методів. Якщо ці дані представити графічно, коефіцієнт кореляції r = 0,997 вказує на практично лінійну асоціацію (рис. 2). З відповідної таблиці ANOVA (таблиця 4) ICC можна розрахувати як:

де k - кількість спостережень за кожним предметом. У прикладі:

Як і будь-яка пропорція, значення ІСН можуть коливатися від 0 до 1, так що максимально можлива згода відповідає значенню ІСН = 1. У цьому випадку вся спостережувана мінливість пояснювалася б різницею між випробовуваними, а не різницею між методами вимірювання чи різними спостерігачами. З іншого боку, значення CCI = 0 отримується, коли спостережувана узгодженість дорівнює тому, що, як очікується, відбудеться лише випадково. При інтерпретації значень ICC будь-яка класифікація є суб'єктивною, хоча корисно мати таку класифікацію, як класифікація, запропонована іншими авторами (Таблиця 5).

Дотепер була представлена ​​найпоширеніша форма розрахунку ICC. Для його розрахунку в інших ситуаціях, а також для отримання довірчих інтервалів можуть бути використані більш спеціалізовані посилання.

Незважаючи на те, що є найбільш підходящим показником згоди для випадку числових змінних, ICC має певні обмеження. Разом із труднощами, притаманними його розрахунку, той факт, що це параметричний тест, обмежує його використання випадком, коли перевіряються необхідні гіпотези. А саме: змінні, розподілені відповідно до нормалі, рівність дисперсій та незалежність між помилками кожного спостерігача. Подібним чином, значення ICC значною мірою залежить від мінливості спостережуваних значень: чим більш однорідною буде досліджена вибірка, тим нижчим буде значення ICC. Але, мабуть, найбільше обмеженим у розповсюдженні використання ICC у медичній літературі є відсутність клінічної інтерпретації, що призвело до появи інших методів аналізу, набагато інтуїтивніших та легших для інтерпретації, які пояснюються нижче.

Аналіз індивідуальних відмінностей: метод Бленда та Альтмана

Проста графічна процедура для оцінки згоди між двома вимірювальними системами - це та, яку запропонували Бланд та Альтман. Ця процедура складається з графічного представлення різниці між двома вимірами щодо їх середнього значення. Для ілюстрації цієї методології ми будемо використовувати вимірювання систолічного артеріального тиску, отримані за допомогою ртутного сфігмоманометра на руці, та вимірювання, отримані за допомогою електронного самонадуваючого монітора на вказівному пальці. Ці вимірювання були проведені на 159 студентах університетських шкіл медсестер Ла-Корунья та Феррол.

Інші методи аналізу

Різні автори запропонували деякі альтернативні методи аналізу відповідності для чисельних вимірювань, головним чином з графічної точки зору, які доповнюють метод Бленда та Альтмана. Проста і зовсім недавня пропозиція заснована на побудові графіка, подібного до графіка Каплана-Мейєра, що використовується в аналізі виживання, де абсолютна різниця між двома вимірами для кожного суб'єкта представлена ​​на горизонтальній осі, а на вертикальній осі - частка випадків у які розбіжності дорівнюють принаймні кожній із спостережуваних різниць. Таким чином, графік побудований як при аналізі виживання, де жоден випадок не піддається цензурі, і роль змінної «час» тут відіграє абсолютна різниця між вимірами.

Якщо повернутися до попереднього прикладу (табл. 3), на рисунку 6 показано аналіз індивідуальних відмінностей за методологією Бленда та Альтмана. З графіку видно, що метод В часто забезпечує нижчі показники артеріального тиску із середньою різницею -3,23. Крім того, у таблиці 6 наведено величину в абсолютних величинах двох вимірювань артеріального тиску у кожного пацієнта, а також сукупний відсоток випадків, коли кожна з цих відмінностей подолана. З цих даних можна легко побудувати рисунок 7, який показує незгоду між двома методами. Цей графік дозволяє оцінити, чи має різниця якесь значення з клінічної точки зору. Таким чином, наприклад, якщо ми встановимо похибку між вимірами 2 мм рт. Ст. Як прийнятну, отримаємо відсоток згоди 20%, тоді як згода досягає 90%, якщо допускаються різниці до 8 мм рт. Ст., Що призводить до прийнятних результатів з клінічної точки зору.

Як і метод, запропонований Бландом та Альтманом, головна привабливість цієї альтернативи полягає в тому, що вона дозволяє графічно виражати результати, пов'язуючи їх із заздалегідь встановленими межами згоди згідно з клінічними критеріями перед дослідженням, що робить їх особливо привабливими для охорони здоров'я професіоналів. Подібним чином, це дозволяє перевірити, чи залежить ступінь згоди від якогось іншого коваріату, будуючи незалежні графіки, по одному для кожного рівня змінної. Можна навіть використовувати тест лог-рангу, щоб перевірити наявність значущих відмінностей між цими кривими. Однак, працюючи з абсолютними різницями, цей метод, на відміну від методу Бленда та Альтмана, не дозволяє нам спостерігати, чи існує систематична різниця на користь будь-якої з цих двох технік чи спостерігачів, а також не дозволяє перевірити, чи величина згаданої різниці модифікується щодо величини вимірювання.

Коротше кажучи, до проблеми аналізу відповідності у випадку числових змінних можна підходити відповідно до різних методологій. Далеко від того, щоб рекомендувати стандартне використання будь-якої з цих методик, їх слід радше розглядати як аналітичні методи, що пропонують додаткову інформацію. У будь-якому випадку зручно ще раз наполягати на зручності гарантування валідності та надійності вимірювальних приладів, які зазвичай використовуються в клінічній практиці та дослідженнях. Не можна забувати, що добре спроектоване, виконане та проаналізоване дослідження зазнає невдачі, якщо отримана інформація є неточною або недостовірною.