- Підприємництво
- Створення підприємців
- Пісна шість сигм
- Шість сигм
- Читайте
- Інструменти
- Інновації
- Коста-Ріка інновації
- Аналіз даних
- Мінітаб
- Якість
- Лідерство
- CQE
- Новини
- Вакансії BBCross
- Книжкові історії
- Проекти
- Введення нового продукту
- Програмне забезпечення та Інтернет
- Управління даними
- Код
- Галузі
- Їжа
- Медичні вироби
- Ланцюг поставок
- Цифрове перетворення
- Стандартизація
- Підтримка та поширені запитання
- Віртуальний кампус BBCross
- електронне навчання
- Навчання
- GAGEpack
- Поширені запитання щодо SQCpack
- Поширені запитання щодо аналізатора точок зміни
- Prezi FAQ
- ASQ
- Події
- Он-лайн
- Власні та громадські
Зберігати BBCross
Підручники, новини, тести тощо
Facebook Live
Інновація для вдосконалення від BBCross ™
"Парадокс Сімпсона" - це добре відоме явище, яке може спотворити причинно-наслідкові зв'язки в наборах даних у присутності конфудера чи коваріати. У цій статті ми поговоримо про кілька практичних способів захистити себе і не стати жертвою цього підступного ефекту.
Для оновлення вашої пам’яті Парадокс Сімпсона - це назва явища, при якому напрямок ефекту змінюється, коли враховується раніше ігнорована змінна („прихована” змінна, яку також називають прихованою змінною), що суттєво впливає на взаємозв’язок.
Вивчення фізичних вправ
Ми розробимо це визначення на прикладі. Ви відповідаєте за дослідження, що порівнює, як дві (2) методики схуднення - дієта та фізичні вправи - впливають на втрату ваги у пацієнтів із зайвою вагою. Загалом у вас є 240 пацієнтів, які беруть участь у дослідженні, із 120 яких призначено дієту для схуднення, а решта 120 - під контрольованим режимом фізичних вправ.
Наприкінці 30 днів ви вимірюєте втрату ваги кожної групи. Дані показали, що 70 людей, які дотримуються дієти, і 57 спортсменів значно схудли, що становить 58% у групі дієт і лише 48% у групі вправ - суттєва різниця. Тож чи слід робити висновок, що дієта краща за фізичні вправи?
Ні, саме тому Парадокс Сімпсона може бути таким складним! Коли дані стратифікуються за показником індексу маси тіла (ІМТ) учасників, як показано нижче, виходить більш чітка картина:
(оригінальна таблиця статей)
Якщо розглядати групу ІМТ, можна чітко побачити, що відсоток пацієнтів, які втрачали вагу при кожному ІМТ, був меншим серед тих, хто дієт, ніж спортсмени. Дивовижною ("ховається", прихованою) змінною є незбалансований розподіл пацієнтів із ожирінням та важким ожирінням у групи дієти та фізичних вправ.
Як бачите, цифри між двома групами зворотні: 40 людей із ожирінням та 80 осіб, що страждають ожирінням, у групі Дієта, і 80 осіб, що страждають ожирінням і 40 осіб, що страждають ожирінням, у групі Вправи. Оскільки група, що страждає ожирінням, здається, отримала непропорційно більшу користь від кожного лікування, група фізичних вправ була покарана просто через меншу кількість страждаючих ожирінням групи.
Парадокс Сімпсона в дії: Відсоток пацієнтів, які схудли, був вищим серед спортсменів із ожирінням та тяжким ожирінням, але якщо додати дві групи, люди, які дотримуються дієти, здається, найбільше схудли.
Тут грають два фактори. По-перше, існує упущена незрозуміла змінна (ІМТ), а по-друге, непропорційний розподіл рівнів ІМТ між експериментальними групами (дієта та фізичні вправи). Ми не знаємо причини непропорційного розподілу, але можна припустити, що пацієнти якимось чином самостійно обрали, до якої з двох груп вони належали б.
Прості діаграми та графіки можуть суттєво пояснити, що відбувається з базовими даними. Див., Наприклад, цю таблицю стовпців, виготовлену в Microsoft® Excel®, яка представляє дезагреговані дані; показує частку тих, хто діє та спортсменів у кожній групі ІМТ.
На наступному графіку показано частку пацієнтів із втратою ваги та без неї серед різних підгруп.
Зрозуміло, що більше спортсменів схудло в кожній групі ІМТ (зверніть увагу на рівні блакитного кольору в перших двох парах стовпців), але в сукупній вибірці пропорції, здається, зворотні.
Щоб уникнути помилкових результатів, завжди є гарною практикою перевірити, чи зв’язок у сукупності набору даних зберігається в підмножинах, особливо коли деякі групи не представлені так само, як інші в даних.
Іншим способом може бути зважування зразків відповідно до їх розмірів.
На жаль, інструменти статистичного аналізу - саме це - інструменти, які допоможуть вам впорядкувати та проаналізувати спостережувані дані.
Вони не можуть сказати вам нічого про дані, які не були побачені або не були включені в аналіз.
Тому дуже важливо залучити міжфункціональну групу, а особливо експертів з предметів та фахівців, до початкового планування та вибору змінних, що підлягають вимірюванню. Після збору даних єдиним способом спробувати уникнути цієї помилки є візуально та іншим чином вивчити значні підмножини даних.
Парадокс Сімпсона, як правило, не буде проблемою у добре продуманому експерименті чи опитуванні. Ви можете визначити можливі «приховані» (приховані) змінні та адекватно керувати ними, видаляючи їх, підтримуючи постійними для всіх груп або включаючи їх у дослідження.
Правильна рандомізація також робить довгий шлях до мінімізації ефектів прихованої змінної, яку можна було пропустити. В аналізі коваріації, в якому можливі змінні (коваріати), пов’язані з відповіддю (у нашому прикладі початковий ІМТ не був пов’язаний із лікуванням, але це вплинуло на втрату ваги), були додані до моделі і також допоможуть.
Однак якщо у вас немає можливості планувати своє дослідження, вам надають дані з бази даних і просять "знайти те, що я можу", урок Парадокса Сімпсона полягає в тому, щоб завжди розглядати дані на різних рівнях агрегування, як і в попередньому прикладі.
- Фенілетиламін схуднути Як це працює та побічні ефекти
- Джессіка Сімпсон розповідає, як схуднути, мастурбуючи Джессіка Сімпсо - 10112011 Газета Зокала
- Шизофренія Що це таке Як діагностується Як пом’якшити її трудові та соціальні наслідки; Здоров'я
- Гомеопатія, чи не має вона побічних ефектів, якщо говорити про гомеопатію
- Шокуючий образ Джессіки Сімпсон після схуднення на 45 кілограмів після вагітності