Після цього ми знову мали справу з worker.sav. Ми перевірили, чи суттєво відрізняються початковий і поточний платежі. Нормальність не виконується, тому замість погіршеного t-критерію ми провели критерій Вількоксона та тест рангу знаків (Nonparametric tests/Related Sample) на основі непараметричної статистики рангу. Нульовою гіпотезою цих тестів є те, що медіана двох змінних різниць дорівнює 0, тобто ймовірність того, що один більший за інший, становить рівно 1/2. Таким чином, ці умови добре перевірені у Великій Британії. Обидва випробування показали, що поточний платіж суттєво відрізняється від початкового платежу. Я зауважую, що, хоча тест Вількоксона не вимагає нормальності, він вимагає, щоб різниця була симетричною. Немає умов для тестування на знаки.

tambs

Потім ми дослідили, чи суттєво відрізняються поточні зарплати тих, хто належить до меншин, та тих, хто не меншин. Нормальність і тут не була досягнута, тому непараметричний еквівалент незалежного t-критерію проводили критерієм Манна-Уітні (Непараметричні тести/Незалежна вибірка). Якщо можна припустити, що розподіли, що належать до двох груп, зміщені один від одного, тест перевіряє, чи є два розподіли однаковими. Безумовно, тест перевіряє "приблизно" нульову гіпотезу про те, що одна величина перевищує 1/2 змінної ймовірності іншої (у разі незалежного породження). Іншими словами, цей тест також перевіряє умови великої групи. В результаті ми виявили, що розмір заробітної плати тих, хто належить до меншин, суттєво відрізняється від розміру заробітної плати неменшин. Я зауважив, що це факт. Але це не обов'язково причинно-наслідковий зв'язок. Тобто, якби наші імовірно вигадані дані були правдивими, ми не змогли б дійти висновку про дискримінацію банківської системи США, лише про те, що представники меншин заробляють менше.

Два описані вище параграфи буквально відповідають дійсності, коли ми порівнюємо безперервні змінні. У разі розривних змінних необхідно обробляти колізії (однакове значення неодноразово приймається змінною). Поки що я не заглиблювався в цю тему, але мені здається, що при обробці конфліктів тести залишаються дійсними.

Я також зазначаю, що замість критерію Манна-Уітні ми також можемо перевірити двовибірковим тестом Колмогорова-Смірнова та тестом Вальда-Вольфоміца, чи відповідають змінні двох незалежних груп однаковому розподілу. Мені здається, що тест Манна-Уітні можна використовувати для кращого вивчення широкомасштабних умов (це твердження можна критикувати).

В кінці курсу я згрупував проведені тести. Ми мали справу з тестом на придатність (хі-квадрат, Колмогорова-Смирнова), тестом на однорідність (t-тести та їх непараметричні еквіваленти). Ми почали займатися тестуванням на незалежність. У тесті хі-квадрат, що перевіряє незалежність дискретних змінних ймовірності, ми виявили, що меншість і заповнена робота не залежать від статистики Chi.

Важливо зазначити, що якщо розмір вибірки великий, t-тест (круглий, і я вважав, що версія незалежного t-тесту Welch до кінця) також може бути використаний для того, щоб нормалізація взагалі не досягнута разів. vйges). Крім того, в деяких випадках він може бути використаний для ненормального розподілу, навіть якщо розмір вибірки не такий великий (надійний тест). Звичайно, це також правда, що вибірки, що базуються на рангах, можуть використовуватися і для нормального розподілу. Література для порівняння двох варіантів досить велика. Важливо те, що вибірки на основі рангу також працюють над порядковими змінними, тоді як t-тест вимагає принаймні змінних рівня інтервалу.

Далі ми використовуємо евристику, використаною вище: якщо припущення про нормальність є прийнятним, тоді ми використовуємо t-критерій та інші статистичні дані для перевірки відносин великого порядку (правильність цієї евристики можна критикувати).