Про розподіли

У своїх попередніх статистичних дослідженнях я завжди дізнавався, що якщо на процес впливають лише випадкові фактори, то результат цього процесу слідує нормальному розподілу. З огляду на це, я придумав, як би було б перевірити якесь природне явище, чи справді наведена теорія працює на все. І тоді мені спало на думку, що на полиці лежить кошик сушених абрикосових кісточок: що, якби я виміряв їх вагу і проаналізував, як був розподіл ваги абрикосових кісточок.

зерен

Я також зв’язав своїх синів, які старанно зважували 100 персикових насінин, і приніс їх до столу. Потім, використовуючи Minitab, я перевірив, чи відповідає набір даних нормальному розподілу. Спочатку я побудував дані за допомогою простої точкової гістограми:

Діаграма розподілу чітко показує, що існує абрикосова кісточка, яка важить значно більше, ніж інші абрикосові ядра. Тест значень падіння чітко вказує, що значення падіння 2,58 грама в рядку 86 не відповідає шаблону, поданому іншими 99 ядрами:

Незважаючи на це, я провів тест, щоб побачити, чи відповідає набір даних нормальному розподілу. Я отримав це у такому вигляді ні!

З діаграми видно, що єдиною точкою, яку ми виявили, є дуже далеко від прямої лінії (на щастя, у Minitab є функція, яка дозволяє нам визначити, з якої точки на діаграмі які дані їй належать), інші набагато ближче до нього. Чим більше точок лежить на синій лінії, тим нормальнішим є стандартне відхилення даних. Значення “P-Value” у правому полі становить 0,028, що нижче значення 0,05, яке зазвичай розглядається (це буде розглянуто далі в цій статті), тому ми підозрюємо, що набір даних зазвичай не розподіляється, оскільки це відсутній момент.

Я не знаю, чому це персикове насіння значно важче за інші. Я знайшов насіння в кошику на кухонній полиці, можливо, насіння збирали в ньому роками. Тому я не можу виключити це з розслідування, оскільки не можу зробити це без відповідного обґрунтування. Але все, що я можу зробити, - це перевірити, чи вага інших 99 насінин без втраченої маси абрикосових кісточок відповідає нормальному розподілу:

На жаль, я не можу насправді визначитися на основі точкової гістограми.

Виходячи з гістограми, я б сказав, що вона не зовсім регулярна, але схожа.

З іншого боку, тест на нормальність вже чітко показав, що якщо ми виймаємо набагато важче абрикосове ядро ​​з набору даних, вага інших абрикосових ядер слідує нормальному розподілу, оскільки точки добре сидять на синій лінії і "Р-значення" вище, ніж потрібно 0,05.

Короткий зміст: Метою дослідження було визначити, чи відповідала вага 100 абрикосових зерен, знайдених на кухні, нормальному розподілу. На жаль, виходячи з досвіду, я не можу чітко це сказати, оскільки серед насіння персика був шматок насіння, який важив значно більше, ніж інші 99. Оскільки я не можу пояснити цю невідповідність жодним чином, я не можу видалити відсутнє значення з набору даних. Тим не менше, можна стверджувати, що якби я вийняв це одне насіння, вага інших 99 абрикосових кісточок мала б 95% ймовірності нормального розподілу.