Я хотів би представити практичний приклад застосування теоретичних розподілів. Особливо для тих, хто ніколи нічого подібного не вивчав, строго без розрахунків. Пізніше їхнє розуміння потрібно для вивчення терміну служби виробів.
Візьміть офіс, де працює 100 людей. Ці люди випадково хочуть кави протягом дня і йдуть на кухню, щоб приготувати одну для спільної кавомашини. Хтось вранці пив каву вдома, хтось просто забув, хтось регулярно п’є каву, хтось лише між двома зустрічами. Ми можемо уявити, що кожен колега, щохвилини, малює в голові цифру. У 8-годинний робочий день, за 8X60 хвилин, намальоване число коливається від 1 до 480 на хвилину, якщо число 1 або 2, воно виходить на каву. Ми знаємо, що працівник випиває в середньому 2 кави на день, оскільки в середньому 1 і 2 виходять з лотереї в 480 таких маленьких голівках, тож середня кількість кави на день становить 200.
Виходячи з цієї базової ситуації, я представляю 4 теоретичні розподіли.
Цей розподіл показує шанс того, що колега того дня вип’є 0,1,2,3 або більше кави. Теоретично, у нашому світі, розділеному на 480 хвилин і 480 випадкових, ми проводимо 480 "випробувань". Під час тесту шанс кави становить 2/480 = 0,00416 Ці два числа потрібно використовувати в калькуляторі, оскільки я не хочу нікого турбувати обчисленням. У наступному калькуляторі я набрав https://stattrek.com/online-calculator/binomial.aspx x замість x coffee 1 кава тощо.
- 0 шанс кави: 13,5%
- Шанс на 1 каву: 27,1%
- Шанс на 2 кави: 27,1%
- Шанс на 3 кави: 18%
- Шанс на 4 кави: 8,9%
- Шанс 5 кави 3,5%
- Ймовірність отримання більше 5 кави: 1,6%
Розподіл Пуассона показує шанс колеги вийти на каву у випадково обраний проміжок часу. Подивимось на годину. Для цього нам потрібно знати, що колега випиває в середньому 2 кави за один день, тобто 8 годин, отже 2/8 = 0,25 кави в середньому за одну годину. Кількість кавових напоїв також потрібно вводити на сторінці калькулятора https://stattrek.com/online-calculator/poisson.aspx. Шанс кави 0,1,2 або більше за одну годину:
- 0 шанс кави: 77,8%
- Шанс на 1 каву: 19,4%
- Шанс на 2 кави: 2,4%
- Шанс більше 2 кави: 0,02%
Взаємозв'язок між Пуассоном та біноміальним розподілом. Кожен, хто трохи привертає увагу і слідував, може відчути, що ці два методи обчислення здаються взаємозамінними. Інтуїція хороша, якщо ймовірність мала, а кількість вибірки велика, тоді два методи обчислення можна поміняти місцями з хорошим наближенням. Різниця пов’язана з тим, що в біноміальному розподілі ви можете випити максимум 60 кав за одну годину, оскільки теоретично ми малюємо щохвилини, тоді як у випадку з пуассоном немає необхідності в цьому теоретичному підході, немає максимальної кількості кави. Мабуть, найкращим прикладом цього є підрахунок кількості дощових днів у липні за двобічним розподілом та кількості дощів у липні з пуассоном, оскільки у випадку з пуасоном ми вважаємо, що за один день може бути більше дощів. означає максимум 1 на день 31 числа
Експоненціальний розподіл показує, скільки часу проходить між двома випадковими подіями. Ми можемо використовувати його для перегляду уявних кабінетів щодо ймовірності того, що ніхто не піде до кавомашини протягом 5,10,20 хвилин. Для цього нам потрібно розрахувати очікуваний час між двома кав’ярнями. У нашому випадку вони вживають в середньому 200 кав за 480 хвилин. Таким чином, наше очікуване значення становить 2,4 хвилини. Нам потрібна взаємність цього, яка становить 1/2,4 = 0,4166. Введено в інший калькулятор (https://homepage.divms.uiowa.edu/
mbognar/applets/exp-like.html) це та досліджувана тривалість дають такий результат:
- Кухня порожня протягом 5 хвилин: 12,5%
- 10 хвилин: 1,6%
- Протягом 20 хвилин: 0,002% не очікуйте 20 хвилин самотності на кухні
Загальна площа під функцією становить 100%, а червона частина - це частка випадків, що перевищують цей інтервал часу. Отже, червона область пропорційна цілому.
Експоненціальний розподіл має деякі “драматичні” властивості:
- Безпам’ятність. Не має значення, який інтервал часу ми досліджуємо, неважливо, що кухня порожня протягом 5 хвилин, але розраховане значення буде типовим протягом наступних 5 хвилин.
- Очікуване значення та стандартне відхилення однакові. У нашому випадку 2,4 хвилини - це середнє арифметичне часу, що пройшов між кавами, і вимірювання цих тривалістей часу буде нашим стандартним відхиленням.
- Очікуване значення - це не найбільш вірогідне значення. 63,21% інтервалів між кавами коротші, ніж очікувалося. Наприклад, це називається характерним часом життя світлодіодів, і 63,21% світлодіодів виходять з ладу до цієї тривалості життя. Середнє середнє менше середнього арифметичного тривалості життя. Отже, ні ОГС, ні середнє арифметичне угорських заробітних плат не повідомляється.
Нормальний або гауссів розподіл:
Гаусівський розподіл показує розподіл кількості кави, що називаються на день. Ми знаємо, що середнє значення становить 200 на день, але які шанси закінчити більше 220 кав на день? Нормальний розподіл може характеризуватися середнім і стандартним відхиленням. Найпростіший спосіб отримати це - виміряти кількість кави, спожитої протягом днів, і записати це, чим більше днів ми вимірюємо, тим надійнішими є наші результати. Виходячи з поточних параметрів, можна також визначити розподіл щоденного споживання кави в нашому маленькому теоретичному кабінеті (я не зміг цього зробити:), але я відчуваю, що це може бути). Я використовував відомий раніше біноміальний розподіл для визначення середньоквадратичного відхилення. Для цього я виявляю, що із шансом 100 людей х 480 хвилин = 48 000 випробувань і шансом 2/480, чим вище значення, тим вище шанс відбутися - 15,87%. Це тому, що віднімання середнього від цього значення дає стандартне відхилення нашого нормального розподілу. Той, хто більше цікавиться, звідки взяли 15,87%, повинен шукати правило 3 сигми.
Наш біноміальний розподіл дає графік, який відповідає дзвіновій кривій такого гарного нормального розподілу. Звичайно, придатність не є досконалою, оскільки двочлен інтерпретується лише на натуральному числі, а нормальний - на дійсних числах.
Стандартне відхилення, яке ми шукаємо, - 14. Отже, середнє значення нашого нормального розподілу дорівнює 200, а стандартне відхилення - 14. Це потрібно в калькуляторі. https://stattrek.com/online-calculator/normal.aspx Більше 220 порцій кави споживається 7,7% на день.
Ми могли б отримати це за допомогою калькулятора біноміального розподілу, але насправді ми частіше знаємо історичні дані, тут втрати кави з попередніх днів, тому легше обчислити нормальний розподіл.