Коефіцієнт варіації, також відомий як коефіцієнт варіації Пірсона, є статистичним показником, який інформує нас про відносну дисперсію набору даних.

таке

Тобто, він інформує нас, як і інші міри дисперсії, про те, чи змінна рухається багато, трохи, більше чи менше, ніж інша.

Коефіцієнт варіаційної формули

Його розрахунок отримують шляхом ділення середньоквадратичного відхилення на абсолютне значення середнього значення множини і зазвичай виражається у відсотках для кращого розуміння.

  • X: змінна, за якою слід розраховувати дисперсію
  • σx: Стандартне відхилення змінної X.
  • | x̄ |: Це середнє значення змінної X в абсолютному значенні з x̄ ≠ 0

Коефіцієнт варіації можна побачити, виразивши його буквами CV або r, залежно від посібника чи використовуваного шрифту. Його формула така:

Коефіцієнт варіації використовується для порівняння наборів даних, що належать до різних сукупностей. Якщо ми подивимось на його формулу, то побачимо, що вона враховує значення середнього. Отже, коефіцієнт варіації дозволяє нам мати дисперсійну міру, яка виключає можливі спотворення середніх значень двох або більше популяцій.

Приклади використання коефіцієнта варіації замість стандартного відхилення

Ось кілька прикладів цієї міри дисперсії:

Порівняння наборів даних різних вимірів

Ми хочемо придбати дисперсію між ростом 50 учнів у класі та їх вагою. Для порівняння висоти ми могли б використовувати метри та сантиметри як одиницю виміру та кілограм ваги. Порівнюючи ці два розподіли із використанням стандартного відхилення, не було б сенсу, оскільки він призначений для вимірювання двох різних якісних змінних (міри довжини та одного маси).

Порівняйте набори з великою різницею між засобами

Уявіть, наприклад, що ми хочемо виміряти вагу жуків та вагу бегемотів. Вага жуків вимірюється в грамах або міліграмах, а вага бегемотів зазвичай вимірюється в тоннах. Якщо для нашого вимірювання ми перетворимо вагу жуків у тонни так, щоб обидві популяції знаходились в одному масштабі, використання стандартного відхилення як міри дисперсії було б недоречним. Середня вага жука, виміряна в тоннах, була б настільки малою, що якби ми використовували стандартне відхилення, навряд чи було б дисперсію в даних. Це було б помилкою, оскільки вага між різними видами жуків може значно відрізнятися.

Приклад розрахунку коефіцієнта варіації

Розглянемо популяцію слонів та ще одну мишей. Популяція слонів має середню вагу 5000 кілограмів і стандартне відхилення 400 кілограмів. Популяція мишей має середню вагу 15 грам і стандартне відхилення 5 грамів. Якщо порівняти розподіл обох популяцій із використанням стандартного відхилення, можна подумати, що дисперсія популяції слонів більша, ніж для мишей.

Однак, обчислюючи коефіцієнт варіації для обох популяцій, ми зрозуміли б, що це якраз навпаки.

Слони: 400/5000 = 0,08
Миші: 5/15 = 0,33

Якщо помножити обидва дані на 100, ми отримаємо, що коефіцієнт варіації для слонів становить лише 8%, тоді як у мишей 33%. Як наслідок різниці між популяціями та їх середньою вагою, ми бачимо, що популяція з найбільшою дисперсією не є такою з найбільшим стандартним відхиленням.