від Bernat Requena Serra Опубліковано 11 вересня 2018 р. Оновлено 18 жовтня 2020 р

вибірки

Обчислити обсяг вибірки (або обсяг вибірки) Це принципово. Більша вибірка - це марне витрачання ресурсів; менша вибірка призводить до втрати якості результатів.

Рівняння, яке використовуватиметься, залежить від мети, яку переслідують (наприклад, а пропорція, a наполовину, тощо), і це також залежить від чисельності сукупності, якщо це N, вона скінченна, нескінченна або дуже велика.

Вибір параметрів, що беруть участь у розрахунку, повинен визначатися на експертній основі і, у будь-якому випадку, "помилка на стороні".

Розмір вибірки для оцінки пропорції

Це знайдено за такою формулою:

Щоб застосувати його, ми повинні знати:

  • рівень довіри (1-α) або рівень безпеки.
  • Оцінка пропорція (р) що ви хочете виміряти.
  • діапазон помилок (e) бажаний.

рівень довіри (1-α) відноситься до ймовірності того, що бажані дані знаходяться в межах встановленого запасу. Цей параметр визначає дослідник. Зазвичай це 95%, (α = 0,05), що відповідає a коефіцієнт довіри Z = 1,96, що і покладено у формулу. Саме стандартизована напіввідстань з точки зору стандартних відхилень визначає обидва кінці інтервалу.

При проведенні декількох подібних експериментів з одним і тим же зразком 95% параметрів знаходилися б в межах діапазону, тоді як 5% були б поза ним.

Зазвичай використовують 95% та 99%. Наступна таблиця показує відповідність між рівнем довіри та коефіцієнтом довіри:

Оцінюючи пропорція те, що ви хочете виміряти, є ключовим питанням. Ми хочемо оцінити частку тих, хто відповідає умові. Значення цієї оцінки p буде отримано з попередніх досліджень. В іншому випадку вважається, що умова виконується на 50%, а отже, не виконується (1 - р) на інших 50%. У цьому випадку ми вкладемо у формулу:

діапазон помилок Бажана, або точність, або допустима похибка, стосується різниці між середнім значенням вибірки та середнім показником. Звичайно, він не призначений робити помилки. Ми готові допустити помилку.

Зазвичай приймається E = 3% (0,03), хоча воно знаходиться між:

У формулі ми покладемо суму, помножену на одиницю, наприклад, 0,03.

Коли розмір сукупності дуже великий (зазвичай розглядається, коли N> 100 000), формула для пошуку вибірки отримує a пропорція спрощено:

Вправа 1

Ми хочемо оцінити частку певного параметра в популяції N = 1500 із рівнем довіри 95% (Z = 1,96). Ми приймаємо похибку e = 6% (0,06) і, оскільки у нас немає попередніх даних, ми оцінюємо рівень відповідності 50% (0,5).

З цими приміщеннями обсяг вибірки це буде з 227 осіб.

Вправа 2

Обчисліть обсяг вибірки, необхідний для того самого підходу, що і попередня вправа, але цього разу для значно більшої сукупності, скажімо, N = 200 000:

Тепер необхідний розмір вибірки - 267. Видно, що розмір вибірки далеко не пропорційний розміру сукупності.

Вправа 3

Розрахуйте обсяг вибірки для попереднього підходу для тієї самої сукупності N = 200 000 і з тією ж консервативною оцінкою очікуваної частки 50%, але цього разу з більшою строгістю, встановивши похибку e = 3% (0,03).

При пошуку діапазон помилок більш суворий, необхідний обсяг вибірки значно збільшився до 1067 предметів.

Вправа 4

Скільки людей слід включити до вибірки, щоб оцінити поширеність (це пропорція) короткозорості серед осіб віком до 18 років у популяції, в якій на сьогодні зареєстровано 10 000 осіб до 18 років. Раніше ми знали, що очікувана частка становить близько 60%. Ми вибираємо a рівень довіри 95%, і ми визнаємо a діапазон помилок з 4%:

Потрібно вибрати 545 предметів до 18 років.

Розмір вибірки для оцінки середнього значення

Це знайдено за такою формулою:

Щоб застосувати його, ми повинні знати:

Окремо від рівень довіри (1-α) та діапазон помилок (e) визнано, про що вже йшлося вище, тепер ми повинні мати уявлення про дисперсія (σ 2) розподілу змінної, яку слід враховувати.

Якби ми не мали даних про цю дисперсію, ми б вдалися до:

  • Попередні дослідження з тієї ж теми.
  • Проведіть пілотне випробування на невеликій вибірці.
  • Беручи консервативну оцінку дисперсії, з квадратом половини різниці між максимальним та мінімальним значенням, яке ми розглядаємо, можна взяти змінну.

Вправа 5

На меблевій фабриці з високомеханізованим процесом ви хочете знати, що таке наполовину ваги певної моделі столу, яка була виготовлена ​​за останній рік. Виготовлено дуже велику кількість агрегатів. З попередніх вправ ми знаємо, що стандартне відхилення σ шуканої змінної становить близько 50 гр. Ми хочемо знати середнє значення з похибкою 95% і визнаємо похибку 6 грам.

Розмір вибірки повинен бути 172 таблиці виготовлений.

Вправа 6

У 2017-2018 навчальному році в новій групі освітніх центрів міста навчаються 1650 10-річних студентів-чоловіків. Проводиться дослідження для оцінки наполовину зросту цих 1650 школярів. Встановлено рівень довіри 95%, і ми допускаємо похибку 1,8 см.

Попередніх даних про дисперсію змінної висоти немає, враховуючи множинність походження учнів. Ми вдаємось до прийняття “консервативного” значення розрахункової дисперсії, беручи до уваги квадрат напівамплітуди. Тобто, ω 2 буде вдвічі меншою від різниці максимального та мінімального значення, яке ми знаємо з досвіду, що становить різну висоту підлітків чоловічої статі цього віку:

Знаючи параметри цієї вправи, формула розміру вибірки застосовується для оцінки середнього значення кінцевої сукупності.

Вам потрібно буде вибрати зразок 132 школярі самці.

Висновки

  1. Параметри вибірки, n, рівень довіри, Z та похибка, e взаємопов'язані.
  2. Якщо ми зменшуємо похибку, e, ми повинні збільшити обсяг вибірки, n.
  3. Якщо рівень довіри, Z, який ми приймаємо вище, нам також доведеться збільшити обсяг вибірки, n.
  4. Оскільки параметром, до якого зазвичай не потрібно торкатися, є рівень довіри, Z, то, щоб зменшити похибку, e допущений змусить нас збільшити обсяг вибірки, n.

АВТОР: Бернат Рекена Серра