Як оцінити статистичну значимість

Автор: Randy Alexander
Дата Створення: 2 Квітень 2021
Дата Оновлення: 26 Червень 2024
Anonim
Вагнер: Як лопнула "зрада") Арестович / Україна 24
Відеоролик: Вагнер: Як лопнула "зрада") Арестович / Україна 24

Зміст

Тестування гіпотез керується статистичним аналізом. Статистично значуща довіра обчислюється з використанням значення p - це вказує на ймовірність спостережуваного результату, коли певна (нульова гіпотеза) відповідає дійсності. Якщо значення р менше рівня значущості (зазвичай 0,05), експериментатор може зробити висновок, що є достатньо доказів для відхилення нульової гіпотези та визнання зворотної гіпотези. За допомогою простого t-критерію ви можете розрахувати значення p і визначити значимість між двома різними групами даних.

Кроки

Частина 1 з 3: Налаштуйте свої експерименти

  1. Визначте свою гіпотезу. Першим кроком у оцінці статистичної значущості є визначення питань, на які потрібно відповісти, та оголошення вашої гіпотези. Гіпотеза - це виклад емпіричних даних та можливих розбіжностей у сукупності. Кожен експеримент має нульову та зворотну гіпотези. Загалом, ви порівняєте дві групи, щоб побачити, однакові вони чи різні.
    • Загалом, гіпотеза не є (H0) підтверджують відсутність різниці між двома групами даних. Приклад: Студенти, які прочитали матеріал перед уроком, не отримують кращих підсумкових оцінок.
    • Обернена гіпотеза (Ha) суперечить нульовій гіпотезі і є твердженням, яке ви намагаєтесь підтримати своїми емпіричними даними. Наприклад: Студенти, які прочитали матеріал перед уроком, насправді отримують кращі підсумкові оцінки.

  2. Виберіть рівень значимості, щоб визначити ступінь різниці, яка може розглядатися як значуща в даних. Рівень значущості (також відомий як альфа) - це поріг, який ви обираєте для визначення значення. Якщо значення р менше або дорівнює заданому рівню значимості, дані вважаються статистично значущими.
    • Як правило, рівень значущості (або альфа) зазвичай вибирають на рівні 0,05 - це означає, що ймовірність спостерігати різницю, яку бачать дані, є випадковою лише 5%.
    • Чим вищий рівень довіри (і, отже, чим нижче значення р), тим більш значущими є результати.
    • Якщо потрібно більше впевненості, зменшіть значення р до 0,01. Низьке значення р часто використовується у виробництві для виявлення дефектів товару. Високий ступінь надійності має вирішальне значення для того, щоб визнати, що кожна деталь буде функціонувати як слід.
    • Для більшості експериментів на основі гіпотез допустимий рівень значущості 0,05.

  3. Вирішіть, застосовувати однобічний або двосторонній тест. Одне з припущень t-тесту полягає в тому, що ваші дані мають нормальний розподіл. Нормальний розподіл сформує криву дзвона з більшістю спостережень по центру. T-тест - це математичний тест, який перевіряє, чи потрапляють ваші дані назовні нормального розподілу, зверху чи знизу, у верхній частині кривої.
    • Якщо ви не впевнені, чи є дані вище або нижче контрольної групи, використовуйте двосторонній тест. Це дозволяє перевірити значимість в обох напрямках.
    • Якщо ви знаєте, яким буде очікуваний напрямок ваших даних, скористайтеся однобічним тестом. У наведеному вище прикладі ви очікуєте, що бали студента покращаться. Тому ви використовуєте однобічний тест.

  4. Визначте обсяг вибірки за допомогою силового аналізу. Сила тесту - це здатність спостерігати очікуваний результат із заданим обсягом вибірки. Загальний поріг сили (або β) становить 80%. Аналіз сили може бути досить складним без попередніх даних, оскільки вам потрібна інформація про очікуване середнє значення між групами та їх стандартні відхилення. Використовуйте онлайн-аналіз сили, щоб визначити оптимальний обсяг вибірки для ваших даних.
    • Дослідники часто проводять невелике дослідження приміщення для обґрунтування аналізу сили та вирішення обсягу вибірки, необхідного для великого та всебічного дослідження.
    • Якщо немає засобів для проведення складних досліджень передумов, оцініть можливе середнє значення на основі читання статей та досліджень, які могли проводити інші особи. Це може дати вам хороший старт у визначенні розмірів вибірки.
    реклама

Частина 2 з 3: Обчислення середньоквадратичного відхилення

  1. Визначте формулу середньоквадратичного відхилення. Стандартне відхилення вимірює розподіл даних. Він надає вам інформацію про ідентичність кожної точки даних у зразку. На початку роботи рівняння можуть виглядати досить складно. Однак наступні кроки допоможуть вам легко зрозуміти процес розрахунку. Формула має s = √∑ ((xi - µ) / (N - 1)).
    • s - стандартне відхилення.
    • ∑ означає, що вам доведеться скласти всі зібрані спостереження.
    • хi кожен представляє ваше значення даних.
    • µ - середнє значення даних для кожної групи.
    • N - загальна кількість спостережень.
  2. Усередніть кількість спостережень у кожній групі. Для розрахунку стандартного відхилення спочатку потрібно розрахувати середнє значення спостережень для кожної окремої групи. Це значення символізується грецькою літерою mu або µ. Для цього просто додайте спостереження і розділіть на загальну кількість спостережень.
    • Наприклад, щоб знайти середній бал групи, яка читає документ перед уроком, давайте розглянемо деякі дані. Для простоти ми будемо використовувати набір даних із 5 балів: 90, 91, 85, 83 та 94 (за 100-бальною шкалою).
    • Складіть усі спостереження: 90 + 91 + 85 + 83 + 94 = 443.
    • Поділіть наведену вище суму на кількість спостережень N (N = 5): 443/5 = 88,6.
    • Середній бал для цієї групи - 88,6.
  3. Відніміть середнє від кожного спостережуваного значення. Наступний крок включає частину (xi - µ) рівняння. Відніміть середнє значення від кожного спостережуваного значення. У наведеному вище прикладі ми маємо п’ять віднімань.
    • (90 - 88,6), (91- 88,6), (85 - 88,6), (83 - 88,6) та (94 - 88,6).
    • Розрахункове значення - 1,4; 2.4; -3,6; -5,6 та 5,4.
  4. Вирівняйте вищезазначені відмінності та складіть їх. Кожне нове значення, щойно обчислене, тепер буде в квадраті. Тут негативний знак також буде видалено. Якщо після цього кроку або в кінці розрахунку з’являється від’ємний знак, можливо, ви забули зробити вищевказаний крок.
    • У нашому прикладі ми тепер працюватимемо з 1,96; 5,76; 12,96; 31.36 та 29.16.
    • Складіть ці квадрати разом: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Ділимо на загальну кількість спостережень мінус 1. Поділ на N - 1 допомагає компенсувати розрахунок, який не проводиться для сукупності в цілому, а базується на лише одній вибірці серед сукупності всіх студентів.
    • Віднімаємо: N - 1 = 5 - 1 = 4
    • Ділимо: 81,2 / 4 = 20,3
  6. Отримайте квадратний корінь. Поділившись на кількість спостережень мінус 1, візьміть квадратний корінь отриманого значення. Це останній крок при розрахунку стандартного відхилення. Деякі статистичні програми допоможуть вам виконати цей розрахунок після імпорту вихідних даних.
    • У наведеному вище прикладі стандартне відхилення оцінки в кінці семестру студентів, які читають документ перед початком уроку, становить: s = √20,3 = 4,51.
    реклама

Частина 3 з 3: Визначення статистичної значущості

  1. Обчисліть дисперсію між вашими двома групами спостережень. До цього моменту приклад стосувався лише однієї групи спостережень. Для порівняння двох груп, очевидно, потрібні дані з обох. Обчисліть середньоквадратичне відхилення другої групи спостережень і використовуйте його для обчислення дисперсії між двома експериментальними групами. Формула для обчислення дисперсії: sd = √ ((с1/ Н1) + (с2/ Н2)).
    • Sd - дисперсія між групами.
    • S1 - стандартне відхилення груп 1 і N1 - розмір групи 1.
    • S2 - стандартне відхилення груп 2 і N2 - це розмір групи 2.
    • У нашому прикладі скажімо, що дані з групи 2 (учні, які не читали текст до уроків) мають розмір 5 і стандартне відхилення 5,81. Дисперсія:
      • Sd = √ ((с1) / N1) + ((с2) / N2))
      • Sd = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Обчисліть t-бал даних. T-статистика дозволяє перетворити дані у форму, порівнянну з іншими даними. Значення t також дозволяє виконати t-тест, тест, який дозволяє розрахувати ймовірність статистично значущої різниці між двома групами. Формула для розрахунку t-статистики така: t = (µ1 – µ2) / Sd.
    • µ1 є середнім показником для першої групи.
    • µ2 - середнє значення другої групи.
    • Sd - дисперсія між спостереженнями.
    • Використовуйте більше середнє як µ1 щоб не отримати негативну t-статистику.
    • Для нашого прикладу, припустимо, спостережуване середнє значення для групи 2 (хто не читав попередню статтю) дорівнює 80. T-оцінка: t = (µ1 – µ2) / Sd = (88,6 – 80)/3,29 = 2,61.
  3. Визначте ступінь свободи зразка. При використанні t-статистики ступінь свободи визначається виходячи з обсягу вибірки. Складіть кількість спостережень для кожної групи, а потім відніміть два. У наведеному вище прикладі ступінь свободи (d.f.) дорівнює 8, оскільки в першій групі є 5 зразків, а в другій - 5 ((5 + 5) - 2 = 8).
  4. Використовуйте таблицю t для оцінки значущості. Таблиці значень t і ступенів свободи можна знайти в стандартній книзі статистики або в Інтернеті. Знайдіть рядок, що містить ступінь свободи даних та значення p, яке відповідає вашій статистиці t.
    • При ступенях свободи 8 і t = 2,61 значення p для однобічного тесту становить від 0,01 до 0,025. Оскільки обраний рівень значимості менше або дорівнює 0,05, наші дані є статистично значущими. Отримуючи ці дані, ми відкидаємо нульову гіпотезу і приймаємо зворотну гіпотезу: студенти, які читали матеріал перед класом, мають вищі підсумкові бали.
  5. Подумайте про проведення подальших досліджень. Багато дослідників проводять дослідження приміщення з кількома показниками, щоб зрозуміти, як створити велике дослідження. Проведення інших досліджень з більшою кількістю метрик підвищить вашу впевненість у своїх висновках. реклама

Порада

  • Статистика - це велике і складне поле. Пройдіть курс перевірки статистичних гіпотез у середній школі чи університеті (або вище), щоб зрозуміти статистичну значимість.

Увага

  • Цей аналіз фокусується на t-тесті, щоб перевірити різницю між двома стандартними популяціями розподілу. Залежно від складності даних, вам може знадобитися інший статистичний тест.