Обчислити коваріацію

Автор: Judy Howell
Дата Створення: 2 Липня 2021
Дата Оновлення: 1 Липня 2024
Anonim
Расчет коэффициента корреляции в Excel
Відеоролик: Расчет коэффициента корреляции в Excel

Зміст

Коваріація - це статистичний розрахунок, щоб зробити взаємозв'язок між двома наборами даних більш прозорим. Наприклад, припустимо, антропологи вивчають зріст і вагу популяції в межах певної культури. Для кожної людини в дослідженні зріст і вага можуть відображатися з парою даних (x, y). Ці значення можна використовувати у стандартній формулі для обчислення співвідношення коваріації. У цій статті спочатку пояснюються розрахунки для визначення коваріації набору даних. Далі будуть обговорені два інших автоматизованих способи визначення результату.

Крок

Метод 1 з 4: Обчисліть коваріацію вручну, використовуючи стандартну формулу

  1. Вивчіть стандартну формулу коваріації та її частини. Стандартною формулою для обчислення коваріації є Σ(XiXсер)(рiрсер)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Побудуйте таблицю даних. Перед початком роботи корисно зібрати ваші дані. Створіть таблицю, що складається з п’яти стовпців. Ви повинні оголосити кожен стовпець таким чином:
    • X{ displaystyle x}Обчисліть середнє значення х точок даних. Цей зразок даних містить 9 чисел. Щоб знайти середнє, складіть їх і розділіть суму на 9. Це дає результат 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Коли ви поділите це на 9, ви отримаєте середнє 4.89. Це значення ви будете використовувати як x (avg) для майбутніх розрахунків.
    • Обчисліть середнє значення y-точок даних. Цей стовпець y також повинен складатися з 9 точок даних, які збігаються з x точками даних. Визначте середнє з них. Для цього зразка набору даних це стає 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Поділіть цей підсумок на 9, щоб отримати в середньому 5,44. Ви збираєтеся використовувати 5.44 як значення y (avg) для майбутніх розрахунків.
    • Обчисліть значення (XiXсер){ displaystyle (x_ {i} -x _ { text {avg}})}}Обчисліть значення (рiрсер){ displaystyle (y_ {i} -y _ { text {avg}})}}Обчисліть продукти для кожного рядка даних. Ви заповнюєте рядки останнього стовпця, множачи числа, розраховані в двох попередніх стовпцях (XiXсер){ displaystyle (x_ {i} -x _ { text {avg}})}}Знайдіть суму значень в останньому стовпці. Тут з’являється символ Σ. Виконавши всі обчислення дотепер, складіть результати. Для цього зразка набору даних ви повинні мати дев'ять значень в останньому стовпці. Додайте ці дев'ять чисел разом. Зверніть пильну увагу на те, чи є число позитивним чи негативним.
      • Сума цього набору даних повинна складати -64,57. Запишіть цей підсумок у пробіл внизу стовпця. Це значення чисельника стандартної формули коваріації.
    • Обчисліть знаменник формули коваріації. Чисельник стандартної формули коваріації - це значення, яке ви щойно розрахували. Знаменник представлений (n-1) і на один менше, ніж кількість пар даних у вашому наборі даних.
      • У цій прикладі задачі існує дев'ять пар даних, тому n дорівнює 9. Отже, значення (n-1) дорівнює 8.
    • Поділіть чисельник на знаменник. Останнім кроком підрахунку коваріації є ділення чисельника, Σ(XiXсер)(рiрсер){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Зверніть увагу, які існують повторювані обчислення. Коваріація - це обчислення, яке потрібно зробити від руки кілька разів, щоб зрозуміти значення результату. Однак, якщо ви збираєтеся регулярно використовувати коваріацію для інтерпретації даних, то вам потрібен більш швидкий та автоматизований спосіб отримання результатів. На даний момент ви вже могли помітити, що при нашому відносно невеликому наборі даних із дев’яти пар даних обчислення складалися з двох засобів, вісімнадцяти окремих віднімань, дев’яти множень, одного додавання і, нарешті, іншого ділення. Це 31 відносно невеликі розрахунки для пошуку рішення. Попутно ви ризикуєте пропустити негативні знаки або скопіювати результати неправильно, так що відповідь більше не буде правильною.
    • Створіть аркуш для обчислення коваріації. Якщо ви знайомі з Excel (або іншою програмою обчислення), ви можете легко створити таблицю для визначення коваріації. Позначте заголовки п’яти стовпців, як ви робили для обчислень вручну: x, y, (x (i) -x (avg)), (y (i) -y (avg)) та Product.
      • Щоб спростити іменування, називайте третій стовпець приблизно на зразок «х різниця», а четвертий стовпець «різниця у», доки ви пам’ятаєте значення даних.
      • Якщо таблиця починається у верхньому лівому куті робочого аркуша, комірка A1 буде позначена як x, тоді як інші мітки продовжуватимуться до комірки E1.
    • Введіть точки даних. Введіть значення даних у два стовпці x та y. Пам'ятайте, що порядок точок даних має значення, тому ви повинні збігати кожен y з відповідним значенням x.
      • Значення x починаються в комірці A2 і продовжуються до необхідної кількості точок даних.
      • Значення y починаються в комірці B2 і продовжуються до необхідної кількості точок даних.
    • Визначте середні значення значень x та y. Excel дуже швидко обчислює середні значення для вас. У першій порожній комірці під кожним стовпцем даних введіть формулу = СЕРЕДНЯ (A2: A ___). Заповніть порожній простір номером комірки, що відповідає останній точці даних.
      • Наприклад, якщо у вас 100 точок даних, клітинки від A2 до A101 заповнюються, тому в комірку ви вводите = AVERAGE (A2: A101).
      • Для даних y введіть формулу = AVERAGE (B2: B101).
      • Пам'ятайте, що формула в Excel починається зі знака "=".
    • Введіть формулу для стовпця (x (i) -x (avg)). У комірку С2 введіть формулу для обчислення першого віднімання. Ця формула стає: = A2 -___. Заповніть порожній простір адресою комірки, що містить середнє значення даних x.
      • Наприклад, із 100 точок даних середнє значення буде в комірці A103, тож ваша формула стає: = A2-A103.
    • Повторіть формулу для точок даних (y (i) -y (avg)). За тим самим прикладом він потрапляє в комірку D2. Формула стає: = B2-B103.
    • Введіть формулу для стовпця "Товар". У п’ятому стовпці введіть у клітинку E2 формулу для обчислення добутку двох попередніх комірок. Тоді це стає: = C2 * D2.
    • Скопіюйте формули для заповнення таблиці. Дотепер ви запрограмували лише перші кілька точок даних у рядку 2. За допомогою миші позначте клітинки C2, D2 та E2. Помістіть курсор на маленьку рамку в нижньому правому куті, поки не з’явиться знак плюса. Клацніть і утримуйте кнопку миші та перетягніть мишу вниз, щоб розгорнути виділення та заповнити всю таблицю даних. Цей крок автоматично копіює три формули з комірок C2, D2 та E2 до цілої таблиці. Таблиця повинна автоматично заповнюватися всіма розрахунками.
    • Програмуйте суму останнього стовпця. Вам потрібна сума позицій у стовпці "Товар". У порожню клітинку безпосередньо під останньою точкою даних у цьому стовпці введіть формулу: = SUM (E2: E ___). Заповніть пробіл адресою комірки останньої точки даних.
      • У прикладі зі 100 точками даних ця формула надходить у комірку E103. Тип: = SUM (E2: E102).
    • Визначити коваріацію. Ви також можете доручити Excel виконати для вас остаточний розрахунок. Останній розрахунок у комірці E103 у нашому прикладі представляє чисельник формули коваріації. Відразу під коміркою введіть формулу: = E103 / ___. Заповніть порожній простір кількістю точок даних, які у вас є. У нашому прикладі це 100. Результатом є коваріація ваших даних.

Метод 3 з 4: Використання онлайн-калькуляторів коваріації

  1. Шукати в Інтернеті калькулятори коваріації. У різних школах, компаніях чи інших джерелах є веб-сайти, які дуже легко для вас обчислюють значення коваріації. Використовуйте пошуковий термін "калькулятор коваріації" в пошуковій системі.
  2. Введіть свої дані. Уважно прочитайте інструкції на веб-сайті, щоб переконатися, що ви правильно ввели інформацію. Важливо, щоб ваші пари даних були в порядку, інакше отриманий результат буде неправильною коваріацією. Веб-сайти мають різні стилі введення даних.
    • Наприклад, на веб-сайті http://ncalculators.com/statistics/covariance-calculator.htm є горизонтальне поле для введення значень x та друге горизонтальне поле для введення значень y. Ви повинні вводити дані, розділяючи їх комами. Таким чином, набір даних x, розрахований раніше в цій статті, слід ввести як 1,3,2,5,8,7,12,2,4. Дані y як 8,6,9,4,3,3,2,7,7.
    • На іншому сайті, https://www.thecalculator.co/math/Covariance-Calculator-705.html, вам буде запропоновано ввести дані x у першому полі. Дані вводяться вертикально, по одному елементу на рядок. Тому запис на цьому сайті виглядає так:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Обчисліть свої результати. Привабливість цих онлайн-розрахунків полягає в тому, що після введення даних, як правило, потрібно лише натиснути кнопку «Обчислити», і результати з’являться автоматично. Більшість веб-сайтів нададуть вам проміжні обчислення x (avg), y (avg) та n.

Метод 4 з 4: Інтерпретація результатів коваріації

  1. Шукайте позитивних чи негативних стосунків. Коваріація - це одне статистичне число, яке вказує на зв’язок між одним набором даних та іншим. У прикладі, згаданому у вступі, вимірюється зріст і вага. Ви могли б очікувати, що в міру зростання людей їх вага також збільшиться, що призведе до позитивного коваріантного погляду. Інший приклад: припустимо, збираються дані, які вказують кількість годин, якими хтось займається гольфом, і результат, який він або вона досягає. У цьому випадку ви очікуєте негативної коваріації, а це означає, що зі збільшенням кількості тренувальних годин рахунок в гольфі зменшиться. (У гольфі нижчий бал краще).
    • Розглянемо зразок набору даних, розрахований вище. Отримана коваріація дорівнює -8,07. Знак мінус означає, що зі збільшенням значень x значення y мають тенденцію до зменшення. Ви можете переконатися, що це правда, подивившись на деякі значення. Наприклад, значення x 1 і 2 відповідають значенням y 7, 8 і 9. Значення x 8 і 12 пов'язані зі значеннями y 3 і 2 відповідно. .
  2. Інтерпретувати величину коваріації. Якщо число оцінки коваріації велике, або велике позитивне число, або велике від'ємне число, тоді ви можете інтерпретувати це як два елементи даних, які сильно пов'язані, або в позитивному, або в негативному ключі.
    • Коваріація -8,07 вибіркового набору даних досить велика. Зауважте, що дані коливаються від 1 до 12. Отже, 8 - це досить велика кількість. Це вказує на досить сильний взаємозв'язок між наборами даних x та y.
  3. Зрозумійте відсутність стосунків. Якщо ваш результат - коваріація, рівна або дуже близька до 0, ви можете зробити висновок, що точки даних не пов’язані між собою. Тобто збільшення одного значення може, але не повинно призводити до збільшення іншого. Ці два терміни пов’язані майже випадково.
    • Припустимо, ви пов’язуєте розміри взуття з оцінками на іспитах. Оскільки факторів, що впливають на оцінки іспиту студента, дуже багато, можна очікувати коефіцієнт коваріації, близький до 0. Це вказує на те, що між цими двома значеннями майже немає взаємозв'язку.
  4. Перегляньте відносини графічно. Щоб наочно зрозуміти коваріацію, ви можете побудувати точки даних на графіку x, y. Коли ви це зробите, ви побачите досить легко, що точки, хоч і не зовсім по прямій, як правило, наближаються до скупчення по діагональній лінії зверху зліва направо внизу. Це опис негативної коваріації. Ви також можете побачити, що значення коваріації дорівнює -8,07. Це досить велика кількість у порівнянні з точками даних. Висока цифра свідчить про те, що коваріація є досить сильною, що можна отримати з лінійної форми точок даних.
    • Щоб ще раз пройти через це, прочитайте статті про малювання точок у системі координат на wikiHow.

Попередження

  • Коваріація має обмежене застосування в статистиці. Часто це крок до розрахунку коефіцієнтів кореляції або інших понять. Будьте обережні з надмірно сміливими інтерпретаціями на основі оцінки коваріації.