Як розрахувати лінійний коефіцієнт кореляції

Автор: Eric Farmer
Дата Створення: 7 Березень 2021
Дата Оновлення: 1 Липня 2024
Anonim
Коэффициент корреляции Пирсона, 2 способа вычисления
Відеоролик: Коэффициент корреляции Пирсона, 2 способа вычисления

Зміст

Коефіцієнт кореляції (або лінійний коефіцієнт кореляції) позначається як «r» (в окремих випадках як «ρ») і характеризує лінійну кореляцію (тобто взаємозв'язок, яка задається деяким значенням і напрямком) двох або більше змінних. Значення коефіцієнта лежить між -1 і +1, тобто кореляція буває як позитивної, так і негативної. Якщо коефіцієнт кореляції дорівнює -1, має місце ідеальна негативна кореляція; якщо коефіцієнт кореляції дорівнює +1, має місце ідеальна позитивна кореляція. В інших випадках між двома змінними спостерігається позитивна кореляція, негативна кореляція або відсутність кореляції. Коефіцієнт кореляції можна обчислити вручну, за допомогою безкоштовних онлайн-калькуляторів або за допомогою гарного графічного калькулятора.

кроки

Метод 1 з 4: Обчислення коефіцієнта кореляції вручну

  1. 1 Зберіть дані. Перед тим як приступити до обчислення коефіцієнта кореляції, вивчіть дані пари чисел. Краще записати їх в таблицю, яку можна розташувати вертикально або горизонтально. Кожен рядок або стовпець позначте як «х» і «у».
    • Наприклад, дані чотири пари значень (чисел) змінних «х» і «у». Можна створити таку таблицю:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Обчисліть середнє арифметичне «х». Для цього складіть всі значення «х», а потім отриманий результат розділіть на кількість значень.
    • У нашому прикладі дані чотири значення змінної «х». Щоб обчислити середнє арифметичне «х», складіть ці значення, а потім суму розділіть на 4. Обчислення запишуться так:
    • μx=(1+2+4+5)/4{ Displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μx=12/4{ Displaystyle mu _ {x} = 12/4}
    • μx=3{ Displaystyle mu _ {x} = 3}
  3. 3 Знайдіть середнє арифметичне «у». Для цього виконайте аналогічні дії, тобто складіть всі значення «у», а потім суму розділіть на кількість значень.
    • У нашому прикладі дані чотири значення змінної «у». Складіть ці значення, а потім суму розділіть на 4. Обчислення запишуться так:
    • μy=(1+3+5+7)/4{ Displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μy=16/4{ Displaystyle mu _ {y} = 16/4}
    • μy=4{ Displaystyle mu _ {y} = 4}
  4. 4 Обчисліть стандартне відхилення «х». Обчисливши середні значення «х» і «у», знайдіть стандартні відхилення цих змінних. Стандартне відхилення обчислюється за такою формулою:
    • σx=1n1Σ(xμx)2{ Displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • У нашому прикладі обчислення запишуться так:
    • σx=141((13)2+(23)2+(43)2+(53)2){ Displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σx=13(4+1+1+4){ Displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σx=13(10){ Displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σx=103{ Displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σx=1,83{ Displaystyle sigma _ {x} = 1,83}
  5. 5 Обчисліть стандартне відхилення «у». Виконайте дії, які описані в попередньому кроці. Скористайтеся тією ж формулою, але підставте в неї значення «у».
    • У нашому прикладі обчислення запишуться так:
    • σy=141((14)2+(34)2+(54)2+(74)2){ Displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σy=13(9+1+1+9){ Displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σy=13(20){ Displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σy=203{ Displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σy=2,58{ Displaystyle sigma _ {y} = 2,58}
  6. 6 Запишіть основну формулу для обчислення коефіцієнта кореляції. У цю формулу входять середні значення, стандартні відхилення і кількість (n) пар чисел обох змінних. Коефіцієнт кореляції позначається як «r» (в окремих випадках як «ρ»). У цій статті використовується формула для обчислення коефіцієнта кореляції Пірсона.
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ Displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • Тут і в інших джерелах величини можуть позначатися по-різному. Наприклад, в деяких формулах присутні «ρ» і «σ», а в інших «r» і «s». У деяких підручниках наводяться інші формули, але вони є математичними аналогами наведеної вище формули.
  7. 7 Розрахуйте коефіцієнт кореляції. Ви вирахували середні значення і стандартні відхилення обох змінних, тому можна скористатися формулою для обчислення коефіцієнта кореляції. Нагадаємо, що «n» - це кількість пар значень обох змінних. Значення інших величин були обчислені раніше.
    • У нашому прикладі обчислення запишуться так:
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ Displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • ρ=(13){ Displaystyle rho = left ({ frac {1} {3}} right) *}[(131,83)(142,58)+(231,83)(342,58){ Displaystyle left ({ frac {1-3} {1,83}} right) * left ({ frac {1-4} {2,58}} right) + left ({ frac {2-3} {1,83}} right) * left ({ frac {3-4} {2,58}} right)}
         +(431,83)(542,58)+(531,83)(742,58){ Displaystyle + left ({ frac {4-3} {1,83}} right) * left ({ frac {5-4} {2,58}} right) + left ( { frac {5-3} {1,83}} right) * left ({ frac {7-4} {2,58}} right)}]
    • ρ=(13)(6+1+1+64,721){ Displaystyle rho = left ({ frac {1} {3}} right) * left ({ frac {6 + 1 + 1 + 6} {4,721}} right)}
    • ρ=(13)2,965{ Displaystyle rho = left ({ frac {1} {3}} right) * 2,965}
    • ρ=(2,9653){ Displaystyle rho = left ({ frac {2,965} {3}} right)}
    • ρ=0,988{ Displaystyle rho = 0,988}
  8. 8 Проаналізуйте отриманий результат. У нашому прикладі коефіцієнт кореляції дорівнює 0,988. Це значення деяким чином характеризує даний набір пар чисел. Зверніть увагу на знак і величину значення.
    • Так як значення коефіцієнта кореляції позитивно, між змінними «х» і «у» має місце позитивна кореляція. Тобто при збільшенні значення «х», значення «у» теж збільшується.
    • Так як значення коефіцієнта кореляції дуже близько до +1, значення змінних «х» і «у» сильно взаємопов'язані. Якщо нанести точки на координатну площину, вони розташуються близько до деякої прямої.

Метод 2 з 4: Використання онлайн-калькуляторів для обчислення коефіцієнта кореляції

  1. 1 В інтернеті знайдіть калькулятор для обчислення коефіцієнта кореляції. Цей коефіцієнт досить часто обчислюється в статистиці. Якщо пар чисел багато, обчислити коефіцієнт кореляції вручну практично неможливо. Тому існують онлайн-калькулятори для обчислення коефіцієнта кореляції. У пошуковику введіть «коефіцієнт кореляції калькулятор» (без лапок).
  2. 2 Введіть дані. Ознайомтеся з інструкціями на сайті, щоб правильно ввести дані (пари чисел). Вкрай важливо вводити відповідні пари чисел; в іншому випадку ви отримаєте невірний результат. Пам'ятайте, що на різних веб-сайтах різні формати введення даних.
    • Наприклад, на сайті http://ncalculators.com/statistics/correlation-coefficient-calculator.htm значення змінних «х» і «у» вводяться в двох горизонтальних рядках. Значення розділяються комами. Тобто в нашому прикладі значення «х» вводяться так: 1,2,4,5, а значення «у» так: 1,3,5,7.
    • На іншому сайті, http://www.alcula.com/calculators/statistics/correlation-coefficient/, дані вводяться по вертикалі; в цьому випадку не переплутайте відповідні пари чисел.
  3. 3 Розрахуйте коефіцієнт кореляції. Ввівши дані, просто натисніть на кнопку «Calculate», «Обчислити» або аналогічну, щоб отримати результат.

Метод 3 з 4: Використання графічного калькулятора

  1. 1 Введіть дані. Візьміть графічний калькулятор, перейдіть в режим статистичних обчислень і виберіть команду «Edit» (Редагувати).
    • На різних калькуляторах потрібно натискати різні клавіші. У цій статті розглядається калькулятор Texas Instruments TI-86.
    • Щоб перейти в режим статистичних обчислень, натисніть [2nd] - Stat (у верхній частині клавіші «+»). Потім натисніть F2 - Edit (Редагувати).
  2. 2 Видаліть попередні збережені дані. У більшості калькуляторів введені статистичні дані зберігаються до тих пір, поки ви не зітрете їх. Щоб не сплутати старі дані з новими, спочатку видаліть будь-яку збережену інформацію.
    • За допомогою клавіш зі стрілками перемістіть курсор і виділіть заголовок «xStat». Потім натисніть Clear (Очистити) і Enter (Ввести), щоб видалити всі значення, введені в стовпець xStat.
    • За допомогою клавіш зі стрілками виділіть заголовок «yStat». Потім натисніть Clear (Очистити) і Enter (Ввести), щоб видалити всі значення, введені в стовпець уStat.
  3. 3 Введіть вихідні дані. За допомогою клавіш зі стрілками перемістіть курсор до першої комірки під заголовком «xStat». Введіть перше значення і натисніть Enter. У нижній частині екрана відобразиться «xStat (1) = __», де замість пробілу буде стояти введене значення. Після того як ви натиснете Enter, введене значення з'явиться в таблиці, а курсор переміститься на наступний рядок; при цьому в нижній частині екрана відобразиться «xStat (2) = __».
    • Введіть всі значення змінної «х».
    • Ввівши всі значення змінної «х», за допомогою клавіш зі стрілками перейдіть в стовпець yStat і введіть значення змінної «у».
    • Після введення всіх пар чисел натисніть Exit (Вийти), щоб очистити екран і вийти з режиму статистичних обчислень.
  4. 4 Розрахуйте коефіцієнт кореляції. Він характеризує, наскільки близько дані розташовані до деякої прямої. Графічний калькулятор може швидко визначити відповідну пряму і обчислити коефіцієнт кореляції.
    • Натисніть Stat (Статистика) - Calc (Обчислення). На TI-86 потрібно натиснути [2nd] - [Stat] - [F1].
    • Виберіть функцію «Linear Regression» (Лінійна регресія). На TI-86 натисніть [F3], яка позначена як «LinR». На екрані відобразиться рядок «LinR _» з миготливим курсором.
    • Тепер введіть імена двох змінних: xStat і yStat.
      • На TI-86 відкрийте список імен; для цього натисніть [2nd] - [List] - [F3].
      • У нижній частині екрана відобразяться доступні змінні. Виберіть [xStat] (для цього, швидше за все, потрібно натиснути F1 або F2), введіть кому, а потім виберіть [yStat].
      • Натисніть Enter, щоб обробити введені дані.
  5. 5 Проаналізуйте отримані результати. Натиснувши Enter, на екрані відобразиться наступна інформація:
    • y=a+bx{ Displaystyle y = a + bx}: Це функція, яка описує пряму. Зверніть увагу, що функція записана не в стандартній формі (у = KХ + b).
    • a={ Displaystyle a =}. Це координата «у» точки перетину прямої з віссю Y.
    • b={ Displaystyle b =}. Це кутовий коефіцієнт прямої.
    • corr={ Displaystyle { text {corr}} =}. Це коефіцієнт кореляції.
    • n={ Displaystyle n =}. Це кількість пар чисел, яке було використано в обчисленнях.

Метод 4 з 4: Пояснення основних понять

  1. 1 Розберіться з поняттям кореляції. Кореляція - це статистична взаємозв'язок двох величин. Коефіцієнт кореляції - це числове значення, яке можна обчислити для будь-яких двох наборів даних. Значення коефіцієнта кореляції завжди лежить в діапазоні від -1 до +1 і характеризує ступінь взаємозв'язку двох змінних.
    • Наприклад, дані зростання і вік дітей (близько 12 років). Швидше за все, тут буде спостерігатися сильна позитивна кореляція, тому що з віком діти стають вище.
    • Приклад негативної кореляції: штрафні секунди і час, проведений на тренуваннях з біатлону, тобто чим більше спортсмен тренується, тим менше штрафних секунд буде нараховано.
    • Нарешті, іноді має місце дуже слабка кореляція (позитивна чи негативна), наприклад, між розміром взуття та оцінками з математики.
  2. 2 Запам'ятайте, як обчислити середнє арифметичне. Щоб обчислити середнє арифметичне (або середнє значення), потрібно знайти суму всіх даних значень, а потім розділити її на кількість значень. Пам'ятайте, що середнє арифметичне необхідно для обчислення коефіцієнта кореляції.
    • Середнє значення змінної позначається буквою з горизонтальною лінією над нею. Наприклад, в разі змінних «х» і «у» їх середні значення позначаються так: x̅ і y̅. Іноді середнє значення позначається грецькою буквою «μ» (мю). Щоб записати арифметичне середнє значень змінної «х», використовуйте позначення μx або μ (x).
    • Наприклад, дані наступні значення змінної «х»: 1,2,5,6,9,10. Середнє арифметичне цих значень обчислюється так:
      • μx=(1+2+5+6+9+10)/6{ Displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μx=33/6{ Displaystyle mu _ {x} = 33/6}
      • μx=5,5{ Displaystyle mu _ {x} = 5,5}
  3. 3 Зверніть увагу на важливість стандартного відхилення. У статистиці стандартне відхилення характеризує ступінь розкиду чисел по відношенню до їх середнього значення. Якщо стандартне відхилення мало, числа розташовані близько до середнього значення; якщо стандартне відхилення велике, числа розташовані далеко від середнього значення.
    • Стандартне відхилення позначається буквою «s» або грецькою буквою «σ» (сигма). Таким чином, стандартне відхилення значень змінної «х» позначається так: sx або σx.
  4. 4 Запам'ятайте символ, що позначає операцію підсумовування. Символ підсумовування є одним з найбільш поширених символів в математиці і вказує на суму значень. Цей символ є грецьку букву «Σ» (прописна сигма).
    • Наприклад, якщо дані наступні значення змінної «х»: 1,2,5,6,9,10, то Σx означає:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Поради

  • Коефіцієнт кореляції іноді називають «коефіцієнтом кореляції Пірсона» на честь його розробника Карла Пірсона.
  • У більшості випадків, коли коефіцієнт кореляції більше 0,8 (позитивний або негативний), має місце сильна кореляція; якщо ж коефіцієнт кореляції менше 0,5 (позитивний або негативний), спостерігається слабка кореляція.

попередження

  • Кореляція характеризує взаємозв'язок значень двох змінних. Але пам'ятайте, що кореляція не має нічого спільного з причинно-наслідковим зв'язком. Наприклад, якщо порівняти зростання і розмір взуття людей, ви, ймовірно, виявите сильну позитивну кореляцію. Як правило, чим вище людина, тим більше розмір взуття. Але це не означає, що збільшення зростання призводить до автоматичного збільшення розміру взуття, або що великі ноги приведуть до прискореного зростання. Ці величини просто взаємопов'язані.