Обчислити суму квадратів (SSE)

Автор: Charles Brown
Дата Створення: 9 Лютий 2021
Дата Оновлення: 1 Липня 2024
Anonim
НАЙТИ СУММУ ЧЕТНЫХ ЧИСЕЛ В МАССИВЕ C# | РАБОТА С МАССИВАМИ | СИ ШАРП УРОКИ | ДОМАШНИЕ ЗАДАНИЯ # 8
Відеоролик: НАЙТИ СУММУ ЧЕТНЫХ ЧИСЕЛ В МАССИВЕ C# | РАБОТА С МАССИВАМИ | СИ ШАРП УРОКИ | ДОМАШНИЕ ЗАДАНИЯ # 8

Зміст

Сума квадратів (SSE) - це попередній статистичний розрахунок, що приводить до різних значень даних. Коли у вас є набір значень даних, корисно мати можливість визначити, наскільки ті значення пов’язані між собою. Ви повинні впорядкувати свої дані в таблиці, а потім виконати досить прості обчислення. Як тільки ви знайдете SSE для набору даних, ви зможете знайти дисперсію та стандартне відхилення.

Крок

Метод 1 з 3: Розрахувати SSE вручну

  1. Створіть таблицю з трьох стовпців. Найбільш зрозумілий спосіб обчислення SSE - це почати з таблиці з трьох стовпців. Позначте три стовпці Значення{ displaystyle { text {Значення}}}Заповніть деталі. Перший стовпець містить значення ваших вимірювань. Заповніть колонку Значення{ displaystyle { text {Значення}}}Обчисліть середнє значення. Перш ніж ви зможете розрахувати похибку для кожного вимірювання, ви повинні обчислити середнє значення всього набору даних.
    • Середнє значення набору даних - це сума значень, поділена на кількість значень у наборі. Це може бути представлено символічно із змінною μ{ displaystyle mu}Обчисліть значення окремих помилок. У другому стовпці таблиці потрібно ввести значення помилок для кожного значення даних. Похибка - це різниця між вимірюванням та середнім показником.
      • Для даного набору даних відніміть середнє значення 98,87 від кожного виміряного значення та заповніть результати в другому стовпці. Ці десять розрахунків виконуються наступним чином:
        • 99,098,87=0,13{ displaystyle 99,0-98,87 = 0,13}Обчислити SSE. У третьому стовпці таблиці знайдіть квадрат кожного з отриманих значень у середньому стовпці. Вони представляють квадрати відхилення від середнього значення для кожного виміряного значення даних.
          • Для кожного значення в середньому стовпці використовуйте калькулятор для обчислення квадрата. Результати запишіть у третій стовпець наступним чином:
            • 0,132=0,0169{ displaystyle 0,13 ^ {2} = 0,0169}Складіть квадрати помилок. Останнім кроком є ​​пошук суми значень у третьому стовпці. Бажаний результат - SSE, або сума квадратів помилок.
              • Для цього набору даних SSE обчислюється додаванням десяти значень у третьому стовпці:
              • С.С.Е=6,921{ displaystyle SSE = 6.921}Позначте стовпці електронної таблиці мітками. Ви створюєте таблицю з трьома стовпцями в Excel із тими самими трьома заголовками, що і вище.
                • У комірку A1 введіть "Значення" як заголовок.
                • У полі B1 введіть "Відхилення" як заголовок.
                • У полі С1 введіть "Відхилення в квадраті" як заголовок.
              • Введіть свої дані. У першому стовпці ви повинні ввести значення своїх вимірювань. Якщо набір невеликий, ви можете легко набрати його вручну. Якщо у вас великий набір даних, можливо, вам доведеться скопіювати та вставити дані в стовпець.
              • Визначте середнє значення точок даних. Excel має функцію, яка обчислює середнє значення для вас. У порожню комірку під таблицею даних (не має значення, яку комірку ви вибрали) введіть наступне:
                • = Середнє (A2: ___)
                • Не вводьте порожнє місце. Заповніть цей простір іменем комірки останньої точки даних. Наприклад, якщо у вас є 100 точок даних, ви скористаєтесь функцією:
                  • = Середнє (A2: A101)
                  • Ця функція містить дані з комірок від A2 до A101, оскільки верхній рядок містить заголовки стовпців.
                • При натисканні клавіші Enter або при натисканні на іншу комірку таблиці, щойно запрограмована комірка автоматично заповнюється середнім значенням даних.
              • Введіть функцію вимірювання помилок. У першу порожню клітинку стовпця "Відхилення" введіть функцію для обчислення різниці між кожною точкою даних та середнім значенням. Для цього використовуйте ім’я комірки, де знаходиться середнє значення. Припустимо, ви використовували клітинку A104 на даний момент.
                • Функція обчислення помилок, яку ви вводите в клітинку B2:
                  • = A2- $ A $ 104. Знаки долара потрібні, щоб переконатися, що ви зафіксували ящик A104 для будь-якого розрахунку.
              • Введіть функцію для помилок у квадраті. У третьому стовпці ви можете доручити Excel розрахувати потрібний квадрат.
                • У комірку С2 введіть таку функцію:
                  • = B2 ^ 2
              • Скопіюйте функції, щоб заповнити всю таблицю. Після введення функцій у верхню комірку кожного стовпця, В2 та С2 відповідно, потрібно заповнити всю таблицю. Ви можете переписати функцію в будь-якому рядку таблиці, але це займе занадто багато часу. За допомогою миші виділіть клітинки B2 і C2 разом і, не відпускаючи кнопку миші, перетягніть до нижньої комірки кожного стовпця.
                • Припускаючи, що у вашій таблиці є 100 точок даних, перетягніть мишу до комірок B101 та C101.
                • Коли ви відпускаєте кнопку миші, формули копіюються у всі комірки таблиці. Таблиця повинна автоматично заповнюватися розрахунковими значеннями.
              • Знайдіть SSE. Стовпець C вашої таблиці містить усі значення помилок у квадраті. Останній крок - дозволити Excel обчислити суму цих значень.
                • У комірку під таблицею, можливо C102 у цьому прикладі, введіть таку функцію:
                  • = Сума (C2: C101)
                • Якщо натиснути клавішу Enter або клацнути в іншій комірці таблиці, ви отримаєте значення SSE ваших даних.

Метод 3 із 3: Пов’яжіть SSE з іншими статистичними даними

  1. Обчисліть відхилення від SSE. Пошук SSE для набору даних, як правило, є основою для пошуку інших, більш корисних значень. Перший з них - дисперсія. Дисперсія - це міра того, наскільки відміряні дані відхиляються від середнього значення. Це насправді середнє значення квадратних відмінностей від середнього.
    • Оскільки SSE - це сума помилок у квадраті, ви можете знайти середнє значення (це дисперсія), просто поділивши на кількість значень. Однак, якщо ви обчислюєте дисперсію вибіркової серії, а не всієї сукупності, ви ділите дисперсію на (n-1), а не на n. Так:
      • Дисперсія = SSE / n, якщо обчислити дисперсію цілої сукупності.
      • Дисперсія = SSE / (n-1), при обчисленні дисперсії вибірки даних.
    • Щодо проблеми вибірки температури пацієнтів, ми можемо припустити, що 10 пацієнтів є лише зразком. Тому дисперсія обчислюється наступним чином:
      • Дисперсія=SSE(n1){ displaystyle { text {Variance}} = { frac { text {SSE}} {(n-1)}}}Обчисліть середньоквадратичне відхилення SSE. Стандартне відхилення - це загальновживане значення, яке вказує, наскільки значення набору даних відхиляються від середнього. Стандартне відхилення - це квадратний корінь з дисперсії. Пам’ятайте, що дисперсія є середнім значенням вимірювань похибки у квадраті.
        • Отже, після обчислення SSE ви можете знайти стандартне відхилення таким чином:
          • Стандартне відхилення=SSEn1{ displaystyle { text {Стандартне відхилення}} = { sqrt { frac { text {SSE}} {n-1}}}}Використовуйте SSE для визначення коваріації. Ця стаття зосереджена на наборах даних, які одночасно вимірюють лише одне значення. Однак у багатьох дослідженнях ви можете порівняти два окремі значення. Наприклад, ви хочете знати, як ці два значення співвідносяться між собою, а не лише із середнім значенням набору даних. Це значення є коваріацією.
            • Розрахунки для коваріації занадто деталізовані, щоб їх тут описувати, за винятком того, що ви будете використовувати SSE для кожного типу даних, а потім порівняти його. Для більш детального опису коваріації та задіяних обчислень ви можете знайти статті на цю тему на wikiHow.
            • Як приклад використання коваріації можна порівняти вік пацієнтів у медичному дослідженні з ефективністю препарату для зниження температури лихоманки. Тоді у вас є один набір даних про вік і другий набір даних про температури. Потім ви знайдете SSE для кожного набору даних, а звідти дисперсію, стандартні відхилення та коваріацію.