Зміст
Невідповідність - це значення в наборі даних, яке є далеким від інших значень. Розбіжності можуть бути спричинені помилками експерименту чи вимірювання. У перших випадках може виявитися бажаним виявити викиди та видалити їх з інших даних перед проведенням статистичного аналізу, щоб уникнути впливу на результати, оскільки вони не точно представляють сукупність вибірки. Найпростіший спосіб виявити розбіжності - метод квартиля.
Крок 1
Перерахуйте дані у порядку зростання. Розглянемо набір даних {4, 5, 2, 3, 15, 3, 3, 5}. Упорядкований приклад набору даних: {2, 3, 3, 3, 4, 5, 5, 15}.
Крок 2
Знайдіть медіану. Це центральне число, яке ділить більшу половину від другої. Якщо існує парна кількість даних, слід розрахувати середнє значення для двох. Наприклад: у наведеному наборі даних середні точки дорівнюють 3 і 4, тому медіана дорівнює (3 + 4) / 2 = 3,5.
Крок 3
Знайдіть верхній квартиль, Q2, точку даних, яка ділить групу на 75% найменших та 25% найбільших. Якщо набір даних парний, у середньому навколо квартиля складають два бали. У попередньому прикладі: (5 + 5) / 2 = 5.
Крок 4
Знайдіть найнижчий квартиль, Q1, точку даних, яка відокремлює найменший 25% від найбільшого 75%. Якщо набір даних парний, у середньому навколо квартиля складають два бали. У прикладі: (3 + 3) / 2 = 3.
Крок 5
Відніміть нижній квартиль від верхнього квартиля, щоб отримати міжквартильний діапазон, IQ. У прикладі: Q2 - Q1 = 5 - 3 = 2.
Крок 6
Помножте інтерквартильний діапазон на 1,5. Додайте до результату верхній квартиль і відніміть нижній квартиль. Будь-яка точка даних поза цими значеннями є незначною розбіжністю. Для наведеного прикладу: 1,5 х 2 = 3. 3 - 3 = 0 та 5 +3 = 8. Таким чином, будь-яке значення менше 0 або більше 8 було б невеликою невідповідністю. Це означає, що 15 кваліфікується як невелика розбіжність.
Крок 7
Помножте інтерквартильний діапазон на 3. Додайте до верхнього квартиля і відніміть нижній квартиль. Будь-яка точка даних поза цими значеннями є надзвичайною невідповідністю. Для наведеного прикладу 3 x 2 = 6. 3-6 = -3 та 5 + 6 = 11. Таким чином, будь-яке значення менше -3 або більше 11 є надзвичайною невідповідністю. Це означає, що 15 кваліфікується як надзвичайна розбіжність.