Boxplot, англійською мовою, boxplot - це подання кількісної або категоріальної змінної з метою швидкої ідентифікації квартилів набору даних.
Іншими словами, бокс-сюжет - це графік, який представляє кількісну або якісну змінну через квартилі.
У статистиці це корисний інструмент для представлення як дискретних, так і безперервних наборів даних.
Важливо пам’ятати, що якісні змінні змінні або призначені для представлення порядку чи категорії завжди повинні бути пов’язані з числовим індексом, більшим за 0, щоб вони могли з’являтися на графіку та обчислювати відповідну статистику.
Графік коробки та гістограма
Діаграма коробки - це не що інше, як гістограма, яка розглядається згори, і таким же чином гістограма - це графік коробки, що розглядається збоку. Приклад можна побачити нижче.
Перша характеристика, яку спільно використовують обидві діаграми, - це мінімум і максимум набору даних. Кінцеві смуги після тире вказують мінімум (нижній стовпчик) і максимум (верхній стовпчик). Випадки будуть представлені поза діапазоном максимуму та мінімуму. Тобто, за гратами після дефісів. Ми також можемо знайти горизонтальні ділянки коробки.
З одного погляду видно, що більшість даних зосереджені на спостереженнях, що знаходяться поблизу мінімуму на обох графіках. На це вказує графік коробки, в якому поле ближче до мінімуму, ніж максимум. Якщо ми подивимося на гістограму, то побачимо, що найбільш частими спостереженнями є спостереження, близькі до мінімуму та далекі від максимуму.
Відомості про сюжет
Інформація, подана в графічному графіку, така:
- На дні коробки знаходиться перший квартиль (Q1).
- Стовпчик посередині поля - це медіана або другий квартиль (Q2).
- У верхній частині вікна знаходиться третій квартиль (Q3).
- Міжквартильний діапазон або IQR буде висотою ящика, тобто різницею між Q3 та Q1.
Ключ сюжету коробки
Це графічне зображення називається графіком вікна, оскільки воно виглядає як вікно. Тому, щоб запам’ятати цей графік, нам потрібно було б лише подумати про квадратний об’єкт чи коробку.
Для читачів, які знайомі з ціною фінансових активів, вони побачать більше схожості зі свічкою. Свічки, які ви бачите в цитаті, - це графічні рамки, пристосовані до обраного часового вікна.
Переваги та недоліки ділянки коробки
Серед переваг і недоліків цієї схеми ми знаходимо наступне:
Перевага
- Глобальне бачення абсолютної частоти кількісної або якісної змінної.
- Знання мінімуму, максимуму та квартилів набору даних без необхідності їх обчислювати.
- Розпізнавання екстремальних значень швидше, ніж за допомогою гістограми, оскільки крайні значення позначаються колами поза максимумом та мінімумом.
Недоліки
- Якщо набір даних невеликий, складання графіку для вираження цих даних ускладнить розуміння.
Приклад сюжету коробки
Ми припускаємо, що хочемо представити кількість велосипедистів, які проїжджають наш будинок протягом року. Спочатку ми підраховуємо велосипедистів і збираємо інформацію в таблиці.
За допомогою деяких програм, таких як R або Excel, ми можемо створити графік, показаний нижче.
Завдяки представленню кількості велосипедистів за графіком, ми можемо швидко зрозуміти, де медіана, інші квартилі, максимум і мінімум. У цьому випадку ми не маємо нетипових даних, оскільки за межами максимуму та мінімуму нічого немає.
Застосування цього типу графіків є дуже поширеним, враховуючи його простоту та корисність у багатьох сферах, окрім фінансів та економіки.