Учебная практика 1 курс биоинженеры (Интерквартильный размах от Фуфелмертца)
Понятие об интерквартильном размахе для чайников
Итак, доброго дня суток, сегодня с вами снова команда Фуфелшмертца! О чем же мы поговорим на этот раз? Мы бы очень хотели обсудить сериальчики, но это как-нибудь потом. Сейчас мы вам расскажем и постараемся объяснить, что такое интерквартильный размах в математической статистике. Начнем?
Немножко упомянем историю. Понятие об интерквартильном размахе было введено в 1882 г. Ф.Гальтоном. Сперва давайте разберемся, что значит слово "интерквартильный". "Интер" - между. То есть, буквально "между квартилями". Следовательно, назревает другой вопрос - что такое этот "квартиль" (оказывается, это слово мужского рода)?
Квартиль - это такие значения, которые делят вариационный ряд на четыре равные части. Различают три вида квартилей:
- первый (нижний) квартиль (Q1)
- второй (центральный) квартиль, он же медиана (Q2)
- третий (верхний) (Q3)
Рассмотрим наглядный пример. Вот у нас имеется ряд чисел:
1, 6, 9, 12, 16, 21, 25
Для простоты найдем сперва медиану. В данном случае, так как количество цифр нечетное, нашей медианой является число 12, ведь именно оно находится посередине. Если же у нас было четное количество цифр, то медианой являлось среднее арифметическое двух центральных чисел.
Дальше уже проще. Чтобы найти нижний квартиль, нужно посмотреть на те числа, что находятся левее медианы, и, условно, найти медиану в этой части ряда. Первый квартиль отсекает 1/4 единиц ряда с минимальными значениями. В нашем примере, первым квартилем является число 6. Если бы в этой части ряда было четное количество цифр, то ее медиану мы бы искали как среднее арифметическое центральных значений (например, у нас есть ряд 1, 3, 6, 9, считая от медианы, то первым квартилем будет среднее арифметическое чисел 3 и 6, то есть (3+6)/2=4.5). Аналогично с верхним квартилем, который отсекает 1/4 единиц уже с максимальными значениями: смотрим, какое число стоит средним уже в правой части ряда от медианы, и видим, что это цифра 21.
Есть другой способ. Сейчас мы находили данные наглядно, но есть специальные формулы по нахождению положения квартилей (не значений):
где n-количество цифр в ряду.
Мы с вами определили три квартили: Q1=6, Q2=12, Q3=21. Поэтому потихоньку возвращаемся к понятию интерквартильный размах (IQR) и к расшифровке этого странного слова - "между квартилями". Интерквартильный размах - это разница между верхним и нижним квартилем. Вот и все. Это можно записать, как IQR=Q3-Q1.
Получается, что в нашем с вами примере интерквартильный (или в некоторых источниках межквартильный) размах равен 21-6=15. Все довольно просто. Но что это число обозначает? Интерквартильный размах показывает, насколько разбросаны значения рассматриваемого набора чисел, считая от первого до третьего квартиля (то есть центральные значения). Но его минус заключается в том, что размах не позволяет определить, как именно распределены данные между собой.
Еще один пример определения квартилей и интерквартильного размаха
Теперь можем сделать небольшие выводы:
- межквартильный размах - это разница между третьим и первым квартилем
- в него входит 50% данных
- квартили и межквартильный размах - устойчивые показатели, так как выбросы не влияют на их изменение
Очень надеемся, что у нас получилось немного рассказать об этом, казалось бы, несложном понятии и донести до вас его значение. До новых встреч!