что такое квантиль нормального распределения
Квантиль
Материал из MachineLearning.
Содержание
Определение
—кванти́ль случайной величины с функцией распределения — это любое число удовлетворяющее двум условиям:
Заметим, что данные условия эквивалентны следующим:
и x_\alpha)\le 1- \alpha.» alt= «\mathbb
(\xi>x_\alpha)\le 1- \alpha.» />
Если — непрерывная строго монотонная функция, то существует единственный квантиль любого порядка который однозначно определяется из уравнения и, следовательно, выражается через функцию, обратную к функции распределения:
Кроме указанной ситуации, когда уравнение имеет единственное решение (которое и дает соответствующий квантиль), возможны также две других:
Часто используемые квантили специальных видов
Терминология, принятая в математической статистике
В задачах математической статистики часто возникает необходимость отделить сверху, снизу или с обеих сторон области, вероятности попадания в которые малы. В связи с этим часто используется следующая терминология.
Нижний (односторонний) квантиль уровня — то же, что и обычный квантиль порядка :
Верхний (односторонний) квантиль уровня — обычный квантиль порядка :
Применение квантилей в задачах проверки статистических гипотез
Если статистика с указанными свойствами существует, тогда на ее основе можно получить статистический критерий для данной задачи. Для этого необходимо с помощью соответствующих квантилей выделить область (нижнюю, верхнюю или двустороннюю), попадание в которую было бы маловероятно при нулевой гипотезе (и эта вероятность известна), однако может быть объяснено тем, что на самом деле имеет место альтернатива. Многочисленные критерии принятия решения строятся именно по такой схеме.
Применение квантилей в задачах оценивания параметров
Далее можно попробовать разрешить неравенство, стоящее под вероятностью, относительно неизвестного параметра, и переписать его в виде:
чтобы величины и зависели бы только от выборки, т.е. являлись бы статистиками. Если это удается сделать, то мы построили доверительный интервал для неизвестного параметра.
Выборочные квантили; статистическая оценка квантилей
Таким образом, выборочные квантили являются несмещёнными оценками обычных (не выборочных) квантилей.
Квантиль
Кванти́ль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью.
Содержание
Определение
Пусть есть вероятностное пространство и
— вероятностная мера, задающая распределение некоторой случайной величины
. Пусть фиксировано
. Тогда
-квантилью (или квантилью уровня
) распределения
называется число
, такое что
Замечания
где — функция распределения
.
Медиана и квартили
Интерквартильным размахом (англ. Interquartile range ) называется разность между третьим и первым квартилями, то есть . Интерквартильный размах является характеристикой разброса распределения величины и является робастным аналогом дисперсии. Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.
Дециль
Дециль характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля от 90 % наибольших величин, лежащих выше дециля.
Перцентиль
-ой перценти́лью называют квантиль уровня
. При этом обычно рассматривают перцентили для целых
, хотя данное требование не обязательно. Соответственно, медиана является 50-й перцентилью, а первый и третий квартиль — 25-й и 75-й перцентилями.
В целом, понятия квантиль и перцентиль взаимозаменяемы, также, как и шкалы исчисления вероятностей — абсолютная и процентная.
Перцентили также называются процентилями или центилями.
Квантили стандартного нормального распределения
Вероятность, % | 99,99 | 99,90 | 99,00 | 97,72 | 97,50 | 95,00 | 90,00 | 84,13 | 50,00 |
Квантиль | 3,715 | 3,090 | 2,326 | 2,000 | 1,960 | 1,645 | 1,282 | 1,000 | 0,000 |
См. также
Полезное
Смотреть что такое «Квантиль» в других словарях:
Квантиль — численная характеристика, применяемая в математической статистике. Словарь бизнес терминов. Академик.ру. 2001 … Словарь бизнес-терминов
КВАНТИЛЬ — величина, характеризующая функцию распределения F(x). К. распределения порядка р, 0 Геологическая энциклопедия
квантиль — Одна из числовых характеристик случайных величин в математической статистике. БСЭ 3 … Исторический словарь галлицизмов русского языка
квантиль — 3.32 квантиль (fractile): р квантиль (квантиль уровня р или процентиль) и соответствующее значение квантили хропределяется как: F(xp) = p, (3.1) где F функция распределения для хр. Источник … Словарь-справочник терминов нормативно-технической документации
Квантиль — одна из числовых характеристик случайных величин, применяемая в математической статистике. Если функция распределения случайной величины Х непрерывна, то квантиль Kp порядка р определяется как такое число, для которого вероятность… … Большая советская энциклопедия
квантиль — Число xp, p [0,1], удовлетворяющее соотношению Pr(X Словарь социологической статистики
КВАНТИЛЬ — одна из числовых характеристик распределения вероятностей. Для действительной случайной величины Xс функцией распределения F(x)квантилью порядка р, 0 Математическая энциклопедия
КВАНТИЛЬ — одна из характеристик распределения вероятностей (см.). Лит.: Квантиль//Математическая энциклопедия. Т. 2. М. 1979. Ю.Н. Толстова … Российская социологическая энциклопедия
квантиль — квант иль, я … Русский орфографический словарь
квантиль — я, ч., мат. Одна з числових характеристик випадкових величин … Український тлумачний словник
Параметры дискретного закона распределения
В статье описано как найти среднее значение и стандартное отклонение. Вы узнаете, что такое квантиль и каких он бывает видов, а также, как построить доверительный интервал.
Математическое описание
Смотря на закон распределения, мы можем понять, какова вероятность того или иного события, можем сказать, какова вероятность, что произойдёт группа событий, а в этой статье мы рассмотрим, как наши выводы «на глаз» перевести в математически обоснованное утверждение.
Центральный момент степени k:
Среднее значение
Кол-во посетителей | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
Количество наблюдений | 105 | 6 | 56 | 27 | 70 | 54 | 82 |
Таблица 1. Количество посетителей в час |
Чтобы найти среднее значение всех результатов необходимо сложить всё вместе и разделить на количество результатов:
μ = (105 • 0 + 6 • 1 + 56 • 2 + 27 • 3 + 70 • 4 + 54 • 5 + 82 • 6) / 400 = 1241/400 = 3.1
То же самое мы можем проделать используя формулу 2:
μ = M(X) = Σ(Xi•pi) = 0 • 0.26 + 1 • 0.02 + 2 • 0.14 + 3 • 0.07 + 4 • 0.18 + 5 • 0.14 + 6 • 0.21 = 3.1 Момент первой степени, формула (5)
Собственно, формула 2 представляет собой среднее арифметическое всех значений
Итог: в среднем, 3.1 посетителя в час
Количество посетителей | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
Вероятность (%) | 26.3 | 1.5 | 14 | 6.8 | 17.5 | 13.5 | 20.5 |
Таблица 2. Закон распределения количества посетителей |
Отклонение от среднего
Посмотрите на это распределение, можно предположить, что в среднем случайная величина равна 100±5, поскольку кажется, что таких значений несравнимо больше чем тех, что меньше 95 или больше 105:
Среднее значение по формуле (2): μ = 99.95, но как посчитать, насколько далеко все значения находятся от среднего? Вам должна быть знакома запись 100±5. Что бы получить это значение ±, нам необходимо определить диапазон значений вокруг среднего. И мы могли бы использовать в качестве меры удалённости «разность» между средним и случайными величинами:
но сумма таких расстояний, а следовательно и любое производное от этого числа, будет равно нулю, поэтому в качестве меры выбрали квадрат разниц между величинами и средним значением:
σ возведена в квадрат, поскольку вместо расстояний мы взяли квадрат расстояний. σ 2 называется дисперсией. Корень из дисперсии называется средним квадратическим отклонением, или среднеквадратическим отклоненим, и его используют в качестве меры разброса:
Возвращаясь к примеру, посчитаем среднеквадратическое отклонение для графика 2:
Итак, для графика 2 мы получили:
Квантиль
График 3. Функция распределения. Медиана
График 4. Функция распределения. 4-квантиль или квартиль
То есть, если мы говорим о дециле (10-квантиле), то это означает, что мы разбили график на 10 частей, что соответствует девяти линяям, и для каждого дециля нашли значение случайной величины.
Для дискретного распределения квантиль необходимо выбирать следующим образом: квантиль гарантирует вероятность, поэтому, если рассчитанный квантиль не совпадает с одним и значений, необходимо выбирать меньшее значение.
Построение интервалов
Двусторонний доверительный интервал
Двусторонний доверительный интервал строится следующим образом: мы задаёмся уровнем значимости, например, 10%, и выделяем область на графике так, что 90% всех событий попадут в эту область. Поскольку интервал двусторонний, то мы отсекаем по 5% с каждой стороны, т.е. мы ищем 5й перцентиль, 95й перцентиль и значения случайной величины между ними будут являться доверительной областью, значения за пределами доверительной области называются «критическая область«
График 6. Плотность вероятности
Доверительный интервал
График 9. Левосторонний доверительный интервал с уровнем значимости 4%. Заливкой выделен доверительный интервал
График 10. Правосторонний доверительный интервал с уровнем значимости 4%. Заливкой выделен доверительный интервал
Итого
Построить ряд распределения
Предположим, мы имеем 100 значений и все разные, например: масса тела Сомалийских пиратов. Такой набор данных обрабатывать неудобно, мы даже не можем представить их на обычном графике. Поэтому нам необходимо категоризировать имеющиеся данные и для этого мы делаем следующее:
Запишем наши данные в таблицу:
66 | 86 | 115 | 79 | 97 | 111 | 79 | 98 | 93 | 108 |
123 | 96 | 91 | 104 | 95 | 99 | 80 | 91 | 87 | 121 |
79 | 100 | 84 | 89 | 83 | 122 | 98 | 62 | 130 | 94 |
90 | 124 | 116 | 73 | 123 | 120 | 73 | 67 | 73 | 70 |
96 | 79 | 73 | 101 | 115 | 69 | 98 | 81 | 120 | 66 |
82 | 114 | 98 | 78 | 63 | 98 | 107 | 95 | 93 | 111 |
111 | 72 | 69 | 101 | 105 | 100 | 65 | 111 | 112 | 111 |
114 | 97 | 132 | 68 | 72 | 123 | 103 | 96 | 84 | 87 |
111 | 68 | 81 | 72 | 130 | 113 | 108 | 110 | 82 | 73 |
69 | 76 | 132 | 132 | 100 | 71 | 112 | 128 | 117 | 81 |
Таблица 3. Вес сомалийских пиратов |
Данные разобьём на группы, для начала предлагаю разбить на одиннадцать интервалов:
Теперь посчитаем количество пиратов (весов, я имею ввиду) в каждом интервале:
Вуа-ля, наше распределение на графике:
Бонус
Интервалы лучше брать целыми числами, поэтому, если с выбранным количеством интервалов размер выходит нецелым, то можно раздвинуть диапазон значений, пример:
Диапазон можно двигать как вверх, так и вниз, но лучше в обе стороны.
Совет
Принято делить распределение на 7-8 интервалов, но в каждой конкретной ситуации Вы можете выбрать отличное количество интервалов, впрочем, как и сделать их различной длины.
Список параметров
Итак, вот список основных параметров дискретного закона распределения:
КВАНТИЛЬ
— одна из числовых характеристик распределения вероятностей. Для действительной случайной величины Xс функцией распределения F(x)квантилью порядка р, 0 р, то вероятность неравенства
Полезное
Смотреть что такое «КВАНТИЛЬ» в других словарях:
Квантиль — численная характеристика, применяемая в математической статистике. Словарь бизнес терминов. Академик.ру. 2001 … Словарь бизнес-терминов
КВАНТИЛЬ — величина, характеризующая функцию распределения F(x). К. распределения порядка р, 0 Геологическая энциклопедия
квантиль — Одна из числовых характеристик случайных величин в математической статистике. БСЭ 3 … Исторический словарь галлицизмов русского языка
квантиль — 3.32 квантиль (fractile): р квантиль (квантиль уровня р или процентиль) и соответствующее значение квантили хропределяется как: F(xp) = p, (3.1) где F функция распределения для хр. Источник … Словарь-справочник терминов нормативно-технической документации
Квантиль — в математической статистике значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Содержание 1 Определение 2 Замечания 3 Медиан … Википедия
Квантиль — одна из числовых характеристик случайных величин, применяемая в математической статистике. Если функция распределения случайной величины Х непрерывна, то квантиль Kp порядка р определяется как такое число, для которого вероятность… … Большая советская энциклопедия
квантиль — Число xp, p [0,1], удовлетворяющее соотношению Pr(X Словарь социологической статистики
КВАНТИЛЬ — одна из характеристик распределения вероятностей (см.). Лит.: Квантиль//Математическая энциклопедия. Т. 2. М. 1979. Ю.Н. Толстова … Российская социологическая энциклопедия
квантиль — квант иль, я … Русский орфографический словарь
квантиль — я, ч., мат. Одна з числових характеристик випадкових величин … Український тлумачний словник
Квантиль
Смотреть что такое «Квантиль» в других словарях:
Квантиль — численная характеристика, применяемая в математической статистике. Словарь бизнес терминов. Академик.ру. 2001 … Словарь бизнес-терминов
КВАНТИЛЬ — величина, характеризующая функцию распределения F(x). К. распределения порядка р, 0 Геологическая энциклопедия
квантиль — Одна из числовых характеристик случайных величин в математической статистике. БСЭ 3 … Исторический словарь галлицизмов русского языка
квантиль — 3.32 квантиль (fractile): р квантиль (квантиль уровня р или процентиль) и соответствующее значение квантили хропределяется как: F(xp) = p, (3.1) где F функция распределения для хр. Источник … Словарь-справочник терминов нормативно-технической документации
Квантиль — в математической статистике значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Содержание 1 Определение 2 Замечания 3 Медиан … Википедия
квантиль — Число xp, p [0,1], удовлетворяющее соотношению Pr(X Словарь социологической статистики
КВАНТИЛЬ — одна из числовых характеристик распределения вероятностей. Для действительной случайной величины Xс функцией распределения F(x)квантилью порядка р, 0 Математическая энциклопедия
КВАНТИЛЬ — одна из характеристик распределения вероятностей (см.). Лит.: Квантиль//Математическая энциклопедия. Т. 2. М. 1979. Ю.Н. Толстова … Российская социологическая энциклопедия
квантиль — квант иль, я … Русский орфографический словарь
квантиль — я, ч., мат. Одна з числових характеристик випадкових величин … Український тлумачний словник