что такое бимодальное распределение

Что такое бимодальное распределение

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

При подготовке очередного материала глоссария по теме бимодального распределения мой коллега откопал в сети очень интересный тезис. Покажется ли он столь же интересным вам, не знаю, однако понять, что такое бимодальное распределение, обязательно поможет.

Описание термина бимодальное распределение может выглядеть так сложно:

Бимодально распределенная случайная величина X определяется как Y с вероятностью α или Z с вероятностью (1 – α), где Y и Z – унимодальные случайные величины, 0 1

Чтобы проверить это утверждение опытным путем, сгенерируем 3 набора данных:

В Minitab используйте команду Calc > Random Data > Normal и внесите настройки, как показано на рисунке ниже:

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Затем, используя команду Data > Stack > Stack Columns, соединим колонки попарно: C1 и C2, C1 и C3:

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Если вы тоже решили поэкспериментировать, то к этому моменту у вас должно получиться примерно следующее:

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Теперь построим гистограммы:

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

На следующем рисунке размещены гистограммы “смесей”, а также “совмещенные” гистограммы (Histogram with groups):

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

На первый взгляд кажется, что и в первом, и во втором случаях можно наблюдать две моды. Однако критерий Андерсона-Дарлинга возвращает в первом случае p-value 0,614, а во втором – 0,033. Следовательно, в первом случае распределение подчиняется нормальному закону, а во втором – нет.

Давайте выделим важные моменты:

Итак, пример с ростом мужчин и женщин не столь удачен, как могло показаться на первый взгляд. Что же может проиллюстрировать бимодальное распределение лучше?

Кроме отличного примера распределения времени переналадки, опубликованного на нашем сайте, нам удалось найти следующие интересные примеры:

Вот такой вот ПНДэ.

А какой пример бимодального распределения можете привести вы?

______________________________________
1 “Is Human Height Bimodal?” by Mark F. Schilling, Ann E. Watkins and William Watkins, The American Statistician, Vol. 56, No. 3 (Aug., 2002), pp. 223-229

Источник

Наиболее распространенным типом преобразования данных в бизнесе и экономике является логарифмирование, ко­торое можно использовать только для положительных чисел (т.е. для данных, которые включают отрицательные значения или нуль, этот метод не подходит). Логарифмирование часто преобразует скошенные (асимметричные) данные в симметричные, поскольку происходит растягивание шкалы возле нуля, что, в свою очередь, приводит к распределению малых значений, сгруппированных вместе. В то же время логарифмирование собирает вместе большие значения, ко­торые распределены на правом (положительном) конце шкалы. Оба типа наибо­лее часто используемых логарифмов («десятичный логарифм» по основанию 10 и «натуральный логарифм» по основанию «е» ) одинаково эффективно можно ис­пользовать для такого рода преобразований. Мы будем использо­вать десятичный логарифм.

Интерпретация и вычисление логарифма

Разница на 1 для значений логарифма по основанию 10 соответствует десяти­кратной разнице для исходных значений. Например, значения 392,1 и 3921 (со­отношение 1:10, разница в 10 раз) после логарифмирования преобразуются соот­ветственно в значения 2,59 и 3,59 (разница на 1). В табл. 3.4.2 содержатся при­меры нескольких чисел и их логарифмов.

Таблица 3.4.2. Результаты логарифмирования по основанию 10

Из таблицы видно, как логарифм «стягивает вместе» очень большие числа, уменьшая разницу между ними и другими значениями в наборе данных (напри­мер, вместо разницы в 100 миллионов получаем разницу в 8 единиц).

Чаще всего используют логарифмы двух видов. Мы рассмотрели логарифмы по основанию 10. Логарифмы второго вида называют натуральными, их обозна­чают ln и вычисляют по основанию числа е = 2,71828. Натуральный логарифм часто используют при вычислении сложных процентов, темпов роста, экономи­ческой эластичности и др. В преобразованиях данных оба вида логарифмов при­водят к одинаковому эффекту, т.е. «стягивают вместе» на числовой оси большие числа и «растягивают» малые.

Многие электронные таблицы, например Microsoft Excel, имеют встроенные функции логарифмирования.

3.5. Бимодальные распределения

Важно уметь определять, когда набор данных состоит из двух или более от­четливо различающихся между собой групп, чтобы можно было при необходи­мости анализировать эти группы отдельно. На гистограмме такой ситуации соот­ветствует разрыв между двумя соседними группами столбиков. Если на гисто­грамме четко видны две отдельные группы, то это говорит о бимодальном распределении данных. Бимодальное распределение — это распределение, имеющее две модыили два различных кластера (блока) данных.

Наличие бимодального распределения может свидетельствовать о том, что си­туация более сложная, чем вы предполагали, и поэтому требует серьезного внима­ния. По меньшей мере, следует выявить причины наличия двух групп. Возможно, интерес представляет только одна группа, поэтому другую группу можно исключить из рассмотрения. А может быть, вам необходимо изучить обе группы, но сле­дует внести некоторые уточнения, чтобы учесть факт имеющегося различия.

3.6. Выбросы (сильно отклоняющиеся значения)

Иногда в данных можно наблюдать выбросы (сильно отклоняющиеся значе­ния), т.е. такие значения, которые, по-видимому, не принадлежат данному рас­пределению, поскольку они либо слишком велики, либо слишком малы. В зави­симости от причин, вызвавших выбросы, проблему выбросов решают по-разному. Существуют два вида выбросов значений: ошибки и корректные, но «отличающиеся» значения данных.

Чтобы распечатать файл, скачайте его (в формате Word).

Источник

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

СОДЕРЖАНИЕ

Терминология

Классификация Галтунга

Галтунг ввел систему классификации (AJUS) для распределений:

С тех пор эта классификация была немного изменена:

В соответствии с этой классификацией бимодальные распределения классифицируются как тип S или U.

Примеры

Бимодальные распределения встречаются как в математике, так и в естественных науках.

Распределения вероятностей

Отношение двух нормальных распределений также распределяется бимодально. Позволять

Т статистики генерируется из набора данных взяты из распределения Коши является бимодальным.

Встречи в природе

Эконометрика

В эконометрических моделях параметры могут быть распределены бимодально.

Происхождение

Математический

Смеси с двумя отдельными компонентами не обязательно должны быть бимодальными, а двухкомпонентные смеси с одномодальными плотностями компонентов могут иметь более двух режимов. Непосредственной связи между количеством компонентов в смеси и количеством мод результирующей плотности нет.

Особые распределения

Бимодальные распределения, несмотря на то, что они часто встречаются в наборах данных, изучаются очень редко. Это может быть связано с трудностями при оценке их параметров частотными или байесовскими методами. Среди тех, что были изучены:

Биология

В биологии известно пять факторов, способствующих бимодальному распределению размеров популяций:

Бимодальное распределение размеров рабочих- ткачей-муравьев возникает из-за существования двух различных классов рабочих, а именно основных рабочих и второстепенных рабочих.

Общие свойства

Смесь двух одномодальных распределений с разными средними значениями не обязательно является бимодальным. Комбинированное распределение роста мужчин и женщин иногда используется в качестве примера бимодального распределения, но на самом деле разница в средних ростах мужчин и женщин слишком мала по сравнению со стандартными отклонениями для получения бимодальности.

Бимодальные распределения обладают тем особенным свойством, что, в отличие от унимодальных распределений, среднее значение может быть более надежной оценкой выборки, чем медиана. Это явно тот случай, когда распределение имеет U-образную форму, как распределение арксинуса. Это может быть неверно, если у распределения есть один или несколько длинных хвостов.

Моменты смесей

Моменты f ( x ) равны

Смесь двух нормальных распределений

Нередко встречаются ситуации, когда исследователь полагает, что данные получены из смеси двух нормальных распределений. В связи с этим данная смесь достаточно подробно изучена.

Смесь двух нормальных распределений имеет пять параметров для оценки: два средних, две дисперсии и параметр смешивания. Смесь двух нормальных распределений с равными стандартными отклонениями является бимодальной только в том случае, если их средние значения различаются как минимум на двойное стандартное отклонение. Оценка параметров упрощается, если дисперсии можно считать равными ( гомоскедастический случай).

Если средние двух нормальных распределений равны, то комбинированное распределение является унимодальным. Условия унимодальности комбинированного распределения были выведены Эйзенбергером. Необходимые и достаточные условия для того, чтобы смесь нормальных распределений была бимодальной, были идентифицированы Рэем и Линдси.

Смесь двух примерно равных массовых нормальных распределений имеет отрицательный эксцесс, поскольку две моды по обе стороны от центра масс эффективно уменьшают хвосты распределения.

Смесь двух нормальных распределений с сильно неравной массой имеет положительный эксцесс, поскольку меньшее распределение удлиняет хвост более доминирующего нормального распределения.

Смеси других распределений требуют оценки дополнительных параметров.

Тесты на унимодальность

Коэффициент разделения ( S ) равен

Если дисперсии равны, то S = 1. Плотность смеси унимодальна тогда и только тогда, когда

Сводные статистические данные

D Эшмана

Для смеси двух нормальных распределений требуется D > 2 для четкого разделения распределений.

A ван дер Эйка

Значение U равно 1, если распределение имеет любую из трех следующих характеристик:

Равномерное распределение имеет = 0: когда все ответы попадают в одну категорию А = +1.

Одна теоретическая проблема с этим индексом заключается в том, что он предполагает, что интервалы расположены на одинаковом расстоянии. Это может ограничить его применимость.

Бимодальное разделение

Этот индекс предполагает, что распределение представляет собой смесь двух нормальных распределений со средними ( μ 1 и μ 2 ) и стандартными отклонениями ( σ 1 и σ 2 ):

Коэффициент бимодальности

Коэффициент бимодальности Сарла b равен

Формула для конечной выборки:

Амплитуда бимодальности

Это определяется как

A B всегда Бимодальное соотношение

Это соотношение левого и правого пиков. Математически

р знак равно А р А л <\ displaystyle R = <\ frac > >>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Параметр бимодальности

Этот параметр ( B ) принадлежит Уилкоку.

B знак равно ( А р А л ) 0,5 ∑ п я <\ Displaystyle B = (<\ гидроразрыва > >>) ^ <0,5>\ sum P_ > что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Для использования этого индекса берется журнал значений. Затем данные делятся на интервал шириной Φ, значение которого равно log 2. Ширина пиков принимается равной четырехкратной 1 / 4Φ, центрированной по их максимальным значениям.

Индексы бимодальности

Индекс бимодальности, предложенный Ван и др., Предполагает, что распределение является суммой двух нормальных распределений с равными дисперсиями, но разными средними значениями. Это определяется следующим образом:

Другой индекс бимодальности был предложен Стурроком.

Этот индекс ( B ) определяется как

Когда m = 2 и γ равномерно распределен, B распределен экспоненциально.

индекс де Микеле и Аккатино

Другой индекс бимодальности был предложен де Микеле и Аккатино. Их индекс ( B ) равен

Авторы предложили значение отсечения 0,1 для B, чтобы различать бимодальное ( B > 0,1) и одномодальное ( B Индекс Сэмбрука Смита

Еще один индекс ( B ) был предложен Sambrook Smith et al.

Авторы рекомендовали значение отсечения 1,5, при этом B больше 1,5 для бимодального распределения и меньше 1,5 для унимодального распределения. Никакого статистического обоснования этого значения не было.

Индекс Чаудхури и Агравала

Другой параметр бимодальности был предложен Чаудхури и Агравалом. Этот параметр требует знания дисперсии двух субпопуляций, составляющих бимодальное распределение. Он определяется как

Это средневзвешенное значение дисперсии. Авторы предполагают, что этот параметр можно использовать в качестве цели оптимизации для разделения выборки на две субпопуляции. Никакого статистического обоснования этому предположению дано не было.

Статистические тесты

Доступен ряд тестов, чтобы определить, распределяется ли набор данных бимодальным (или мультимодальным) способом.

Графические методы

При изучении отложений размер частиц часто бывает двухрежимным. Эмпирически было обнаружено, что полезно построить график зависимости частоты от логарифма (размера) частиц. Обычно это дает четкое разделение частиц на бимодальное распределение. В геологических приложениях логарифм обычно берется с основанием 2. Преобразованные логарифмические значения называются единицами фи (Φ). Эта система известна как шкала Крамбейна (или фи).

Альтернативный метод заключается в построении логарифма размера частиц в зависимости от совокупной частоты. Этот график обычно состоит из двух достаточно прямых линий с соединительной линией, соответствующей антимоде.

Приблизительные значения для нескольких статистических данных можно получить из графических графиков.

Унимодальное и бимодальное распределение

Бейкер предложил преобразование для преобразования бимодального распределения в одномодальное.

Предложен метод, основанный на оценках и тестах Вальда. Этот метод позволяет различать одномодальные и бимодальные распределения, если известны лежащие в основе распределения.

Антимодовые тесты

Статистические тесты для антирежима известны.

Метод Оцу обычно используется в компьютерной графике для определения оптимального разделения двух распределений.

Общие тесты

Тест Сильвермана

Сильверман представил метод начальной загрузки для количества режимов. Тест использует фиксированную полосу пропускания, что снижает мощность теста и его интерпретируемость. Недостаточно сглаженные плотности могут иметь чрезмерное количество режимов, количество которых во время начальной загрузки нестабильно.

Тест Баджье-Аггарвала

Баджье и Аггарвал предложили тест, основанный на эксцессе распределения.

Особые случаи

Дополнительные тесты доступны для ряда особых случаев:

Смесь двух нормальных распределений

Исследование плотности смеси данных двух нормальных распределений показало, что разделение на два нормальных распределения было затруднительным, если средние значения не были разделены на 4–6 стандартных отклонений.

В астрономии алгоритм Kernel Mean Matching используется для определения принадлежности набора данных к одному нормальному распределению или к смеси двух нормальных распределений.

Это распределение является бимодальным для определенных значений параметров is. Был описан тест на эти значения.

Кривые оценки параметров и аппроксимации

Предполагая, что распределение известно как бимодальное или было показано, что оно является бимодальным одним или несколькими из приведенных выше тестов, часто бывает желательно подобрать кривую к данным. Это может быть сложно.

Байесовские методы могут быть полезны в сложных случаях.

Программное обеспечение

Пакет для R доступен для тестирования на бимодальность. Этот пакет предполагает, что данные распределены как сумма двух нормальных распределений. Если это предположение неверно, результаты могут быть ненадежными. Он также включает функции для подбора суммы двух нормальных распределений к данным.

Если предположить, что распределение представляет собой смесь двух нормальных распределений, то для определения параметров можно использовать алгоритм максимизации ожидания. Для этого доступно несколько программ, включая Cluster и пакет R nor1mix.

Пакет mixtools, доступный для R, может тестировать и оценивать параметры ряда различных дистрибутивов. Доступен пакет для смеси двух правосторонних гамма-распределений.

Доступно несколько других пакетов для R, подходящих для смешанных моделей; к ним относятся flexmix, mcclust, agrmt и mixdist.

Язык статистического программирования SAS также может соответствовать множеству смешанных распределений с помощью процедуры PROC FREQ.

Источник

Мультимодальное распределение

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

СОДЕРЖАНИЕ

Терминология [ править ]

Классификация Галтунга [ править ]

Галтунг ввел систему классификации (AJUS) для распределений: [1]

С тех пор эта классификация была немного изменена:

В соответствии с этой классификацией бимодальные распределения классифицируются как тип S или U.

Примеры [ править ]

Бимодальные распределения встречаются как в математике, так и в естественных науках.

Распределения вероятностей [ править ]

Отношение двух нормальных распределений также распределяется бимодально. Позволять

Т статистики генерируется из набора данных взяты из распределения Коши является бимодальным. [3]

События в природе [ править ]

Эконометрика [ править ]

В эконометрических моделях параметры могут быть распределены бимодально. [5]

Истоки [ править ]

Математический [ править ]

Смеси с двумя отдельными компонентами не обязательно должны быть бимодальными, а двухкомпонентные смеси с одномодальными плотностями компонентов могут иметь более двух режимов. Непосредственной связи между количеством компонентов в смеси и количеством мод результирующей плотности нет.

Особые дистрибутивы [ править ]

Биология [ править ]

В биологии известно пять факторов, способствующих бимодальному распределению размеров популяций [ цитата необходима ] :

Бимодальное распределение размеров рабочих- ткачей-муравьев возникает из-за существования двух различных классов рабочих, а именно основных рабочих и второстепенных рабочих. [10]

Общие свойства [ править ]

Смесь двух одномодальных распределений с разными средними значениями не обязательно является бимодальным. Комбинированное распределение роста мужчин и женщин иногда используется в качестве примера бимодального распределения, но на самом деле разница в средних ростах мужчин и женщин слишком мала по сравнению со стандартными отклонениями для получения бимодальности. [14]

Моменты смесей [ править ]

f ( x ) = p g 1 ( x ) + ( 1 − p ) g 2 ( x ) <\displaystyle f(x)=pg_<1>(x)+(1-p)g_<2>(x)\,> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

μ = p μ 1 + ( 1 − p ) μ 2 <\displaystyle \mu =p\mu _<1>+(1-p)\mu _<2>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределениеν 2 = p [ σ 1 2 + δ 1 2 ] + ( 1 − p ) [ σ 2 2 + δ 2 2 ] <\displaystyle \nu _<2>=p[\sigma _<1>^<2>+\delta _<1>^<2>]+(1-p)[\sigma _<2>^<2>+\delta _<2>^<2>]> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределениеν 3 = p [ S 1 σ 1 3 + 3 δ 1 σ 1 2 + δ 1 3 ] + ( 1 − p ) [ S 2 σ 2 3 + 3 δ 2 σ 2 2 + δ 2 3 ] <\displaystyle \nu _<3>=p[S_<1>\sigma _<1>^<3>+3\delta _<1>\sigma _<1>^<2>+\delta _<1>^<3>]+(1-p)[S_<2>\sigma _<2>^<3>+3\delta _<2>\sigma _<2>^<2>+\delta _<2>^<3>]> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределениеν 4 = p [ K 1 σ 1 4 + 4 S 1 δ 1 σ 1 3 + 6 δ 1 2 σ 1 2 + δ 1 4 ] + ( 1 − p ) [ K 2 σ 2 4 + 4 S 2 δ 2 σ 2 3 + 6 δ 2 2 σ 2 2 + δ 2 4 ] <\displaystyle \nu _<4>=p[K_<1>\sigma _<1>^<4>+4S_<1>\delta _<1>\sigma _<1>^<3>+6\delta _<1>^<2>\sigma _<1>^<2>+\delta _<1>^<4>]+(1-p)[K_<2>\sigma _<2>^<4>+4S_<2>\delta _<2>\sigma _<2>^<3>+6\delta _<2>^<2>\sigma _<2>^<2>+\delta _<2>^<4>]> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Смесь двух нормальных распределений [ править ]

Нередко встречаются ситуации, когда исследователь полагает, что данные получены из смеси двух нормальных распределений. В связи с этим данная смесь достаточно подробно изучена. [17]

Смесь двух нормальных распределений имеет пять параметров для оценки: два средних, две дисперсии и параметр смешивания. Смесь двух нормальных распределений с равными стандартными отклонениями является бимодальной только в том случае, если их средние значения различаются как минимум на двойное стандартное отклонение. [14] Оценки параметров упрощаются, если дисперсии можно считать равными ( гомоскедастический случай).

Если средние двух нормальных распределений равны, то комбинированное распределение является унимодальным. Условия унимодальности комбинированного распределения были выведены Эйзенбергером. [18] Необходимые и достаточные условия для того, чтобы смесь нормальных распределений была бимодальной, были идентифицированы Рэем и Линдси. [19]

Смесь двух примерно равных массовых нормальных распределений имеет отрицательный эксцесс, поскольку две моды по обе стороны от центра масс эффективно уменьшают хвосты распределения.

Смесь двух нормальных распределений с сильно неравной массой имеет положительный эксцесс, поскольку меньшее распределение удлиняет хвост более доминирующего нормального распределения.

Смеси других распределений требуют оценки дополнительных параметров.

Тесты на унимодальность [ править ]

Коэффициент разделения ( S ) равен

Если дисперсии равны, то S = 1. Плотность смеси унимодальна тогда и только тогда, когда

Сводная статистика [ править ]

D Эшмана [ править ]

D = ( 2 1 2 ) | μ 1 − μ 2 | ( σ 1 2 + σ 2 2 ) <\displaystyle D=(2^<\frac <1><2>>)<\frac <\left|\mu _<1>-\mu _<2>\right|><\sqrt <(\sigma _<1>^<2>+\sigma _<2>^<2>)>>>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Для смеси двух нормальных распределений требуется D > 2 для четкого разделения распределений.

A ван дер Эйка [ править ]

A = U ( 1 − S − 1 K − 1 ) <\displaystyle A=U(1-<\frac >)> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Значение U равно 1, если распределение имеет любую из трех следующих характеристик:

A o v e r a l l = ∑ w i A i <\displaystyle A_=\sum w_A_> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Равномерное распределение имеет = 0: когда все ответы попадают в одну категорию А = +1.

Одна теоретическая проблема с этим индексом заключается в том, что он предполагает, что интервалы расположены на одинаковом расстоянии. Это может ограничить его применимость.

Бимодальное разделение [ править ]

Этот индекс предполагает, что распределение представляет собой смесь двух нормальных распределений со средними ( μ 1 и μ 2 ) и стандартными отклонениями ( σ 1 и σ 2 ): [24]

S = μ 1 − μ 2 2 ( σ 1 + σ 2 ) <\displaystyle S=<\frac <\mu _<1>-\mu _<2>><2(\sigma _<1>+\sigma _<2>)>>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Коэффициент бимодальности [ править ]

Коэффициент бимодальности Сарла b равен [25]

Формула для конечной выборки [27]

b = g 2 + 1 k + 3 ( n − 1 ) 2 ( n − 2 ) ( n − 3 ) <\displaystyle b=<\frac +1>><(n-2)(n-3)>>>>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Амплитуда бимодальности [ править ]

Это определяется как [24]

A B = A 1 − A a n A 1 <\displaystyle A_=<\frac -A_>>>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Это соотношение левого и правого пиков. [24] Математически

Параметр бимодальности [ править ]

Этот параметр ( B ) принадлежит Уилкоку. [29]

B = ( A r A l ) 0.5 ∑ P i <\displaystyle B=(<\frac >>>)^<0.5>\sum P_> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Для использования этого индекса берется журнал значений. Затем данные делятся на интервал шириной Φ, значение которого равно log 2. Ширина пиков принимается равной четырехкратной 1 / 4Φ, центрированной по их максимальным значениям.

Индексы бимодальности [ править ]

Индекс бимодальности, предложенный Ван и др., Предполагает, что распределение является суммой двух нормальных распределений с равными дисперсиями, но разными средними значениями. [30] Он определяется следующим образом:

Другой индекс бимодальности был предложен Стурроком. [31]

Этот индекс ( B ) определяется как

B = 1 N [ ( ∑ 1 N cos ⁡ ( 2 π m γ ) ) 2 + ( ∑ 1 N sin ⁡ ( 2 π m γ ) ) 2 ] <\displaystyle B=<\frac <1>>\left[\left(\sum _<1>^\cos(2\pi m\gamma )\right)^<2>+\left(\sum _<1>^\sin(2\pi m\gamma )\right)^<2>\right]> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Когда m = 2 и γ равномерно распределен, B распределен экспоненциально. [32]

индекс де Микеле и Аккатино

Другой индекс бимодальности был предложен де Микеле и Аккатино. [33] Их индекс ( B ) равен

μ M = ∑ i = 1 L m i x i ∑ i = 1 L m i <\displaystyle \mu _=<\frac <\sum _^m_x_><\sum _^m_>>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Авторы предложили значение отсечения 0,1 для B, чтобы различать бимодальное ( B > 0,1) и одномодальное ( B Индекс Сэмбрука Смита

Еще один индекс ( B ) был предложен Sambrook Smith и др. [34]

B = | ϕ 2 − ϕ 1 | p 2 p 1 <\displaystyle B=|\phi _<2>-\phi _<1>|<\frac >>>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Авторы рекомендовали значение отсечения 1,5, при этом B больше 1,5 для бимодального распределения и меньше 1,5 для унимодального распределения. Никакого статистического обоснования этого значения не было.

Индекс Чаудхури и Агравала

Другой параметр бимодальности был предложен Чаудхури и Агравалом. [35] Этот параметр требует знания дисперсии двух субпопуляций, составляющих бимодальное распределение. Он определяется как

k = n 1 σ 1 2 + n 2 σ 2 2 m σ 2 <\displaystyle k=<\frac \sigma _<1>^<2>+n_<2>\sigma _<2>^<2>>>>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Это средневзвешенное значение дисперсии. Авторы предполагают, что этот параметр можно использовать в качестве цели оптимизации для разделения выборки на две субпопуляции. Никакого статистического обоснования этому предположению дано не было.

Статистические тесты [ править ]

Доступен ряд тестов, чтобы определить, распределяется ли набор данных бимодальным (или мультимодальным) способом.

Графические методы [ править ]

При изучении отложений размер частиц часто бывает двухрежимным. Эмпирически было обнаружено, что полезно построить график зависимости частоты от логарифма (размера) частиц. [36] [37] Это обычно дает четкое разделение частиц на бимодальное распределение. В геологических приложениях логарифм обычно берется с основанием 2. Преобразованные логарифмические значения называются единицами фи (Φ). Эта система известна как шкала Крамбейна (или фи).

Альтернативный метод заключается в построении логарифма размера частиц в зависимости от совокупной частоты. Этот график обычно состоит из двух достаточно прямых линий с соединительной линией, соответствующей антимоде.

Приблизительные значения для нескольких статистических данных можно получить из графических графиков. [36]

M e a n = ϕ 16 + ϕ 50 + ϕ 84 3 <\displaystyle <\mathit >=<\frac <\phi _<16>+\phi _<50>+\phi _<84>><3>>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределениеS t d D e v = ϕ 84 − ϕ 16 4 + ϕ 95 − ϕ 5 6.6 <\displaystyle <\mathit >=<\frac <\phi _<84>-\phi _<16>><4>>+<\frac <\phi _<95>-\phi _<5>><6.6>>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределениеS k e w = ϕ 84 + ϕ 16 − 2 ϕ 50 2 ( ϕ 84 − ϕ 16 ) + ϕ 95 + ϕ 5 − 2 ϕ 50 2 ( ϕ 95 − ϕ 5 ) <\displaystyle <\mathit >=<\frac <\phi _<84>+\phi _<16>-2\phi _<50>><2(\phi _<84>-\phi _<16>)>>+<\frac <\phi _<95>+\phi _<5>-2\phi _<50>><2(\phi _<95>-\phi _<5>)>>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределениеK u r t = ϕ 95 − ϕ 5 2.44 ( ϕ 75 − ϕ 25 ) <\displaystyle <\mathit >=<\frac <\phi _<95>-\phi _<5>><2.44(\phi _<75>-\phi _<25>)>>> что такое бимодальное распределение. Смотреть фото что такое бимодальное распределение. Смотреть картинку что такое бимодальное распределение. Картинка про что такое бимодальное распределение. Фото что такое бимодальное распределение

Унимодальное и бимодальное распределение [ править ]

Бейкер предложил преобразование для преобразования бимодального распределения в одномодальное. [40]

Предложен метод, основанный на оценках и тестах Вальда. [46] Этот метод позволяет различать унимодальные и бимодальные распределения, если известны лежащие в основе распределения.

Антимодовые тесты [ править ]

Статистические тесты для антирежима известны. [47]

Метод Оцу обычно используется в компьютерной графике для определения оптимального разделения между двумя распределениями.

Общие тесты [ править ]

Тест Сильвермана [ править ]

Сильверман представил метод начальной загрузки для количества режимов. [48] Тест использует фиксированную полосу пропускания, что снижает мощность теста и его интерпретируемость. Недостаточно сглаженные плотности могут иметь чрезмерное количество режимов, количество которых во время начальной загрузки нестабильно.

Тест Баджье-Аггарвала [ править ]

Баджье и Аггарвал предложили тест, основанный на эксцессе распределения. [58]

Особые случаи [ править ]

Дополнительные тесты доступны для ряда особых случаев:

Смесь двух нормальных распределений

Исследование плотности смеси данных двух нормальных распределений показало, что разделение на два нормальных распределения было затруднительным, если средние значения не были разделены на 4–6 стандартных отклонений. [59]

В астрономии алгоритм Kernel Mean Matching используется для определения принадлежности набора данных к одному нормальному распределению или к смеси двух нормальных распределений.

Это распределение является бимодальным для определенных значений параметров is. Был описан тест на эти значения. [60]

Расчет параметров и подгонка кривых [ править ]

Предполагая, что распределение известно как бимодальное или было показано, что оно является бимодальным одним или несколькими из приведенных выше тестов, часто бывает желательно подобрать кривую к данным. Это может быть сложно.

Байесовские методы могут быть полезны в сложных случаях.

Программное обеспечение [ править ]

Пакет для R доступен для тестирования на бимодальность. [61] Этот пакет предполагает, что данные распределены как сумма двух нормальных распределений. Если это предположение неверно, результаты могут быть ненадежными. Он также включает функции для подбора суммы двух нормальных распределений к данным.

Если предположить, что распределение представляет собой смесь двух нормальных распределений, то для определения параметров можно использовать алгоритм максимизации ожидания. Для этого доступно несколько программ, включая Cluster, [62] и пакет R nor1mix. [63]

Пакет mixtools, доступный для R, может тестировать и оценивать параметры ряда различных дистрибутивов. [64] Доступен пакет для смеси двух правосторонних гамма-распределений. [65]

Несколько других пакетов для R доступны для смешанных моделей; к ним относятся flexmix, [66] mcclust, [67] agrmt, [68] и mixdist. [69]

Язык статистического программирования SAS также может соответствовать множеству смешанных распределений с помощью процедуры PROC FREQ.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *