что такое накопленные частоты в статистике

Накопленная частота: формула, расчет, распределение, примеры

Содержание:

Очевидно, переменная исследования должна быть сортируемой. А поскольку накопленная частота получается сложением абсолютных частот, получается, что накопленная частота до последних данных должна совпадать с их суммой. В противном случае в расчетах будет ошибка.

Обычно накопленная частота обозначается как Fя (или иногда nя), чтобы отличить ее от абсолютной частоты fя и важно добавить для него столбец в таблице, с помощью которой организованы данные, известной как таблица частот.

Это упрощает, среди прочего, отслеживание того, сколько данных было подсчитано до определенного наблюдения.

А Фя он также известен как абсолютная совокупная частота. Если разделить на общие данные, мы получим относительная совокупная частота, окончательная сумма которых должна быть равна 1.

Формулы

Кумулятивная частота данного значения переменной Xя представляет собой сумму абсолютных частот f всех значений, меньших или равных ей:

Путем сложения всех абсолютных частот получается общее количество данных N, то есть:

Предыдущая операция кратко записывается с помощью символа суммирования ∑:

Прочие накопленные частоты

Также могут накапливаться следующие частоты:

-Относительная частота: получается делением абсолютной частоты fя между общими данными N:

Если относительные частоты сложить от самой низкой к той, которая соответствует определенному наблюдению, мы получим совокупная относительная частота. Последнее значение должно быть равно 1.

-Процент кумулятивной относительной частоты: накопленная относительная частота умножается на 100%.

Эти частоты полезны для описания поведения данных, например, при нахождении показателей центральной тенденции.

Как получить накопленную частоту?

Чтобы получить накопленную частоту, необходимо упорядочить данные и организовать их в таблице частот. Процедура иллюстрируется следующей практической ситуацией:

-В интернет-магазине, который продает сотовые телефоны, отчет о продажах определенного бренда за март месяц показал следующие значения за день:

1; 2; 1; 3; 0; 1; 0; 2; 4; 2; 1; 0; 3; 3; 0; 1; 2; 4; 1; 2; 3; 2; 3; 1; 2; 4; 2; 1; 5; 5; 3

Подобную информацию и многое другое можно получить, представив данные в упорядоченном виде и указав частоты.

Как заполнять частотную таблицу

Для расчета накопленной частоты данные сначала упорядочиваются:

0; 0; 0; 0; 1; 1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 4; 4; 4; 5; 5

Затем строится таблица со следующей информацией:

-Первый столбец слева с количеством проданных телефонов от 0 до 5 в порядке возрастания.

-Второй столбец: абсолютная частота, то есть количество дней, в течение которых было продано 0 телефонов, 1 телефон, 2 телефона и т. Д.

-Третий столбец: накопленная частота, состоящая из суммы предыдущей частоты и частоты данных, которые необходимо учитывать.

Этот столбец начинается с первых данных в столбце абсолютной частоты, в данном случае это 0. Для следующего значения сложите его с предыдущим. Это продолжается до тех пор, пока не будут достигнуты последние накопленные данные частоты, которые должны совпадать с общими данными.

Таблица частотности

В следующей таблице показаны переменная «количество телефонов, проданных за день», ее абсолютная частота и подробный расчет накопленной частоты.

На первый взгляд, можно сказать, что у рассматриваемого бренда один или два телефона почти всегда продаются в день, поскольку максимальная абсолютная частота составляет 8 дней, что соответствует этим значениям переменной. Только за 4 дня месяца они не продали ни одного телефона.

Как уже отмечалось, таблицу легче изучить, чем изначально собранные индивидуальные данные.

Кумулятивное частотное распределение

Хотя есть преимущество организации данных в таблице, подобной предыдущей, если количество данных очень велико, может оказаться недостаточно для их организации, как показано выше, потому что, если частот много, их все равно трудно интерпретировать.

Проблему можно решить, построив Распределение частоты по интервалам, полезная процедура, когда переменная принимает большое количество значений или если это непрерывная переменная.

Здесь значения сгруппированы в интервалы равной амплитуды, называемые класс. Классы характеризуются наличием:

-Классовый знак: является средней точкой каждого интервала и принимается в качестве его репрезентативного значения.

-Ширина класса: Он рассчитывается путем вычитания значения самого высокого и самого низкого данных (диапазона) и деления на количество классов:

Ширина класса = Диапазон / Количество классов

Подробное описание частотного распределения приведено ниже.

пример

Этот набор данных соответствует 40 баллам за тест по математике по шкале от 0 до 10:

0; 0;0; 1; 1; 1; 1; 2; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 5; 5; 5; 5; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 9; 9;10; 10.

Распределение частот может быть выполнено с определенным количеством классов, например 5 классами. Следует иметь в виду, что при использовании многих классов данные нелегко интерпретировать, и смысл группировки теряется.

А если, наоборот, они сгруппированы в очень немногие, то информация размывается и часть ее теряется. Все зависит от количества имеющихся у вас данных.

Ширина класса = (10-0) / 5 = 2

Слева интервалы закрыты, а справа открыты (кроме последнего), что обозначено скобками и круглыми скобками соответственно. Все они одинаковой ширины, но это не обязательно, хотя и является наиболее распространенным.

Предлагаемое упражнение

Одна компания ежедневно звонила своим клиентам в течение первых двух месяцев года. Данные следующие:

6, 12, 7, 15, 13, 18, 20, 25, 12, 10, 8, 13, 15, 6, 9, 18, 20, 24, 12, 7, 10, 11, 13, 9, 12, 15, 18, 20, 13, 17, 23, 25, 14, 18, 6, 14, 16, 9, 6, 10, 12, 20, 13, 17, 14, 26, 7, 12, 24, 7

Сгруппируйте по 5 классам и составьте таблицу с частотным распределением.

Ответить

Пожалуйста, попытайтесь понять это, прежде чем увидите ответ.

Ссылки

Архитектура Mixtec: характеристики, примеры построек

Недостаток концентрации: причины и 10 советов по борьбе с ним

Источник

Что такое накопленные частоты в статистике

В третьей строке приводятся значения частот для каждой группы. Они определяются по данным второй строки: подсчитывается количество черточек. Например, частота 9 означает, что 9 учеников имеют скорость чтения от 49 до 55 слов/мин.

В следующей строке приводятся значения так называемой накопленной частоты, т. е. число значений, которые попали в этот интервал и все предшествующие. Значение накопленной частоты 21 означает, что 21 ученик имеет скорость чтения, не меньшую 63.

Для первичной обработки статистических данных удобно использовать специальные компьютерные программы, например Microsoft Excel.

Приведем несколько иной способ группирования данных. Он реализуется в следующей последовательности действий.

1. Выбирают количество интервалов k, на которые подразделяются все данные.

2. Вычисляют длину h каждого интервала по формуле

что такое накопленные частоты в статистике. Смотреть фото что такое накопленные частоты в статистике. Смотреть картинку что такое накопленные частоты в статистике. Картинка про что такое накопленные частоты в статистике. Фото что такое накопленные частоты в статистикечто такое накопленные частоты в статистике. Смотреть фото что такое накопленные частоты в статистике. Смотреть картинку что такое накопленные частоты в статистике. Картинка про что такое накопленные частоты в статистике. Фото что такое накопленные частоты в статистике

3. Левую и правую границы статистических данных xmin и xmax раздвигают на величину что такое накопленные частоты в статистике. Смотреть фото что такое накопленные частоты в статистике. Смотреть картинку что такое накопленные частоты в статистике. Картинка про что такое накопленные частоты в статистике. Фото что такое накопленные частоты в статистикеи получают соответственно что такое накопленные частоты в статистике. Смотреть фото что такое накопленные частоты в статистике. Смотреть картинку что такое накопленные частоты в статистике. Картинка про что такое накопленные частоты в статистике. Фото что такое накопленные частоты в статистикечто такое накопленные частоты в статистике. Смотреть фото что такое накопленные частоты в статистике. Смотреть картинку что такое накопленные частоты в статистике. Картинка про что такое накопленные частоты в статистике. Фото что такое накопленные частоты в статистикечто такое накопленные частоты в статистике. Смотреть фото что такое накопленные частоты в статистике. Смотреть картинку что такое накопленные частоты в статистике. Картинка про что такое накопленные частоты в статистике. Фото что такое накопленные частоты в статистикечто такое накопленные частоты в статистике. Смотреть фото что такое накопленные частоты в статистике. Смотреть картинку что такое накопленные частоты в статистике. Картинка про что такое накопленные частоты в статистике. Фото что такое накопленные частоты в статистике.

4. Определяют границы интервалов по формуле что такое накопленные частоты в статистике. Смотреть фото что такое накопленные частоты в статистике. Смотреть картинку что такое накопленные частоты в статистике. Картинка про что такое накопленные частоты в статистике. Фото что такое накопленные частоты в статистикечто такое накопленные частоты в статистике. Смотреть фото что такое накопленные частоты в статистике. Смотреть картинку что такое накопленные частоты в статистике. Картинка про что такое накопленные частоты в статистике. Фото что такое накопленные частоты в статистикечто такое накопленные частоты в статистике. Смотреть фото что такое накопленные частоты в статистике. Смотреть картинку что такое накопленные частоты в статистике. Картинка про что такое накопленные частоты в статистике. Фото что такое накопленные частоты в статистике.

Источник

Что такое накопленные частоты в статистике

Поскольку
, то
и площадь каждого прямоугольника такой гистограммы равна частоте соответствующего интервала, а общая площадь гистограммы равна численности совокупности.

Число хозяйств,Накопленная
частота,До 6226-10810 (2+8)10-141727 (10+17)14-181239 (12+27)18-22645 (6+39)Свыше 22247 (25+2)Итого47

Накопленная частота – это сумма частот данного и всех предшествующих интервалов.
Куммулята позволяет определить, какая часть совокупности обладает значениями изучаемого признака не превышающими заданного предела, а какая часть – наоборот – превышает этот предел.

1. Понятие средней величины.
2. Средняя арифметическая величина и ее расчет прямым способом.
3. Свойства средней арифметической величины.
4. Практическое использование свойств средней арифметической.
5. Степенные средние.
6. Мода и процентили.

2. Средняя арифметическая величина и ее расчет прямым способом.
Средняя арифметическая – наиболее распространенный на практике вид средних. Различают 2 вида арифметических средних:
§Невзвешенную (простую);
§Взвешенную.
Средняя арифметическая невзвешенная рассчитывается для несгруппированных данных по формуле:
, где
-сумма вариантов, N – их число – применяется обычно для совокупностей численностью N
15.
Для массовых статистических совокупностей рассчитывается взвешенная средняя арифметическая по формуле:
, где
-частоты.
Пример: Расчет средней выработки рабочими токарного цеха.

Число рабочих,
чел.,Объем производства,До 3003290870300-32093102790320-340153304950340-360123504200360-38063702220Свыше 38063902340Итого51

Из таблицы:
1. Средняя величина всегда тяготеет к вариантам с наибольшими частотами.
2. Средняя величина может не совпадать ни с одним из вариантов дискретного ряда.
3. Средняя величина находится внутри интервала значений вариантов ряда.
Сумма
помимо чисто математического, как правило, имеет смысловое значение, наличие смыслового значения – один из способов проверки правильности выбора средней.
Даже если варианты ряда представлены целыми числами, среднее может быть смешанным числом, иногда такой результат логически неправомерен. В этом случае его надо округлять, переводить в проценты или в промили.

3. Свойства средней арифметической величины.
Свойства средней важны для понимания механизма расчета этого показателя, а так же для разработки ряда более сложных статистических методик.
Свойства :
1. Если из всех вариантов ряда вычесть или ко всем вариантам добавить постоянное число, то средняя арифметическая соответственно уменьшится или увеличится на это число.
.
2. Если все варианты ряда умножить или разделить на постоянное число, то средняя арифметическая соответственно увеличится или уменьшится в это число раз.
.
3. Если все частоты увеличить или уменьшить в постоянное число раз, то средняя от этого не изменится.
.
4. Сумма отклонений всех вариантов ряда от средней арифметической равна 0. (Нулевое свойство средней).
.
5. Общая средняя совокупности равна средней арифметической из частных средне взвешенных по объемам частных совокупностей.
, где
— средняя арифметическая частных групп,
— численность соответствующих групп,
— общая средняя.
6. Сумма квадратов отклонений всех вариантов ряда от средней арифметической меньше суммы квадратов их отклонений от любого другого постоянного числа.

Средний квадрат отклонений вариантов ряда от произвольного числа А равен дисперсии плюс квадрат разности между средней и этим числом А.
Данное свойство положено в основу метода наименьших квадратов, который широко применяется в исследовании статистических взаимосвязей.

4. Практическое использование свойств средней арифметической.
Свойства средней арифметической используются так же для упрощения методики ее расчета. В условиях малопроизводительной вычислительной техники эта методика обеспечивала значительную экономию времени и труда. В настоящее время данная методика служит наглядным образцом иллюстрации свойств средней.

2903-40-21-23109-20-13-33301500503501220144370640224390660326

Данный метод называется так же методом расчета от условного нуля. В качестве условного нуля выбирается произвольное постоянное число А. Обычно это вариант ряда с наибольшей частотой. А=330.
Рассчитываем среднюю по новым вариантам:
.
Пользуясь свойствами средней переходим от условного
к фактической средней величине
.

Пример: Продавец в течении нескольких дней продавал на рынке морковь. В первые 4 дня цена составляла 6 руб./кг, в последние 5 дней цена поднялась до 7 руб., а оставшаяся морковь была продана за 4,50 руб./кг. Поскольку данные о товарообороте отсутствуют, то для решения задачи применяется средняя гармоническая взвешенная:

Доказано так же, что чем интенсивней колеблются значения вариантов ряда, тем больше разница между ними.

6. Мода и процентили.
Наряду со средними для характеристики распределения применяют такие показатели как мода и процентили, которые дополняют характеристику (обобщающую) и позволяют сравнивать между собой и находить различия в рядах с одинаковыми средними.
Мода – это наиболее часто встречающийся вариант ряда.
В дискретных рядах распределения модой является вариант, имеющий максимальную частотную характеристику.
В интервальных рядах мода определяется в два этапа. В начале определяется интервал, содержащий моду ( модальный интервал ), а затем рассчитывается значение моды по формуле:
, где
— нижняя граница модального интервала, i – величина этого интервала,
,
,
— частоты модального, предшествующего ему и следующего за ним интервалов.

Для последней таблицы (данные о выработке рабочих токарей):

Медиана (вид процентиля), который занимает серединное положение в ряду распределения. Медиана определяется по формуле:
, где
— нижняя граница интервала, содержащего медиану ( интервал определяется по накопленной частоте, первой превышающей 50% суммы частот (в дальнейшем для квартилей, децилей – 25%, 75%, 0,1%, 0,2% и т.д.) ), i – величина этого интервала,
— номер медианы,
— накопленная частота интервала, предшествующего медиане,
— частота медианного интервала.
Поскольку медиана разновидность процентиля то данная формула носит универсальный характер, она может применяться для определения квартилей (Q) и децилей (d).
Квартили (четверти) отсекают от совокупности соответственно 25%, 50% и 75%.
Децили отсекают от совокупности соответственно 10%, 20%, 30% и т.д.
На первом этапе определяется номер процентиля по формуле:
— для ряда четным числом единиц;
— с нечетным числом единиц.
— номер процентиля (порядковый),
— индекс процентиля (выражается десятичной дробью) (
),N– численность совокупности.

Источник

Интервальный вариационный ряд и его характеристики

п.1. Построение интервального вариационного ряда по данным эксперимента

Интервалы, \(\left.\left[a_,a_i\right.\right)\)\(\left.\left[a_<0>,a_1\right.\right)\)\(\left.\left[a_<1>,a_2\right.\right)\).\(\left.\left[a_,a_k\right.\right)\)
Частоты, \(f_i\)\(f_1\)\(f_2\).\(f_k\)

Скобка \(\lfloor\ \rfloor\) означает целую часть (округление вниз до целого числа).

Скобка \(\lceil\ \rceil\) означает округление вверх, в данном случае не обязательно до целого числа.

Заметим, что поскольку шаг h находится с округлением вверх, последний узел \(a_k\geq x_\).

\(\left.\left[a_,a_i\right.\right)\) cм\(\left.\left[142;150\right.\right)\)\(\left.\left[150;158\right.\right)\)\(\left.\left[158;166\right.\right)\)\(\left.\left[166;174\right.\right)\)\(\left.\left[174;182\right.\right)\)\(\left.\left[182;190\right.\right)\)\(\left[190;198\right]\)

п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения

Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:

i1234567
\(\left.\left[a_,a_i\right.\right)\) cм\(\left.\left[142;150\right.\right)\)\(\left.\left[150;158\right.\right)\)\(\left.\left[158;166\right.\right)\)\(\left.\left[166;174\right.\right)\)\(\left.\left[174;182\right.\right)\)\(\left.\left[182;190\right.\right)\)\(\left[190;198\right]\)
\(f_i\)4711343383

Найдем середины интервалов, относительные частоты и накопленные относительные частоты:

\(x_i\)146154162170178186194
\(w_i\)0,040,070,110,340,330,080,03
\(S_i\)0,040,110,220,560,890,971

п.3. Выборочная средняя, мода и медиана. Симметрия ряда

Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).

Например:
Для распределения учеников по росту получаем:

\(x_i\)146154162170178186194
\(w_i\)0,040,070,110,340,330,080,031
\(x_iw_i\)5,8410,7817,8257,8058,7414,885,82171,68

$$ X_=\sum_^k x_iw_i=171,68\approx 171,7\ \text <(см)>$$ На гистограмме (или полигоне) относительных частот максимальная частота приходится на 4й интервал [166;174). Это модальный интервал.
Данные для расчета моды: \begin x_o=166,\ f_m=34,\ f_=11,\ f_=33,\ h=8\\ M_o=x_o+\frac><(f_m-f_)+(f_m+f_)>h=\\ =166+\frac<34-11><(34-11)+(34-33)>\cdot 8\approx 173,7\ \text <(см)>\end На кумуляте значение 0,5 пересекается на 4м интервале. Это – медианный интервал.
Данные для расчета медианы: \begin x_o=166,\ w_m=0,34,\ S_=0,22,\ h=8\\ \\ M_e=x_o+\frac<0,5-S_>h=166+\frac<0,5-0,22><0,34>\cdot 8\approx 172,6\ \text <(см)>\end \begin \\ X_=171,7;\ M_o=173,7;\ M_e=172,6\\ X_\lt M_e\lt M_o \end Ряд асимметричный с левосторонней асимметрией.
При этом \(\frac<|M_o-X_|><|M_e-X_|>=\frac<2,0><0,9>\approx 2,2\lt 3\), т.е. распределение умеренно асимметрично.

п.4. Выборочная дисперсия и СКО

Например:
Для распределения учеников по росту получаем:

п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

Подробней о том, почему и когда нужно «исправлять» дисперсию, и для чего использовать коэффициент вариации – см. §65 данного справочника.

п.6. Алгоритм исследования интервального вариационного ряда

На входе: все значения признака \(\left\,\ j=\overline<1,N>\)
Шаг 1. Построить интервальный ряд с интервалами \(\left.\right[a_,\ a_i\left.\right)\) и частотами \(f_i,\ i=\overline<1,k>\) (см. алгоритм выше).
Шаг 2. Составить расчетную таблицу. Найти \(x_i,w_i,S_i,x_iw_i,x_i^2w_i\)
Шаг 3. Построить гистограмму (и/или полигон) относительных частот, эмпирическую функцию распределения (и/или кумуляту). Записать эмпирическую функцию распределения.
Шаг 4. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 5. Найти выборочную дисперсию и СКО.
Шаг 6. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.

п.7. Примеры

Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.

\(\left.\left[a_,a_i\right.\right)\) лет\(\left.\left[18;22\right.\right)\)\(\left.\left[22;26\right.\right)\)\(\left.\left[26;30\right.\right)\)\(\left.\left[30;34\right.\right)\)\(\left.\left[34;38\right.\right)\)

Считаем частоты для каждого интервала. Получаем интервальный ряд:

\(\left.\left[a_,a_i\right.\right)\) лет\(\left.\left[18;22\right.\right)\)\(\left.\left[22;26\right.\right)\)\(\left.\left[26;30\right.\right)\)\(\left.\left[30;34\right.\right)\)\(\left.\left[34;38\right.\right)\)
\(f_i\)171264

2) Составляем расчетную таблицу:

\(x_i\)2024283236
\(f_i\)17126430
\(w_i\)0,0330,2330,40,20,1331
\(S_i\)0,0330,2670,6670,8671
\(x_iw_i\)0,6675,611,26,44,828,67
\(x_i^2w_i\)13,333134,4313,6204,8172,8838,93

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *