что такое вариация признака
ВАРИАЦИЯ ПРИЗНАКА В СОВОКУПНОСТИ И ЗНАЧЕНИЕ ЕЕ ИЗУЧЕНИЯ
Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака
Исследование вариации позволяет:
Ø определить уровень зависимости изучаемого явления от прочих факторов, т.е. оценить степень устойчивости явления к внешним воздействиям;
Ø определить уровень однородности изучаемого явления;
Ø изучить явления, протекающие в обществе, характеризующиеся высоким уровнем их изменчивости.
| | |
альтернативная | систематическая | случайная |
признак может принять только одно из двух, противоположных по своей сути, значений | изменение признака в определенном направлении, не обусловленное внутренними законами развития исследуемого явления | изменчивость признака не предсказуема. |
Рисунок 6.1. Виды вариаций
Для того чтобы руководитель предприятия, менеджер, научный работник могли управлять вариацией и изучать ее, статистикой разработаны специальные методы исследования вариации — система показателей. С их помощью вариация измеряется, характеризуются ее свойства. К показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратичное отклонение, коэффициент вариации.
Исследование вариации позволяет:
· Определить уровень зависимости изучаемого явления от прочих факторов, т. е. оценить степень устойчивости явления к внешним воздействиям;
· Определить уровень однородности изучаемого явления;
· Изучить явления, протекающие в обществе, характеризующиеся высоким уровнем их изменчивости.
При статистическом анализе вариационных рядов используются различные показатели (меры) вариации в зависимости от поставленных перед исследователем задач. К ним относятся:
• среднее линейное отклонение,
• средний квадрат отклонений (дисперсия),
• среднее квадратическое отклонение и
Рисунок 6.2. Показатели вариации.
Абсолютные показатели вариации:
Ø Размах вариации (R) является наиболее простым измерителем признака:
Ø Среднее линейное отклонение ( d ) учитывает различия всех единиц исследуемой совокупности. Данная величина определяется как средняя арифметическая из абсолютных значений отклонений, взятых по модулю, от средней. Различают простое (невзвешенное и взвешенное среднее линейное отклонение:
o среднее линейное отклонение невзвешенное определяется по формуле:
где хi – величина совокупности, – средняя, n – количество признаков
o среднее линейное отклонение взвешенное определяется по формуле:
Этот показатель дает более полное представление о степени колеблемости признака по сравнению с размахом вариации.
Недостаток вычисления среднего линейного отклонения заключается в том, что приходится иметь дело не только с положительными, но и с отрицательными величинами;
Ø Дисперсии (групповая, межгрупповая и общая) и среднее квадратическое отклонение.
Дисперсия представляет собой сумму квадратов отклонений значений показателя от средней. Различают невзешенную и взвешенную дисперсии.
Дисперсия невзвешенная определяется по формуле:
Дисперсия взвешенная определяется по формуле:
Относительные показатели вариации.
Ø Коэффициент осцилляции (VR):
VR = R/x 100%
где R — размах вариации;
х — средняя величина.
Обычно данный показатель имеет значение больше единицы, поскольку размах вариации в основном больше средней величины.
Ø Коэффициенты вариации:
o линейный коэффициент вариации (Va):
Va = d/x100%
или Va= d/Me100%
где d — среднее линейное отклонение; Me — медиана.
Данный коэффициент показывает, какую часть в размере средней величины (или в объеме медианы) составляет размер среднего линейного отклонения.
Vs = s /x 100%
Данный коэффициент определяет удельный вес среднего квадратического отклонения в значении средней величины и служит мерой однородности совокупности. Чем больший коэффициент вариации, тем менее однородная совокупность и тем менее типична средняя для данной совокупности. По величине коэффициента вариации можно судить о степени вариации признака изучаемой совокупности. Чем больше его величина, тем больше разброс значений признака вокруг средней, и тем менее представительна средняя. Установлено, что совокупность количественно однородна, если коэффициент вариации не превышает 33%.
Характеристика видов дисперсии
Межгрупповая дисперсия равна среднему квадрату отклонений групповых
средних хi от общей средней x.
Тема 9 Показатели вариации
Показатели вариации в анализе взаимосвязей
Для измерения степени колеблемости отдельных значений признака относительно средней исчисляют основные показатели вариации.
Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности. Измерение вариации признаков имеет как теоретическое, так и практическое значение.
Так, например, для выявления наиболее стабильно работающего коллектива или предприятия наравне с другими показателями рассчитывают и основные показатели вариации. Эти показатели дают возможность количественно определить размеры устойчивости производительности труда, уровня квалификации, цен на основные виды выпускаемой продукции и т.п. Измерение размеров вариации такого показателя, как «выполнение работ в срок» имеет важное значение для принятия решений заказчиками и инвесторами, т.к. ситуация, в которой присутствует изменчивость признака, часто содержит риск. Особое значение показатели вариации приобретают в анализе рынка ценных бумаг, где мера колеблемости отождествляется с мерой рискованности вложения денежных средств.
Основными показателями, характеризующими вариацию, являются:
1) Размах вариации
2) Среднее линейное отклонение исчисляют для того, чтобы дать обобщающую характеристику распределению отклонений:
где –абсолютные значения отклонений отдельных вариантов xi от средней арифметической ; fi – частота.
3. Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической:
4. Среднее квадратическое отклонение – корень квадратный из дисперсии:
5. Коэффициент вариации – используется для сравнительной оценки вариации, а также для характеристики однородности совокупности:
Пример. Для иллюстрации расчетов воспользуемся данными нижеприведенной табл. 9.1:
Таблица 9.1 ‑ Данные о продаже основных марок холодильников:
Рассчитаем размах вариации.
R= 1200-460=740$
Пример вычисления размаха вариации
Размах вариации служит незаменимой мерой разброса экстремальных значений признака. Кроме характеристики границ разброса признака, размах вариации может быть использован для выявления ошибок. При наличии очень больших (или очень малых) ошибочно записанных значений признака размах вариации сразу резко возрастает, что требует проверки и корректировки исходных данных.
Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака.
Этого недостатка лишен другой показатель – дисперсия, рассчитываемый как средний квадрат отклонений значений признака от их средней величины.
Между индивидуальными отклонениями от средней и колеблемостью признака существует прямая зависимость: чем сильнее колеблемость признака, тем больше отклонения его значений от средней величины и менее устойчив изучаемый показатель.
Как и средняя величина этот показатель может быть рассчитан в двух формах: взвешенной и невзвешенной
По приведенным выше данным определим средневзвешенную цену холодильника:
Далее рассчитаем дисперсию:
. Следует отметить, что дисперсия еще не дает представления об однородности совокупности, и этому показателю трудно дать экономическую интерпретацию, т.к. он рассчитан в квадратных единицах. Поэтому следующим шагом в исследовании однородности совокупности является расчет среднего квадратического отклонения, показывающего, насколько в среднем отклоняются конкретные варианты признака от его среднего значения. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность что и изучаемый признак. .
Рассчитаем среднее квадратическое отклонение
Рассмотренные показатели позволяют получить абсолютное значение вариации признака. Однако для сравнения разных совокупностей с точки зрения устойчивости какого-либо одного признака или для определения однородности совокупности рассчитывают относительные показатели.
Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего эти показатели выражаются в процентах.
Определим значение показателя вариации по вышеприведенным данным таблицы
Совокупность считается однородной, если V не превышает 33%.
Если V 25% – вариация сильная.
Вывод: Рассчитанная величина свидетельствует о неоднородности цен на холодильники, т.к. однородной совокупность считается, если коэффициент вариации меньше 33% (для распределений близких к нормальному).
!! Следует отметить, что коэффициент вариации может быть более 100%, что, в частности, может быть при наличии значений сильно отличающихся от средней величины. Такой результат означает, что в исследуемой совокупности сильна вариация признаков по отношению к средней величине.
Изучая вариацию интересующего нас признака в пределах исследуемой совокупности и опираясь на общую среднюю в расчетах, трудно оценить степень воздействия на него какого-либо отдельного признака.
При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным (оказывающим влияние на взаимосвязанный с ним признак) и результативным (подверженным влиянию).
Для выявления взаимосвязи исходная совокупность делится по факторному признаку на группы. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих вариацию индивидуальных значений признака, используют правило сложения дисперсий.
Общая дисперсия представляет собой сумму средней из виутригрупповой и межгрупповой и дисперсий:
Общая дисперсия характеризует вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности.
Межгрупповая дисперсия характеризует вариацию, обусловленную влиянием фактора, положенного в основу группировки.
Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка. Другими словами внутригрупповая дисперсия отражает случайную вариацию. Внутригрупповая дисперсия рассчитывается отдельно по каждой j-ой группе.
Для всех групп в целом вычисляется средняя из внутригрупповых дисперсий, взвешенных на частоты соответствующих групп по формуле:
Взаимосвязь между тремя видами дисперсий получила название правила сложения дисперсий. Таким образом, зная два вида дисперсий всегда можно определить третий:
Из этого равенства следует, что общая дисперсия, как правило, будет больше средней из групповых дисперсий. Это обусловлено тем, что при расчленении общей совокупности единиц на части по какому-либо признаку образуются более или менее однородные группы, в результате чего сокращается колеблемость признаков в пределах каждой группы. Это приводит к тому, что средняя из групповых дисперсий оказывается меньше дисперсии признака по всей совокупности единиц, причем разница между этими показателями будет тем больше, чем однороднее получаются группы в результате расчленения общей совокупности.
Теснота связи между факторным и результативным признаками оценивается на основе эмпирического корреляционного отношения:
Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.
Пример. На следующем условном примере исследуем зависимость объема выполненных работ от формы собственности проектно-изыскательских организаций.
Таблица 9.2. Выполнение работ проектно-изыскательскими организациями разной формы собственности
Форма собственности | Количество предприятий | Итого | |
Государственная | 4 | 10,30,20,40 | 100 |
Негосударственная | 6 | 20, 40, 60, 20, 50, 50 | 240 |
Итого | 10 | 340 |
1) Определим средний объем работ для предприятий двух форм собственности.
2) Определим средний объем работ для каждой формы собственности.
3) Рассчитаем общую и внутригрупповые (т.е. для каждой группы) дисперсии.
4) Определим среднюю из внутригрупповых и межгрупповую дисперсию. Для этого полученные ранее данные заносятся в таблицу расчета.
Таблица 9.3. – Вспомогательная таблица
Пример. Средняя из внутригрупповых дисперсий
Пример. Межгрупповая дисперсия
На последнем этапе решения задачи необходимо проверить тождество, отражающее закон сложения дисперсий:
Проверка закона сложения дисперсий: 54,0+189,8=243,8
Вывод: Таким образом, можно сделать вывод о том, что объем работ, выполненных проектно-изыскательскими организациями на 22% [(54,0/243,8) х 100%] зависит от фактора, положенного в основание группировки, т.е. от формы собственности, а на 78% [(189,8/243,8)х100%)] ‑ от прочих факторов.
Вывод о том, что объем выполненных работ в гораздо большей степени зависит от каких-либо других факторов, чем от формы собственности предприятий подтверждается и величиной эмпирического корреляционного отношения:
Вывод: Величина этого показателя свидетельствует о том, что зависимость объема работ от формы собственности предприятия невелика
Контрольные задания
Вычислить: а) размах вариации; б)среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; относительные показатели вариации возраста студентов.
2. По данным статистических ежегодников постройте таблицу с рядом показателей и определите показатели вариации: а) размах; б) среднее линейное отклонение; в) среднее квадратическое отклонение; г) коэффициент вариации. Оцените количественную однородность совокупности.
Показатели вариации
Поможем написать любую работу на аналогичную тему
Показатели вариации. При изучении варьирующего признака у единиц совокупности нельзя ограничиваться лишь расчетом средней величины из отдельных вариантов, так как одна и та же средняя может относиться далеко не к одинаковым по составу совокупностям.
Вариацией признака называется различие индивидуальных значений признака внутри изучаемой совокупности.
Термин «вариация» произошел от латинского variatio – изменение, колеблемость, различие. Однако не всякие различия принято называть вариацией.
Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Колеблемость отдельных значений характеризуют показатели вариации. Чем больше вариация, тем дальше в среднем отдельные значения лежат друг от друга.
Различают вариацию признака в абсолютных и относительных величинах.
К абсолютным показателям относятся: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия. Все абсолютные показатели имеют ту же размерность, что и изучаемые величины.
К относительным показателям относятся коэффициенты осцилляции, линейного отклонения и вариации.
Показатели абсолютные. Рассчитаем абсолютные показатели, характеризующие вариацию признака.
Размах вариации, представляет собой разность между максимальным и минимальным значением признака.
Показатель размаха вариации не всегда применим, так как он учитывает только крайние значения признака, которые могут сильно отличаться от всех других единиц.
Более точно можно определить вариацию в ряду при помощи показателей, учитывающих отклонения всех вариантов от средней арифметической.
Таких показателей в статистике два: среднее линейное и среднее квадратическое отклонение.
Среднее линейное отклонение (L) представляет собой среднее арифметическое из абсолютных значений отклонений отдельных вариантов от средней.
– для несгруппированных данных;
– для сгруппированных данных.
Практическое использование среднего линейного отклонения заключается в следующем, с помощью этого показателя анализируется состав работающих, ритмичность производства, равномерность поставок материалов.
Недостаток этого показателя заключается в том, что он усложняет расчеты вероятного типа, затрудняет применение методов математической статистики.
Среднее квадратическое отклонение () является наиболее распространенным и общепринятым показателем вариации. Оно несколько больше среднего линейного отклонения. Для умеренно асимметричных распределений установлено следующее соотношение между ними
=1,25L
Для его исчисления каждое отклонение от средней возводится в квадрат, все квадраты суммируются (с учетом весом), после чего сумма квадратов делится на число членов ряда и из частного извлекается корень квадратный.
Все эти действия выражает следующая формула
– для несгруппированных данных,
– для сгруппированных данных.
т.е. среднее квадратическое отклонение представляет собой корень квадратный из средней арифметической квадратов отклонений от средней.
Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше σ, тем лучше среднее арифметическое отражает собой всю представляемую совокупность.
Средняя арифметическая из квадратов отклонений вариантов значений признака от средней величины носит название дисперсии (), которая рассчитывается по формулам
– для несгруппированных,
– для сгруппированных.
Отличительной особенностью данного показатели является то, что при возведении в квадрат () удельный вес малых отклонений уменьшается, а больших увеличивается в общей сумме отклонений.
Дисперсия обладает рядом свойств, некоторые из них позволяют упростить её вычисление:
1. Дисперсия постоянной величины равна 0.
Если , то и
.
Тогда .
2. Если все варианты значений признака (x) уменьшить на одно и то же число, то дисперсия не уменьшится.
Пусть , но тогда в соответствии со свойствами средней арифметической и
.
Дисперсия в новом ряду будет равна
, т.е. дисперсия в ряду
равна дисперсии первоначального ряда
.
3. Если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз.
Пусть , тогда и
.
Дисперсия же нового ряда будет равна
Выше был рассмотрен расчет показателей вариации для количественных признаков, но в экономических расчетах может ставиться задача оценки вариации качественных признаков. Например, при изучении качества изготовленной продукции, продукцию можно разделить на качественную и бракованную.
В таком случае речь идет об альтернативных признаках.
Альтернативными признаками называются такие, которыми одни единицы совокупности обладают, а другие нет. Например, наличие производственного стажа у абитуриентов, ученая степень у преподавателей ВУЗов и т.д. Наличие признака у единиц совокупности условно обозначаем через 1, а отсутствие – 0. Тогда, если долю единиц, обладающих признаком (в общей численности единиц совокупности), обозначить через р, а долю единиц, не обладающих признаком, через q, дисперсию альтернативного признака можно рассчитать по общему правилу. При этом p + q = 1 и, значит, q = 1– p.
Сначала рассчитываем среднее значение альтернативного признака:
Рассчитаем среднее значение альтернативного признака
,
т.е. среднее значение альтернативного признака равно доле единиц, обладающих данным признаком.
Дисперсия же альтернативного признака будет равна:
Таким образом, дисперсия альтернативного признака равняется произведению доли единиц, обладающих данным признаком, на долю единиц, не обладающих данным признаком.
А среднее квадратическое отклонение будет равно =
.
Показатели относительные. Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях представляют интерес показатели вариации, выраженные в относительных величинах. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане.
Чаще всего они выражаются в процентах и определяют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%. Различают следующие относительные показатели вариации:
1. Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг средней.
.
2. Относительное линейное отклонение характеризует долю усредненного значения абсолютных отношений от средней величины.
.
3. Коэффициент вариации оценивает типичность средних величин.
.
Чем меньше , тем однороднее совокупность по изучаемому признаку и типичнее средняя. Если
≤33%, то распределение близко к нормальному, а совокупность считается однородной. Из приведенного примера вторая совокупность однородна.
Виды дисперсий и правило сложения дисперсий. Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.
При этом можно определить три показателя колеблемости признака в совокупности:
1. Общую вариацию совокупности, которая является результатом действия всех причин. Эта вариация может быть измерена общей дисперсией (), характеризующей отклонения индивидуальных значений признака совокупности от общей средней
.
2. Вариацию групповых средних, выражающих отклонения групповых средних от общей средней и отражающих влияние того фактора, по которому произведена группировка. Эта вариация может быть измерена так называемой межгрупповой дисперсией (δ2)
,
где — групповые средние, а
-общая средняя для всей совокупности, и
— численность отдельных групп.
3. Остаточную (или внутригрупповую) вариацию, которая выражается в отклонении отдельных значений признака в каждой группе от их групповой средней и, следовательно, отражает влияние всех прочих факторов кроме положенного в основу группировки. Поскольку вариацию в каждой группе отражает групповая дисперсия
,
то для всей совокупности остаточную вариацию будет отражать средняя из групповых дисперсий. Эту дисперсию называют средней из внутригрупповых дисперсий () и рассчитывается она по формуле
.
Общая вариация признака в совокупности должна определяться как сумма вариации групповых средних (за счет одного выделенного фактора) и остаточной вариации (за счет остальных факторов). Это равенство находит свое выражение в сложении дисперсий
.
Это равенство, имеющее строго математическое доказательство, известно, как правило сложения дисперсий.
Правило сложения дисперсий позволяет находить общую дисперсию по её компонентам, когда индивидуальные значения признака неизвестны, а в распоряжении имеются только групповые показатели.
Коэффициент детерминации. Правило сложения дисперсии позволяет выявить зависимость результатов от определенных факторов при помощи коэффициента детерминации.
,
Этот коэффициент показывает долю (удельный вес) общей вариации изучаемого признака, обусловленную вариацией группировочного признака.
Корень квадратный из коэффициента детерминации носит название корреляционного отношения ():
Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Корреляционное отношение изменяется в пределах от 0 до 1. Если , то группировочный признак не оказывает влияния на результативный. Если
, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю.
Показатели асимметрии и эксцесса. В области экономических явлений строго симметричные ряды встречаются крайне редко, чаще приходится иметь дело с асимметричными рядами.
В статистике для характеристики асимметрии пользуются несколькими показателями. Если учесть, что в симметричном ряду средняя арифметическая совпадает по значению с модой и медианой, то наиболее простым показателем асимметрии () будет разность между средней арифметической и модой, т.е.
=
.
Если ()>0, то на графике такой ряд будет иметь вытянутость вправо (правосторонняя асимметрия).
Если () 0, то эксцесс считают положительным (распределение островершинно), если