что такое малая выборка в статистике
Малая выборка
При контроле качества товаров в экономических исследованиях эксперимент может проводиться на основе малой выборки.
Под малой выборкой понимается несплошное статистическое обследование, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности. Объем малой выборки обычно не превышает 30 единиц и может доходить до 4 — 5 единиц.
Средняя ошибка малой выборки вычисляется по формуле:
,
где
— дисперсия малой выборки.
При определении дисперсии число степеней свободы равно n-1:
.
Предельная ошибка малой выборки определяется по формуле
При этом значение коэффициента доверия t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n. Для отдельных значений t и n доверительная вероятность малой выборки определяется по специальным таблицам Стьюдента, в которых даны распределения стандартизированных отклонений: .
5. Способы распространения характеристик выборки на генеральную совокупность.
Выборочный метод чаще всего применяется для получения характеристик генеральной совокупности по соответствующим показателям выборки. В зависимости от целей исследований это осуществляется или прямым пересчётом показателей выборки для генеральной совокупности, или посредством расчёта поправочных коэффициентов.
Способ прямого пересчёта. Он состоит в том, что показатели выборочной доли или средней
распространяется на генеральную совокупность с учётом ошибки выборки.
Способ поправочных коэффициентов. Применяется в случаях, когда целью выборочного метода является уточнение результатов сплошного учета. Для этого после обобщения данных сплошного учета практикуется 10%-ное выборочное обследование с определением так называемого “процента недоучета”.
Так, например, если в хозяйствах населения поселка по данным 10%-ной выборки было зарегистрировано 52 головы скота, а по данным сплошного учета в этом массиве значится 50 голов, то коэффициент недоучета составляет 4% [(2*50):100]. С учетом полученного коэффициента вносится поправка в общую численность скота, находящегося у населения данного поселка.
Малая выборка.
Поможем написать любую работу на аналогичную тему
Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30.
При оценке результатов малой выборки величина генеральной дисперсии в расчетах не используется. Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента:
где
. – мера случайных колебаний выборочной средней в малой выборке.
Величина σ вычисляется на основе данных выборочного наблюдения:
Предельная ошибка малой выборки рассчитывается аналогичным образом:
Но, в данном случае, вероятная оценка зависит не только от величины t, но и от объема выборки. Величина коэффициента доверия t при различных объемах малой выборки представлена в таблице 9.3.
Независимо от вида выборки, на заключительном этапе определяются доверительные интервалы, в которых может находиться генеральная средняя (для количественных признаков) или генеральная доля (для качественных признаков). Доверительные интервалы – это область тех значений генеральной средней, выход за пределы которой имеет весьма малую вероятность. Доверительные интервалы определяются по формулам:
· для средней: ;
· для доли: ;
Распределение вероятности в малых выборках в зависимости
от коэффициента доверия t и объема выборки n
n
Малые выборки
Полезное
Смотреть что такое «Малые выборки» в других словарях:
Малые противолодочные корабли проекта 1124 — У этого термина существуют и другие значения, см. Проект 1124. Малые противолодочные корабли проекта 1124 … Википедия
РАССЕИВАНИЕ ВЫБОРКИ — одна, из скалярных характеристик разброса выборки на прямой относительно какой либо конкретной точки, называемой ц е н т р о м р а с с е и в а н и я, численно равная сумме квадратов отклонений значении случайных величин, образующих выборку, от… … Математическая энциклопедия
Математическая статистика — раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называются сведения о числе объектов в какой либо… … Большая советская энциклопедия
Статистика малых выборок (small-sample statistics) — Принято считать, что начало С. м. в. или, как ее часто называют, статистике «малых п», было положено в первом десятилетии XX века публикацией работы У. Госсета, в к рой он поместил t распределение, постулированное получившим чуть позже мировую… … Психологическая энциклопедия
Нормальное распределение — одно из важнейших распределений (См. Распределение) вероятностей. Термин «Н. р.» применяют как по отношению к распределениям вероятностей случайных величин, так и по отношению к совместным распределениям вероятностей нескольких случайных… … Большая советская энциклопедия
Стьюдента распределение — с f степенями свободы, распределение отношения Т = X/Y независимых случайных величин Х и Y, где Х подчиняется нормальному распределению (См. Нормальное распределение) с математическим ожиданием EX = 0 и дисперсией DX = 1, а fY2 имеет «Хи… … Большая советская энциклопедия
КАЧЕСТВЕННОЕ МАРКЕТИНГОВОЕ ИССЛЕДОВАНИЕ — (qualitative marketing research) Метод маркетинговых исследований (marketing research), при котором для изучения убеждений, мотиваций, мнений и ощущений респондентов используются малые выборки (samples) респондентов. В целях подробного анализа… … Словарь бизнес-терминов
Коэффициент корреляции — (Correlation coefficient) Коэффициент корреляции это статистический показатель зависимости двух случайных величин Определение коэффициента корреляции, виды коэффициентов корреляции, свойства коэффициента корреляции, вычисление и применение… … Энциклопедия инвестора
Корреляция — (Correlation) Корреляция это статистическая взаимосвязь двух или нескольких случайных величин Понятие корреляции, виды корреляции, коэффициент корреляции, корреляционный анализ, корреляция цен, корреляция валютных пар на Форекс Содержание… … Энциклопедия инвестора
Статистика малых выборок (small-sample statistics)
t-распределение. Теория t-распределения, подобно теории z-распределения, используется для проверки нулевой гипотезы о том, что две выборки представляют собой просто случайные выборки из одной генеральной совокупности и, следовательно, вычисленные статистики (напр., среднее и стандартное отклонение) яв-ся несмещенными оценками параметров генеральной совокупности. Однако, в отличие от теории нормального распределения, теория t-распределения для малых выборок не требует априорного знания или точных оценок математического ожидания и дисперсии генеральной совокупности. Более того, хотя проверка различия между средними двух больших выборок на статистическую значимость требует принципиального допущения о нормальном распределении характеристик генеральной совокупности, теория t-распределения не требует допущений относительно параметров.
Общеизвестно, что нормально распределенные характеристики описываются одной единственной кривой — кривой Гаусса, к-рая удовлетворяет следующему уравнению:
При t-распределении целое семейство кривых представлено следующей формулой:
Вот почему уравнение для t включает гамма-функцию, которая в математике означает, что при изменении п данному уравнению будет удовлетворять другая кривая.
F-pacnpeделение. Проверяемая с помощью t-критерия нулевая гипотеза состоит в том, что две выборки были случайным образом извлечены из одной генеральной совокупности или же были случайно извлечены из двух разных совокупностей с одинаковой дисперсией. А что делать, если нужно провести анализ большего числа групп? Ответ на этот вопрос искали в течение двадцати лет после того, как Госсет открыл t-распределение. Два самых выдающихся статистика XX столетия непосредственно причастны к его получению. Один — крупнейший английский статистик Р. А. Фишер, предложивший первые теорет. формулировки, развитие к-рых привело к получению F-распределения; его работы по теории малых выборок, развивающие идеи Госсета, были опубликованы в середине 20-х годов (Fisher, 1925). Другой — Джордж Снедекор, один из плеяды первых американских статистиков, разработавший способ сравнения двух независимых выборок любого объема посредством вычисления отношения двух оценок дисперсии. Он назвал это отношение F-отношением, в честь Фишера. Результаты исслед. Снедекора привели к тому, что F-распределение стало задаваться как распределение отношения двух статистик с2, каждой со своими степенями свободы:
Из этого вышли классические работы Фишера по дисперсионному анализу — статистическому методу, явно ориентированному на анализ малых выборок.
Выборочное распределение F (где п = df) представлено следующим уравнением:
Как и в случае t-распределения, гамма-функция указывает на то, что существует семейство распределений, удовлетворяющих уравнению для F. В этом случае, однако, анализ включает два величины df: число степеней свободы для числителя и для знаменателя F-отношения.
Таблицы для оценивания t- и F-статистик. При проверке нулевой гипотезы с помощью С., основанных на теории больших выборок, обычно требуется только одна справочная таблица — таблица нормальных отклонений (z), позволяющая определить площадь под нормальной кривой между любыми двумя значениями z на оси абсцисс. Однако таблицы для t- и F-распределений по необходимости представлены комплектом таблиц, поскольку эти таблицы основаны на множестве распределений, полученных вследствие варьирования числа степеней свободы. Хотя t- и F-распределения представляют собой распределения плотности вероятности, как и нормальное распределение для больших выборок, они отличаются от последнего в отношении четырех моментов, используемых для их описания. t-распределение, напр., является симметричным (обратите внимание на t2 в его уравнении) при всех df, но становится все более островершинным по мере уменьшения объема выборки. Островершинные кривые (с эксцессом больше нормального) имеют тенденцию быть менее асимптотическими (т. е. меньше приближаться к оси абсцисс на концах распределения), чем кривые с нормальным эксцессом, такие как кривая Гаусса. Это различие приводит к заметным расхождениям между точками на оси абсцисс, соответствующими значениям t и z. При df = 5 и двустороннем уровне а, равном 0,05, t = 2,57, тогда как соответствующее z = 1,96. Следовательно, t = 2,57 свидетельствует о статистической значимости на 5% уровне. Однако в случае нормальной кривой z = 2,57 (точнее 2,58) будет уже указывать на 1% уровень статистической значимости. Аналогичные сравнения можно провести и с F-распределением, поскольку t равно F в случае, когда число выборок равно двум.
Что составляет «малую» выборку?
В свое время был поднят вопрос о том, какой объем должна иметь выборка, чтобы ее можно было считать малой. Определенного ответа на этот вопрос просто не существует. Однако условной границей между малой и большой выборкой принято считать df = 30. Основанием для этого в какой-то мере произвольного решения служит результат сравнения t-распределения с нормальным распределением. Как уже отмечалось выше, расхождение значений t и z имеет тенденцию возрастать с уменьшением и снижаться с увеличением df. Фактически, t начинает тесно приближаться к z задолго до предельного случая, когда t = z при df = ∞. Простое визуальное изучение табличных значений t позволяет увидеть, что это приближение становиться довольно быстрым, начиная с df = 30 и выше. Сравнительные величины t (при df = 30) и z равны соответственно: 2,04 и 1,96 для р = 0,05; 2,75 и 2,58 для р = 0,01; 3,65 и 3,29 для р = 0,001.
Другие статистики для «малых» выборок
Хотя такие статистические критерии, как t и F, специально разработаны для применения к малым выборкам, они в равной степени применимы и к большим выборкам. Существует, однако, множество др. статистических методов, предназначенных для анализа малых выборок и часто используемых именно для этой цели. Имеются в виду т. н. непараметрические или свободные от распределения методы. В основном, фигурирующие в этих методах С. предназначены для применения к измерениям, полученным с помощью шкал, не удовлетворяющих определению шкал отношений или интервалов. Чаще всего это порядковые (ранговые) или номинальные измерения. Непараметрические С. не требуют предположений в отношении параметров распределения, в частности, в отношении оценок дисперсии, потому что порядковые и номинальные шкалы исключают само понятие дисперсии. По этой причине непараметрические методы используются также для измерений, полученных с помощью интервальных шкал и шкал отношений, когда анализируются малые выборки и существует вероятность того, что нарушаются основные предположения, необходимые для применения параметрических методов. К числу таких С., к-рые можно обоснованно применять к малым выборкам, относятся: критерий точной вероятности Фишера, двухфакторный непараметрический (ранговый) дисперсионный анализ Фридмана, коэффициент ранговой корреляции t Кендалла, коэффициент конкордации (W) Кендалла, H-критерий Краскела — Уоллеса для непараметрического (рангового) однофакторного дисперсионного анализа, U-критерий Манна-Уитни, медианный критерий, критерий знаков, коэффициент ранговой корреляции r Спирмена и t-критерий Уилкоксона.
См. также Вероятность, Статистический вывод, Переменные в научных исследованиях
Блок 11. Малая выборка
Дата добавления: 2014-05-29 ; просмотров: 5331 ; Нарушение авторских прав
Малая выборка – это несплошное статистическое наблюдение, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности. Обычно объем малой выборки не превышает 30 единиц, а минимальный объем может доходить до 4-5 единиц. В отдельных случаях к малой может быть отнесена выборка до 45 единиц. Малая выборка широко применяется в экономических исследованиях и при организации контроля качества товаров и услуг.
Средняя ошибка малой выборки определяется по формуле:
где
— дисперсия малой выборки, она рассчитывается по формуле
=
, где n-1—число степеней свободы.
Предельная ошибка малой выборки рассчитывается по формуле:
.
Для проведения малой выборки в качестве доверительной вероятности принимается 0,95 и 0,99. Для определения предельной ошибки малой выборки используют распределения Стьюдента и определяют коэффициент доверия t:
n | S(t) |
0,95 | 0,99 |
3,183 2,777 2,571 2,447 2,364 2,307 2,263 2,119 2,078 | 5,841 4,604 4,032 3,707 3,500 3,356 3,250 2,921 2,832 |
Пример. При анализе прибыли по сделкам, совершенным фирмой в течение года, была сделана выборка и установлена по ним прибыльность в %: 4,5; 5,0; 4,2; 3,5; 6,0; 5,2; 4,5; 5,2; 4,3; 6,6.
Нужно по данным выборочного наблюдения установить с вероятностью 0,95 предел, в котором находится средняя прибыльность сделок, по результатам работы фирмы за год.
Средняя прибыльность сделок по данным малой выборки:
Определяем дисперсию малой выборки; для этого произведем предварительные расчеты:
=
=
Определяем среднюю ошибку малой выборки:
Находим предельную ошибку малой выборки. Для этого по распределению Стьюдента при заданной вероятности находим значение коэффициента доверия t= 2,263
2,263
Следовательно, с вероятностью 0,95 можно утверждать, что средняя годовая прибыльность сделок фирмы находится в пределах:
т.е. от 4,9-0,66=4,24% до 4,9+0,66=5,56%.