что такое корреляция спирмена
Коэффициент корреляции Спирмена
Материал из MachineLearning.
Содержание
Коэффициент корреляции Спирмена (Spearman rank correlation coefficient) — мера линейной связи между случайными величинами. Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
Определение
Вычисление корреляции Спирмена:
Коэффициент корреляции Спирмена вычисляется по формуле:
Случай совпадающих наблюдений:
При наличии связок коэффициент корреляции Спирмена следует вычислять следующим образом:
Обоснование критерия Спирмена:
который наиболее удобен для вычислений.
Статистическая проверка наличия корреляции
Против альтернативы \ 0″ alt= «H_1:\; \rho\ >\ 0» />:
Рассмотрим центрированную и нормированную статистику Спирмена:
Нулевая гипотеза отвергается (против альтернативы — \ 0″ alt= «\left| \rho \right|\ >\ 0» />), если:
В 1978 году Р. Иман и У. Коновер предложили следующую поправку, значительно повышающую точность аппроксимации. Она использует линейную комбинацию нормальной и стьюдентовской квантилей. Положим:
Примеры
Направление линейной зависимости
Коэффициенты корреляции реагируют на изменение направления и зашумлённость линейной зависимости между переменными.
Наклон линейного тренда
Коэффициенты корреляции реагируют на изменение направления, но не реагируют на изменение наклона тренда. На первом, четвёртом и седьмом рисунках дисперсия одной из переменных близка к нулю, поэтому не удаётся зафиксировать факт линейной зависимости.
Нелинейная зависимость
Корреляции Кенделла и Спирмена не отражают меры нелинейной зависимости между переменными.
Линейная и нелинейная зависимости
На каждой из приведённых ниже иллюстраций осуществляется переход от линейной зависимости к нелинейной. Коэффициенты корреляции Кенделла и Спирмена реагируют на это одинаковым образом.
По мере смены линейной зависимости нелинейной значения коэффициентов корреляции падают.
Связь коэффициентов корреляции Спирмена и Пирсона
В случае выборок из нормального распределения коэффициент корреляции Спирмена может быть использован для оценки коэффициента корреляции Пирсона по формуле:
Связь коэффициентов корреляции Спирмена и Кенделла
Выборкам и соответствуют последовательности рангов:
Проведем операцию упорядочивания рангов.
Коэффициент корреляции Кенделла и коэффициент корреляции Спирмена выражаются через ранги следующим образом:
Утверждение. [1] Если выборки и не коррелируют (выполняется гипотеза ), то величины и сильно закоррелированы. Коэффициент корреляции между ними можно вычислить по формуле:
История
Критерий был предложен британским психологом Чарльзом Эдвардом Спирменом в 1904 году.
Коэффициент корреляции Спирмена
Коэффициент корреляции Спирмена – статистический критерий, который наиболее часто используется при обработке эмпирических данных в курсовых, дипломных и магистерских работах по психологии. Этот критерий относится к типу непараметрических и не требует, чтобы данные были распределены по нормальному закону. Достаточно, если психологические показатели представлены в порядковой шкале, то есть учитывается только тот факт, что один показатель больше или меньше, чем другой.
Расчет коэффициента корреляции Спирмена
При проведении эмпирического исследования в дипломной по психологии для расчета коэффициента корреляции Спирмена удобнее пользоваться статистическими программами. Однако, этот критерий нетрудно рассчитать и вручную.
Пример расчета коэффициента корреляции Спирмена
Предположим, в рамках дипломной работы по психологии проводится исследование влияния климата в коллективе на состояние сотрудников. Одна из задач исследования состоит в выявлении взаимосвязи между климатом и эмоциональным истощением сотрудников.
В таблице приводятся данные, отражающие этапы расчета коэффициентов ранговой корреляции Спирмена. Суть расчета сводится к тому, что от собственно значений переходим к их рангам (ранг отражает положение показателя в общем списке и записывается в виде натурального числа). Далее находятся разности между рангами, эти разности возводятся в квадрат и суммируются.
Эмоциональное истощение (Х)
Психологический климат (Y)
Формула расчёта коэффициента корреляции Спирмена
D – разность между рангами
Сложность расчёта корреляций Спирмена вручную связана с необходимостью вводить поправки на одинаковые ранги, что достаточно трудоемко.
Сумма(D 2 )+Тх+ Тy 51,5+28+4,5
В специальной таблице находим значение критического значения коэффициента ранговой корреляции для выборки из 10 человек и для уровня значимости 0,05:
Следовательно, не существует связи между социально-психологическим климатом в коллективе и степенью истощения сотрудников. Для интерпретации данного результаты (а интерпретировать результаты статистических расчётов в дипломах по психологии очень важно) можно сказать следующее. Возможно, в коллективе сотрудников, где проводилось исследование, существуют социально-психологические или организационные факторы, которые опосредуют влияние климата в коллективе на эмоциональное истощение сотрудников. В связи с этим прямая взаимосвязь между этими показателями нивелируется.
Анализ результатов расчета коэффициентов ранговой корреляции Спирмена
Если коэффициент ранговой корреляции Спирмена вычисляется с помощью статистической программы, то она сама выделяет статистически значимые корреляции при заданном уровне статистической значимости (0,05 или 0,01).
Если расчёт коэффициента ранговой корреляции Спирмена проводится вручную, то после получения эмпирического значения его нужно сравнить с критическим. Критические значения коэффициентов ранговой корреляции Спирмена приводятся в специальных таблицах для разного объема выборки и уровня статистической значимости.
Далее нужно сравнить эмпирический и критический коэффициенты:
Несмотря на различные алгоритмы расчета корреляций Пирсона и Спирмена логика их анализа и интерпретации одинакова.
Различия коэффициентов корреляций Пирсона и Спирмена
На защите дипломных работ по психологии студента могут спросить о причинах, по которым он выбрал тот или иной тип коэффициента корреляции. То есть, важно понимать, чем принципиально различаются коэффициенты корреляции Пирсона и Спирмена.
Не вдаваясь в математические тонкости, можно сказать следующее:
Таким образом, в курсовых, дипломных и магистерских работах по психологии для анализа взаимосвязей между показателями лучше использовать коэффициенты ранговой корреляции Спирмена.
СПИСОК ЛИТЕРАТУРЫ ОНЛАЙН
Корреляционный анализ по методу Спирмена (ранги Спирмена)
Студента-психолога (социолога, менеджера, управленца и др.) нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых группах.
В математике для описания связей между переменными величинами используют понятие функции F, которая ставит в соответствие каждому определенному значению независимой переменной X определенное значение зависимой переменной Y. Полученная зависимость обозначается как Y=F(X).
При этом виды корреляционных связей между измеренными признаками могут быть различны: так, корреляция бывает линейной и нелинейной, положительной и отрицательной. Она линейна — если с увеличением или уменьшением одной переменной X,вторая переменная Y в среднем либо также растет, либо убывает. Она нелинейна, если при увеличении одной величины характер изменения второй не линеен, а описывается другими законами.
Корреляция будет положительной, если с увеличением переменной X переменная Y в среднем также увеличивается, а если с увеличением X переменная Y имеет в среднем тенденцию к уменьшению, то говорят о наличии отрицательной корреляции. Возможна ситуация, когда между переменными невозможно установить какую-либо зависимость. В этом случае говорят об отсутствии корреляционной связи.
Задача корреляционного анализа сводится к установлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.
Коэффициент корреляции рангов, предложенный К. Спирменом, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин.
Ранговый коэффициент линейной корреляции Спирмена подсчитывается по формуле:
где n — количество ранжируемых признаков (показателей, испытуемых);
D — разность между рангами по двум переменным для каждого испытуемого;
D2 — сумма квадратов разностей рангов.
Критические значения коэффициента корреляции рангов Спирмена представлены ниже:
Знак коэффициента корреляции очень важен для интерпретации полученной связи. Если знак коэффициента линейной корреляции — плюс, то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости.
Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости. При этом выбор переменной, которой приписывается характер (тенденция) возрастания — произволен. Это может быть как переменная X, так и переменная Y. Однако если считается, что увеличивается переменная X, то переменная Y будет соответственно уменьшаться, и наоборот.
Рассмотрим пример корреляции Спирмена
Психолог выясняет, как связаны между собой индивидуальные показатели готовности к школе, полученные до начала обучения в школе у 11 первоклассников и их средняя успеваемость в конце учебного года.
Для решения этой задачи были проранжированы, во-первых, значения показателей школьной готовности, полученные при поступлении в школу, и, во-вторых, итоговые показатели успеваемости в конце года у этих же учащихся в среднем. Результаты представим в таблице:
Подставляем полученные данные в вышеприведенную формулу, и производим расчет. Получаем:
Для нахождения уровня значимости обращаемся к таблице «Критические значения коэффициента корреляции рангов Спирмена,» в которой приведены критические значения для коэффициентов ранговой корреляции.
Строим соответствующую «ось значимости»:
Полученный коэффициент корреляции совпал с критическим значением для уровня значимости в 1%. Следовательно, можно утверждать, что показатели школьной готовности и итоговые оценки первоклассников связаны положительной корреляционной зависимостью — иначе говоря, чем выше показатель школьной готовности, тем лучше учится первоклассник. В терминах статистических гипотез психолог должен отклонить нулевую (Н0) гипотезу о сходстве и принять альтернативную (Н1) о наличии различий, которая говорит о том, что связь между показателями школьной готовности и средней успеваемостью отлична от нуля.
Метод ранговой корреляции Спирмена и его применение в психологии
Воспитание будущих психологов происходит в стенах СУЗов и ВУЗов. Образовательный процесс студентов «психологического факультета» строится следующим образом: аудиторные занятия, прохождение практики, выполнение письменных проектов и преодоление аттестационных рубежей.
Воспитание будущих психологов происходит в стенах СУЗов и ВУЗов. Образовательный процесс студентов «психологического факультета» строится следующим образом: аудиторные занятия, прохождение практики, выполнение письменных проектов и преодоление аттестационных рубежей.
В ходе проведения исследований и написания курсовых, дипломных работ самым популярным методом будущих психологов является метод ранговой корреляции Спирмена.
Что это такое?
Проведение исследований в психологии предполагает использование практических методов: наблюдение, эксперимент, анкетирование и др. Именно они помогают собрать необходимую базу данных, пригодную для дальнейшего анализа. Результат мыслительного процесса напрямую зависит от актуальности и достоверности данных.
Студентов-психологов чаще всего интересует взаимосвязь разных групп или разных элементов одной выборки. В математике для установления таких связей используют понятие функции, а в статистике – корреляционный анализ.
В чем суть корреляции Спирмена?
Корреляция демонстрирует поведение исследуемых показателей. Данная операция позволяет подтвердить или полностью опровергнуть выдвинутую гипотезу. Она призвана определить, как себя поведет элемент при изменении «соседнего». В этом и заключается миссия корреляционного анализа.
Метод ранговой корреляции Спирмена призван установить, насколько тесно располагаются элементы, как они связаны между собой, а также позволяет уточнить их «направление взаимодействия». Если один изучаемый параметр увеличивается (например, х), а вместе с ним растет и второй (например, у), то такая корреляция является положительной. Если при увеличении одного критерия происходит уменьшение второго, то такая корреляция является отрицательной.
Нужна помощь преподавателя?
Мы всегда рады Вам помочь!
Особенности метода ранговой корреляции Спирмена
Метод ранговой корреляции Спирмена относится к непараметрическим. Здесь для проведения анализа важно располагать следующими данными:
Важно соотнести имеющиеся данные и показатели сначала по каждой из групп, а затем каждому признаку присвоить определенный ранг. Чем меньше признак (меньше соотносимых с ним данных), тем ниже ранг.
Проведение корреляционного анализа
Перед проведением корреляционного анализа по методу Спирмена важно создать систему ограничений, которая позволит детальнее изучить явление, процесс или поведение, установить связь между испытуемыми параметрами. Для этого достаточно:
Далее необходимо рассчитать ранговый коэффициент линейной корреляции Спирмена. Сделать это можно при помощи формулы:
Формула для расчета
На сегодняшний день производить расчеты можно вручную или с помощью специальных программ и сервисов, что в значительной степени облегчает работу исследователя. Главное, располагать необходимыми сведениями.
Если показатель корреляции Спирмена близок к значению +1, то это свидетельствует о высокой связи между анализируемыми параметрами. Притом изучаемые элементы следуют в одном направлении.
Действие корреляционного анализа Спирмена в психологии
Допустим, психологу необходимо установить связь между потенциальными первоклассниками и успеваемостью учащихся первого класса. Для этого исследователю следует располагать данными о развитии и подготовке будущих первоклассников, а затем иметь сведения об их успеваемости в конце учебного года.
Для начала важно установить:
Затем необходимо проранжировать признаки и выдвинуть гипотезу. Исследователь располагает следующими данными:
Применение корреляции Спирмена в психологии
Гипотеза исследователя следующая: прохождение дошкольной подготовки положительно влияет на успеваемость учащегося первого класса.
На основе имеющихся материалов можно произвести расчет коэффициента Спирмена. Для этого подставим в вышеуказанную форму корреляционного анализа нужные цифры:
Расчет коэффициента Спирмена
Показатель 0,76 близок к значению +1. Отсюда можно сделать вывод: чем лучше дошкольная подготовка будущего первоклассника, тем легче ему учиться и выше его успеваемость в конце учебного года. Значит, выдвинутая идея (гипотеза) верна.
При помощи метода ранговой корреляции Спирмена ученые могут проводить различные исследования в области психологии. Например, можно определять взаимосвязь психологического климата и производительности труда, связь эмоционального состояния коллектива и эмоциональное состояние отдельных членов этого коллектива и пр.
Эффективность метода ранговой корреляции Спирмена доказана многими учеными. Поэтому она является одним из лучших инструментов для проведения исследования при выполнении курсовых и дипломных работ.
Трудности с учебой?
Помощь в написании студенческих и
аспирантских работ!
Корреляционный анализ Спирмена
Описание метода ранговой корреляции Спирмена
При наличии двух рядов значений, подвергающихся ранжированию, рационально рассчитывать ранговую корреляцию Спирмена.
Такие ряды могут представляться:
Метод предполагает проведение ранжирования показателей в отдельности для каждого из признаков.
Наименьшее значение имеет наименьший ранг.
Этот метод относится к непараметрическому статистическому методу, предназначенному для установления существования связи изучаемых явлений:
Корреляционный анализ
Статистический метод, предназначенный для выявления существования зависимости между 2 и более случайными величинами (переменными), а также ее силы, получил название корреляционного анализа.
Получил свое название от correlatio (лат.) – соотношение.
При его использовании возможны варианты развития событий:
В качестве инструментов используются различные меры связи (коэффициенты).
На их выбор оказывает влияние:
Корреляционная связь характеризуется такими признаками:
Цели корреляционного анализа
Корреляционный анализ не позволяет установить причинную зависимость между исследуемыми переменными.
Он проводится с целью:
Методы корреляционного анализа
Данный анализ может выполняться с использованием:
Метод Пирсона применим для расчетов требующих точного определения силы, существующей между переменными. Изучаемые с его помощью признаки должны выражаться только количественно.
Для применения метода Спирмена или ранговой корреляции нет жестких требований в выражении признаков – оно может быть, как количественным, так и атрибутивным. Благодаря этому методу получается информация не о точном установлении силы связи, а имеющая ориентировочный характер.
В рядах переменных могут содержаться открытые варианты. Например, когда стаж работы выражается такими значениями, как до 1 года, более 5 лет и т.д.
Коэффициент корреляции
Наиболее распространены коэффициенты:
Ограничения использования коэффициента корреляции
Получение недостоверных данных при расчете коэффициента корреляции возможно в тех случаях, когда:
Проверка значимости корреляции
Для оценки статистических величин используется понятие их значимости или же достоверности, характеризующей вероятность случайного возникновения величины либо крайних ее значений.
Его значение сравнивается с табличным, количество степенней свободы принимается как 2. При получении расчетного значения критерия больше табличного, свидетельствует о значимости коэффициента корреляции.
При проведении экономических расчетов достаточным считается доверительный уровень 0,05 (95%) либо 0,01 (99%).
Ранги Спирмена
Коэффициент ранговой корреляции Спирмена позволяет статистически установить наличие связи между явлениями. Его расчет предполагает установление для каждого признака порядкового номера – ранга. Ранг может быть возрастающим либо убывающим.
Количество признаков, подвергаемых ранжированию, может быть любым. Это достаточно трудоемкий процесс, ограничивающий их количество. Затруднения начинаются при достижении 20 признаков.
Для расчета коэффициента Спирмена пользуются формулой:
n – отображает количество ранжируемых признаков;
d – не что иное как разность между рангами по двум переменным;
а ∑(d2) – сумма квадратов разностей рангов.
Применение корреляционного анализа в психологии
Статистическое сопровождение психологических исследований позволяет сделать их более объективными и высоко репрезентативными. Статистическая обработка данных полученных в ходе психологических экспериментов способствует извлечению максимума полезной информации.
Наиболее широкое применение в обработке их результатов получил корреляционный анализ.
Уместным является проведение корреляционного анализа результатов, полученных при проведении исследований:
Краткая инструкция к проведению корреляционного анализа по критерию Спирмена
Проведение корреляционного анализа с использованием метода Спирмена выполняется по следующему алгоритму:
Пример корреляции Спирмена
Необходимо установить наличие корреляционной связи между рабочим стажем и показателем травматизма при наличии следующих данных:
Наиболее подходящим методом анализа является ранговый метод, т.к. один из признаков представлен в виде открытых вариантов: рабочий стаж до 1 года и рабочий стаж 7 и более лет.
Решение задачи начинается с ранжирования данных, которые сводятся в рабочую таблицу и могут быть выполнены вручную, т.к. их объем не велик:
Отрицательное значение коэффициента свидетельствует о наличии обратной связи между признаками и позволяет утверждать, что небольшой стаж работы сопровождается большим числом травм. Причем, сила связи этих показателей достаточно большая.
Следующим этапом расчётов является определение достоверности полученного коэффициента:
• рассчитывается его ошибка и критерий Стьюдента