Коэффициент корреляции - Методы математической статистики <!--%IFTH1%0%-->- <!--%IFEN1%0%--> - Каталог статей - Статистика в психологии и педагогике
Главная Статистика в психологии и педагогике Четверг, 23.10.2014, 19:45
  Каталог статей | RSS

 
 
Главная » Статьи » Методы математической статистики

Коэффициент корреляции
Автор статьи: Попов Олег Александрович.
При копировании или цитировании ссылка на сайт и автора обязательна!


Коэффициент корреляции является одним из самых востребованых методов математической статистики в психологических и педагогических исследованиях. Формально простой, этот метод позволяет получить массу информации и сделать такое же количество ошибок. В этой статье мы рассмотрим сущность коэффициента корреляции, его свойства и виды.

Слово correlation (корреляция) состоит из приставки «co-», которая обозначает совместность происходящего (по аналогии с «координация») и корня «relation» , переводится как «отношение» или «связь» (вспомним public relations – связи с общественностью). Дословно correlation переводится как взаимосвязь.

Коэффициент корреляции — это мера взаимосвязи измеренных явлений.

Коэффициент корреляции (обозначается «r») рассчитывается по специальной формуле и изменяется от -1 до +1. Показатели близкие к +1 говорят о том, что при увеличении значения одной переменной увеличивается значение другой переменной. Показатели близкие к -1 свидетельствуют об обратной связи, т.е. При увеличении значений одной переменной, значения другой уменьшаются.

Пример. На большой выборке был проведён тест FPI. Проанализируем взаимосвязи шкал Общительность, Застенчивость, Депрессивность.

Начнем с Застенчивости и Депрессивности. Для наглядности, задаём систему координат, на которой по X будет застенчивость, а по Y депрессивность. Таким образом, каждый человек из выборки исследования может быть изображен точкой на этой системе координат. В результате расчетов, коэффициент корреляции между ними r=0,6992.


Как видим, точки (испытуемые) расположены не хаотично, а выстраиваются вокруг одной линии, причём, глядя на эту линию можно сказать, что чем выше у человека выражена застенчивость, тем больше депрессивность, т. е. эти явления взаимосвязаны.

Построим аналогичный график для Застенчивости и Общительности.

 Мы видим, что с увеличением застенчивости общительность уменьшается. Их коэффициент корреляции -0,43.

Таким образом, коэффициент корреляции больший от 0 до 1 говорит о прямопропорциональной связи (чем больше… тем больше…), а коэффициент от -1 до 0 о обратнопропорциональной (чем больше… тем меньше…)

Если бы точки были расположены хаотично, коэффициент корреляции приближался бы к 0.

 Коэффициент корреляции отражает степень приближенности точек на графике к прямой.

Приведём примеры графиков, отражающих различную степень взаимосвязи (корреляции) переменных исследования.

Сильная положительная корреляция:

Слабая положительная корреляция:

Нулевая корреляция:

В подписи у каждого графика кроме значения r есть значение p. p – это вероятность ошибки, о которой будет рассказано отдельно.

 

Виды взаимосвязи

1.                  Прямая положительная и отрицательная взаимосвязь. Два явления непосредственно совпадают, поэтому взаимосвязаны. Интеллект и успеваемость в школе, общительность и застенчивость — яркие примеры прямой взаимосвязи.

2.                  Косвеная взаимосвязь. Два явления сильно коррелируют с  третьим, поэтому между собой так же имеют корреляцию. К примеру, стиль общения ребенка взаимосвязан со стилем воспитания в семье за счет третьей переменной — установок личности. Очевидно, что воспитание в семье формирует установки ребенка, в свою очередь установки влияют на поведение.

3.                  Нулевая корреляция. Предполагает отсутствие закономерной взаимосвязи между переменными.

4.                  Случайная взаимосвязь. Корреляция может быть случайной! Очень многие процессы происходят одновременно и совпадают. Здесь уместно сказать, что если много-много коррелировать — что нибудь обязательно скоррелируется.

 

Важно. Взаимосвязь должна интерпретироваться в оба направления. Формально, корреляция не обозначает причинно-следственной связи! Это ВЗАИМОсвязь, ВЗАИМОсовпадение, явлений. Возвращаясь к примеру: застенчивость взаимосвязана с депрессивностью. Логично подумать, что депрессивный человек более застенчив, чем не депрессивный, но почему не наоборот? С чего начинать рассуждение? Мы интерпретируем корреляцию в оба направления и не констатируем причинно-следственную связь. Пишем «кореляция», «взаимосвязь», подразумеваем – совпадение. Причем сильная корреляция обозначает неслучайное совпадение.

Есть случаи, когда корреляция может говорить о причинно следственной связи. Это случаи, когда одна из переменых общективна, а вторая субъективна. К объективным переменным относятся возраст, стаж, рост, которые просто не могут зависеть от субъективных переменных: настроения, особенностей личности, мотивации и т.д. Однако, такие объективные переменные, как вес, количество детей в семье, частота смены места работы, количество контактов и т.п. могут и часто зависят от субъективных психологических показателей.

К примеру, профессионализм рабочего повышается со стажем. Стаж и профессионализм коррелируют и мы можем быть уверены, что для повышения профессионализма стаж является объективной причиной. Объективные переменные, основанные на времени всегда являются причиной при наличии корреляции с субъективными характеристиками. В остальных случаях нужно очень осторожно относиться к причинно-следственным интерпретациям коэффициента корреляции.

Если причинно-следственная связь обоснована в теоретической части работы и подтверждается многими авторами, то корреляцию так же можно интерпретировать как причинно-следственную связь.

Существуют различные формулы расчета коэффициента корреляции для различных типов шкал (см. статью «Понятие переменной и шкалы измерения»). Результатом расчета по любой формуле будет число от -1 до +1.

В следующей таблице написаны названия коэффициентов корреляции для различных типов шкал.

 

Дихотомическая шкала (1/0)

Ранговая (порядковая) шкала

Интервальная и абсолютная шкала

Дихотомическая шкала (1/0)

Коэфициент ассоциации Пирсона, коэффициент четырехклеточной сопряженности Пирсона.

Рангово-бисериальная корреляция.


Бисериальная корреляция

Ранговая (порядковая) шкала

Рангово-бисериальная корреляция.


Ранговый коэффициент корреляции Спирмена или Кендалла.

Значения интервальной шкалы переводятся в ранги и используется ранговый коэффициент

Интервальная и абсолютная шкала

Бисериальная корреляция

Значения интервальной шкалы переводятся в ранги и используется ранговый коэффициент

Коэффициент корреляции Пирсона

(коэффициент линейной корреляции)

 Основные принципы интерпретации различных коэффициентов корреляции одинаковы. В случае дихотомической шкалы мы говорим о вероятности совпадения (прямого или обратного) ответов типа да/нет, в случае рангов о вероятности совпадения порядка, в случае коэффициента линейной корреляции мы говорим о степени совместного изменения переменных или о их взаимосвязи.

Полученный коэффициент нужно проверить на значимость, которая зависит от вероятности ошибки и количества человек. Коэффициент корреляции может быть формально небольшим, к примеру r=0,17, но  если исследование проведено на 500 человек и вероятность ошибки (р) менее 0,05, то мы признаём значимым даже такой небольшой коэффициент. С другой стороны, при выборке в 5 человек очень большой коэффициент мы признаем незначимым, т.к. из-за малого количества человек мы можем совершить ошибочный вывод об этой корреляции.

Таким образом, для нас главное узнать какой должна быть вероятность ошибки и количество человек, чтобы признать полученный коэффициент действительно значимым.

Расчет значения  р (вероятности ошибки) – сложная процедура, поэтому компьютерные программы, в которых можно считать коэффициент корреляции, расчитывают вероятность ошибки самостоятельно. Если же расчет производился вручную или по другим причинам конкретное значение р неизвестно, то используем уже рассчитанные таблицы критических значений.

Таблицы критических значений предназначены чтобы можно было найти критическое значение коэффициента корреляции, т.е. такое, после которого взаимосвязь можно считать значимой и неслучайной. При этом значение вероятности ошибки задаётся исследователем. В таблицах обычно есть критические значения коэффициентов корреляции для р0,001, р0,01, р0,05, иногда пишут соответственно 0,1%, 1%, 5%. Таким образом, пользуясь таблицами мы отвечаем на вопрос: какое критическое значение коэффициента корреляции при данном количестве людей и вероятности ошибки менее или равно 0,1% (1%, 5%)?

Обычно в психологических исследованиях вероятность ошибки выбирают на уровне p0,05, но если в исследовании принимают участие более 100 человек, то можно выбирать и р0,01. В первой колонке таблицы критических значений находится значение  df (Degrees of Freedom степени свободы), которое расчитывается очень просто: df = n-1, где n – количество человек. На пересечении нужного df и выбранной вероятности ошибок находим критический коэффициент корреляции. Если рассчитанное значение больше критического — коэффициент значимый, в обратном случае взаимосвязь является случайной.

В примерах, приведённых выше для количества человек n=89 и p0,05 критический коэффициент корреляции r=0,20. А вот если бы количество человек было 45 (при том же p0,05) то критическим значением было бы r=0,29, при количестве человек 10 критическое значение r=0,63.

 

 Вывод

Коэффициент корреляции — это мера взаимосвязи измеренных явлений. На самом примитивном уровне его можно рассматривать как меру совпадения двух рядов чисел. Любой коэффициент корреляции изменяется в пределах от -1 до +1. Отрицательные значения говорят про обратнопропорциональную взаимосвязь, положительные о прямопропорциональной. Полученный коэффициент необходимо сравнивать с критическим табличным.


Дополнительные материалы.

Таблицы критических значений для коэффициента корреляции и других показателей.

Подробно о коэффициенте корреляции Пирсона.


Вам нужны расчеты с аналитическими выводами? Обращайтесь!



Категория: Методы математической статистики | Добавил: psystat (18.01.2009) | Автор: Попов Олег Александрович
Просмотров: 101456 | Рейтинг: 4.7/25 |
 
 
Категории каталога
Методы математической статистики [17]
Доступно о статистических расчетах от азов до сложных методов. Материалы ориентированы на читателей с гуманитарным образованием.
Психодиагностика [13]
Описание тестов, их нормы, особенности применения, описание надежности и валидности. Идеи о том, как измерять психологические явления и создавать новые тесты.
Методология [6]
Статьи про основные принципы проведения исследований, методологию психологии и педагогики.
Исследования, теории, советы [3]

Наш опрос
Что Вас интересует?
Всего ответов: 1454

Поиск

Друзья сайта

Статистика
РЕЙТИНГ ПСИХОЛОГИЧЕСКИХ САЙТОВ У ПСИХОЛОГА Украина-Сегодня: Каталог сайтов Каталог MyList.com.ua Союз образовательных сайтов Психология 100 Психология 100
 

Copyright Попов О.А. © 2014
Создать сайт бесплатно