Logo GenDocs.ru

Поиск по сайту:  

Загрузка...

Лекции - курс: Математические методы в психологии. Часть 2 - файл 1.doc


Лекции - курс: Математические методы в психологии. Часть 2
скачать (2763 kb.)

Доступные файлы (1):

1.doc2763kb.16.11.2011 05:07скачать

содержание
Загрузка...

1.doc

1   2   3   4   5
Реклама MarketGid:
Загрузка...

Определяем величины (р и подсчитываем значение φ*:

φ*1(27,8%)=1,111

φ*2(8,3%)=0,584





φ*эмп >φ*кр (p≤0.05)

Ответ: H0 отвергается. Самые низкие показатели недостаточно­сти (нулевые) в группе с большей энергией вытеснения встречаются чаще, чем в группе с меньшей энергией вытеснения (р<0,05).


В сумме полученные результаты могут рассматриваться как сви­детельство частичного совпадения понятий комплекса у З.Фрейда и А.Адлера.


Существенно при этом, что между показателем энергии вытесне­ния и показателем интенсивности ощущения собственной недостаточно­сти в целом по выборке получена положительная линейная корреляци­онная связь (г=+0,491, р<0,01). Как мы можем убедиться, применение критерия φ* позволяет проникнуть в более тонкие и содержательно значимые соотношения между этими двумя показателями.


^ Пример 4 - использование критерия φ* в сочетании с критерием λ Колмогорова-Смирнова в целях достижения макси­мально точного результата


Если выборки сопоставляются по каким-либо количественно изме­ренным показателям, встает проблема выявления той точки распределе­ния, которая может использоваться как критическая при разделении всех испытуемых на тех, у кого "есть эффект" и тех, у кого "нет эффекта".


В принципе точку, по которой мы разделили бы группу на под­группы, где есть эффект и нет эффекта, можно выбрать достаточно произвольно. Нас может интересовать любой эффект и, следовательно, мы можем разделить обе выборки на две части в любой точке, лишь бы это имело какой-то смысл.


Для того, чтобы максимально повысить мощность критерия φ*, нужно, однако, выбрать точку, в которой различия между двумя сопос­тавляемыми группами являются наибольшими. Точнее всего мы сможем сделать это с помощью алгоритма расчета критерия λ, позволяющего, обнаружить точку максимального расхождения между двумя выборками.;


Возможность сочетания критериев φ* и λ описана Е.В. Гублером-(1978, с. 85-88). Попробуем использовать этот способ в решении сле­дующей задачи.


В совместном исследовании М.А. Курочкина, Е.В. Сидоренко и Ю.А. Чуракова (1992) в Великобритании проводился опрос англий­ских общепрактикующих врачей двух категорий: а) врачи, поддержав­шие медицинскую реформу и уже превратившие свои приемные в фондодержащие организации с собственным бюджетом; б) врачи, чьи при­емные по-прежнему не имеют собственных фондов и целиком обеспечи­ваются государственным бюджетом. Опросники были разосланы вы­борке из 200 врачей, репрезентативной по отношению к генеральной совокупности английских врачей по представленности лиц разного пола, возраста, стажа и места работы - в крупных городах или в провинции.


Ответы на опросник прислали 78 врачей, из них 50 работающих в приемных с фондами и 28 - из приемных без фондов. Каждый из врачей должен был прогнозировать, какова будет доля приемных с фондами в следующем, 1993 году. На данный вопрос ответили только 70 врачей из 78, приславших ответы. Распределение их прогнозов представлено в Табл. 5.8 отдельно для группы врачей с фондами и группы врачей без фондов.


Различаются ли каким-то образом прогнозы врачей с фондами и врачей без фондов?

Таблица 5.8

Распределение прогнозов общепрактикующих врачей о том, какова будет доля приемных с фондами в 1993 году

№№

Прогнозируемая доля приёмных с фондами

Эмпирические частоты выбора данной категории прогноза

Врачами с фондом (n=45)

Врачами без фонда (n=25)

Суммы

1

От 0 до 20%

4

5

9

2

От 21 до 40%

15

11

26

3

От 41 до 60%

18

5

23

4

От 61 до 80%

7

4

11

5

От 81 до 100%

1

0

1




Суммы

45

25

70


Определим точку максимального расхождения между двумя рас­пределениями ответов по Алгоритму 15 из п. 4.3 (см. Табл, 5.9).

Таблица 5.9

Расчет максимальной разности накопленных частостей в распределениях прогнозов врачей двух групп



№№

Прогнозируемая доля приемных с фондом (%)

Эмпирические частоты выбора данной категории ответа

Эмпирические частости

Накопленные эмпирические частости

Разно-сть

(d)

Врача-ми с фондом

(n1=45)

Врачами без фонда

(n2=25)

ƒ*э1

ƒ*э2

ƒ*э1

ƒ*э2

1

От 0 до 20%

4

5

0,089

0,200

0,089

0,200

0,111

2

От 21 до 40%

15

11

0,333

0,440

0,422

0,640

0,218

3

От 41 до 60%

18

5

0,400

0,200

0,822

0,840

0,018

4

От 61 до 80%

7

4

0,156

0,160

0,978

1,000

0,022

5

От 81 до 100%

1

0

0,022

0

1,000

1,000

0


Максимальная выявленная между двумя накопленными эмпириче­скими частостями разность составляет 0,218.


Эта разность оказывается накопленной во второй категории про­гноза. Попробуем использовать верхнюю границу данной категории в качестве критерия для разделения обеих выборок на подгруппу, где "есть эффект" и подгруппу, где "нет эффекта". Будем считать, что "эффект есть", если данный врач прогнозирует от 41 до 100% прием­ных с фондами в 1993 году, и что "эффекта нет", если данный врач прогнозирует от 0 до 40% приемных с фондами в 1993 году. Мы объ­единяем категории прогноза 1 и 2, с одной стороны, и категории про­гноза 3, 4 и 5, с другой. Полученное распределение прогнозов пред­ставлено в Табл. 5.10.


Таблица 5.10

Распределение прогнозов у врачей с фондами и врачей без фондов





№№

Прогнозируемая доля приёмных с фондами (%)

Эмпирические частоты выбора данной категории прогноза



Суммы

Врачами с фондом (n1=45)

Врачами без фонда

(n2=25)




1

От 0 до 40%

19

16

35

2

От 41 до 100%

26

9

35




Суммы

45

25

70



Полученную таблицу (Табл. 5.10) мы можем использовать, про­веряя разные гипотезы путем сопоставления любых двух ее ячеек. Мы помним, что это так называемая четырехклеточная, или четырехпольная, таблица.


В данном случае нас интересует, действительно ли врачи, уже располагающие фондами, прогнозируют больший размах этого движения в будущем, чем врачи, не располагающие фондами. Поэтому мы услов­но считаем, что "эффект есть", когда прогноз попадает в категорию от 41 до 100%. Для упрощения расчетов нам необходимо теперь повер­нуть таблицу на 90°, вращая ее по направлению часовой стрелки. Можно сделать это даже буквально, повернув книгу вместе с таблицей. Теперь мы можем перейти к рабочей таблице для расчета крите­рия φ* - углового преобразования Фишера.

Таблица 5.11

Четырехклеточная таблица для подсчета критерия ф* Фишера для вы­явления различий в прогнозах двух групп общепрактикующих врачей




№№



Группа

«Есть эффект» - прогноз от 41 до 100%

«Нет эффекта» - прогноз от 0 до 40%



Всего

1

1 группа – врачи, взявшие фонд

26 (57,8%)

19 (42,2%)

45

2

2 группа – врач, не взявшие фонд

9 (36,0%)

16 (64,0%)

25




Всего

35

35

70


^ Сформулируем гипотезы.

H0: Доля лиц, прогнозирующих распространение фондов на 41%-100% всех врачебных приемных, в группе врачей с фондами не больше, чем в группе врачей без фондов.


H1: Доля лиц, прогнозирующих распространение фондов на 41%-100% всех приемных, в группе врачей с фондами больше, чем в группе врачей без фондов.


Определяем величины φ1 и φ2 по Таблице XII приложения 1, Напомним, что φ1 - это всегда угол, соответствующий большей про­центной доле.

φ1(57,2%)=1.727

φ2(36.0%)=1.287


Теперь определим эмпирическое значение критерия φ*:




По Табл. ХШ Приложения 1 определяем, какому уровню значи­мости соответствует эта величина: р=0,039.


По той же таблице Приложения 1 можно определить критические значения критерия φ*:





Для наглядности можем построить "ось значимости":




Ответ: H0 отвергается (р=0,039). Доля лиц, прогнозирующих распространение фондов на 41-100% всех приемных, в группе врачей, взявших фонд, превышает эту долю в группе врачей, не взявших фонда.


Иными словами, врачи, уже работающие в своих приемных на отдельном бюджете, прогнозируют более широкое распространение этой практики в текущем году, чем врачи, пока еще не согласившиеся перей­ти на самостоятельный бюджет.

Интерпретации этого результата мно­гозначны. Например, можно предположить, что врачи каждой из групп подсознательно считают свое поведение более типичным. Это может означать также, что врачи, уже перешедшие на самостоятельный бюд­жет, склонны преувеличивать размах этого движения, так как им нужно оправдать свое решение. Выявленные различия могут означать и нечто такое, что вовсе выходит за рамки поставленных в исследовании вопро­сов.

Например, что активность врачей, работающих на самостоятельном бюджете, способствует заострению различий в позициях обеих групп. Они проявили большую активность, когда согласились взять фонды, они проявили большую активность, когда взяли на себя труд ответить на почтовый опросник; они проявляют большую активность, когда прогнозируют большую активность других врачей в получении фондов.


Так или иначе, мы можем быть уверены, что выявленный уро­вень статистических различий - максимально возможный для этих ре­альных данных. Мы установили с помощью критерия точку макси­мального расхождения между двумя распределениями и именно в этой точке разделили выборки на две части.

АЛГОРИТМ 17


Расчет критерия φ*

  1. Определить те значения признака, которые будут критерием для разделения испытуемых на тех, у кого "есть эффект" и тех, у кого "нет эффекта". Если признак измерен количественно, использовать критерий λ для поиска опти­мальной точки разделения.




  1. Начертить четырехклеточную таблицу из двух столбцов и двух строк. Пер­вый столбец - "есть эффект"; второй столбец - "нет эффекта"; первая стро­ка сверху - 1 группа (выборка); вторая строка - 2 группа (выборка).




  1. Подсчитать количество испытуемых в первой группе, у которых "есть эф­фект», и занести это число в левую верхнюю ячейку таблицы.




  1. Подсчитать количество испытуемых в первой выборке, у которых "нет эф­фекта", и занести это число в правую верхнюю ячейку таблицы. Подсчитать сумму по двум верхним ячейкам. Она должна совпадать с количеством ис­пытуемых в первой группе.




  1. Подсчитать количество испытуемых во второй группе, у которых "есть эф­фект", и занести это число в левую нижнюю ячейку таблицы.




  1. Подсчитать количество испытуемых во второй выборке, у которых "нет эф­фекта", и занести это число в правую нижнюю ячейку таблицы. Подсчитать сумму по двум нижним ячейкам. Она должна совпадать с количеством ис­пытуемых во второй группе (выборке).




  1. Определить процентные доли испытуемых, у которых "есть эффект", путем отнесения их количества к общему количеству испытуемых в данной группе (выборке). Записать полученные процентные доли соответственно в левой верхней и левой нижней ячейках таблицы в скобках, чтобы не перепутать их
    с абсолютными значениями.




  1. Проверить, не равняется ли одна из сопоставляемых процентных долей ну­лю. Если это так, попробовать изменить это, сдвинув точку разделения групп в ту или иную сторону. Если это невозможно или нежелательно, от­казаться от критерия φ* и использовать критерий χ2.




  1. Определить по Табл. XII Приложения 1 величины углов φ для каждой из сопоставляемых процентных долей.


10. Подсчитать эмпирическое значение φ* по формуле:




где: φ1 - угол, соответствующий большей процентной доле;

φ2 - угол, соответствующий меньшей процентной доле;

n1 - количество наблюдений в выборке 1;

n2 - количество наблюдений в выборке 2.


  1. Сопоставить полученное значение φ* с критическими значениями: φ*<1,64 (р≤0,05) и φ*≤2,31 (р<0,01).

Если φ*эмп > φ*кр., Но отвергается.


При необходимости определить точный уровень значимости полученного φ*эмп по Табл. XIII Приложения 1.


Вопрос 3


Биномиальный критерий m


^ Назначение критерия m


Критерий предназначен для сопоставления частоты встречаемости какого-либо эффекта с теоретической или заданной частотой его встре­чаемости.


Он применяется в тех случаях, когда обследована лишь одна вы­борка объемом не более 300 наблюдений, в некоторых задачах - не больше 50 наблюдений.

^ Описание критерия

Биномиальный критерий m позволяет оценить, насколько эмпи­рическая частота интересующего нас эффекта превышает теоретиче­скую, среднестатистическую или какую-то заданную частоту, соответ­ствующую вероятности случайного угадывания, среднему проценту успешности в выполнении данного задания, допустимому проценту брака и т.п.


Биномиальный критерий незаменим, если налицо 2 условия:

а) обследована лишь одна выборка испытуемых, и нет возможности или смысла делить эту выборку на две части с целью дальнейшего применения критерия φ*, так как для нас по каким-то причинам важно исследовать частоту встречаемости признака в выборке в це­лом;


б)в обследованной выборке менее 30 испытуемых, что не позволяет нам применить критерий χ2.


Если в нашей выборке больше 30 испытуемых, мы все же можем использовать критерий m и тем самым сэкономить время на подсчете χ2.


Эмпирическая частота наблюдений, в которых проявляется инте­ресующий нас эффект, обозначается как т. Это и есть эмпирическое значение критерия m.


Если mэмп равен или превышает mкр. то различия достоверны.


Гипотезы

H0: Частота встречаемости данного эффекта в обследованной выборке не превышает теоретической (заданной, ожидаемой, предполагаемой).


Н1: Частота встречаемости данного эффекта в обследованной выборке превышает теоретическую (заданную, ожидаемую, предполагаемую).


^ Графическое представление биномиального критерия

Критерии определяет, достаточно ли эмпирическая частота встре­чаемости признака превышает заданную, "перевешивает" ее. Можно представить себе это как взвешивание эмпирической и теоретической частот на чашечных весах (Рис. 5.4). Весы реагируют только на такие различия s весе, которые соответствуют по крайней мере минимальному уровню значимости р≤0,05.




Рис. 5.4. Сравнение эмпирической и теоретической частот как взвешивание на чашеч­ных весах: а) эмпирическая частота не перевешивает теоретической, весы неподвижны; 6) эмпирическая частота "перевешивает* теоретическую, левая чаша весов опускается.

^ Ограничения биномиального критерия


  1. В выборке должно быть не менее 5 наблюдений. В принципе воз­можно применение критерия и при 2≤n<5, но лишь в отношении определенного типа задач (см. Табл. XV Приложения 1).




  1. Верхний предел численности выборки зависит от ограничении, опре­деляемых пп.3-8 и варьирует в диапазоне от 50 до 300 наблюдений, что определяется имеющимися таблицами критических значений.




  1. Биномиальный критерий m позволяет проверить лишь гипотезу о том, что частота встречаемости интересующего нас эффекта в обсле­дованной выборке превышает заданную вероятность Р. Заданная вероятность при этом должна быть: Р≤0,50.




  1. Если мы хотим проверить гипотезу о том, что частота встречаемости интересующего нас эффекта достоверно ниже заданной вероятности, то при Р=0,50 мы можем сделать это с помощью уже известного критерия знаков G, при Р>0,50 мы должны преобразовать гипоте­зы в противоположные, а при Р<0,50 придется использовать крите­рий χ2.


По Табл. 5.12 легко определить, какой из путей для нас доступен.


Таблица 5.12

Выбор критерия для сопоставлений эмпирической частоты с

теоретической при разных вероятностях исследуемого эффекта Р

и разных гипотезах.

Заданные вероятности

Н1: ƒэмп достоверно выше ƒтеор

Н1: ƒэмп достоверно ниже ƒтеор

P<0.50

А m для 2≤n≤50

Б χ2 для n≥50

P=0.50

Б m для 5≤n≤300

Г G для 5≤n≤300

P<0.50

Д χ2 для n≥50

Е m для 2≤n≤50


Пояснения к Табл. 5.12

A) Если заданная вероятность Р<0,50, а ƒэмптеор (например, допус­тимый уровень брака - 15%, а в обследованной выборке получено значение в 25%), то биномиальный критерий применим для объема выборки 2≤n≤50.


Б) Если заданная вероятность Р<0,50, а ƒэмптеор (например, допус­тимый уровень брака - 15%, а в обследованной выборке наблюдает­ся 5% брака), то биномиальный критерий неприменим и следует применять критерий χ2 (см. Пример 2).


B) Если заданная вероятность Р=0,50, а ƒэмптеор (например, вероят­ность выбора каждой из равновероятных альтернатив Р=0,50, а в обследованной выборке одна из альтернатив выбирается чаще, чем в половине случаев), то биномиальный критерий применим для объема выборки 5≤n≤300.


Г) Если заданная вероятность Р=0,50, а ƒэмптеор (например, вероят­ность выбора каждой из равновероятных альтернатив Р=0,50, а в обследованной выборке одна из альтернатив наблюдается реже, чем в половине случаев), то вместо биномиального критерия применяется критерий знаков G, являющийся "зеркальным отражением" биноми­ального критерия при Р=0,50. Допустимый объем выборки: 5≤n≤300.


Д) Если заданная вероятность Р>0,50, а ƒэмптеор (например, средне­статистический процент решения задачи - 80/о, а в обследованной выборке он составляет 95%), то биномиальный критерий неприме­ним и следует применять критерий χ2 (см. Пример 3).


Е) Если заданная вероятность Р>0,50, а ƒэмптеор (например, средне­статистический процент решения задачи – 80%, а в обследованной выборке он составляет 60%), то биномиальный критерий применим при условии, что в качестве "эффекта" мы будем рассматривать более редкое событие - неудачу в решении задачи, вероятность которого Q=l—Р=1—0,80=0,20 и процент встречаемости в данной выборке: 100%—75%=25%. Эти преобразования фактически сведут данную задачу к задаче, предусмотренной п. А. Допустимый объем выбор­ки: 5≤n≤300 (см. пример 3).


Пример 1


В процессе тренинга сенситивности в группе из 14 человек вы­полнялось упражнение "Психологический прогноз". Все участники должны были пристально вглядеться в одного и того же человека, ко­торый сам пожелал быть испытуемым в этом упражнении. Затем каж­дый из участников задавал испытуемому вопрос, предполагавший два заданных варианта ответа, например: "Что в тебе преобладает: отстра­ненная наблюдательность или включенная эмпатия?" "Продолжал бы ты работать или нет, если бы у тебя появилась материальная возмож­ность не работать?" "Кто тебя больше утомляет - люди нахальные или занудные?" и т. п. Испытуемый должен был лишь молча выслушать вопрос, ничего не отвечая. Во время этой паузы участники пытались определить, как он ответит на данный вопрос, и записывали свои про­гнозы. Затем ведущий предлагал испытуемому дать ответ на заданный вопрос. Теперь каждый участник мог определить, совпал ли его про­гноз с ответом испытуемого или нет. После того, как было задано 14 вопросов (13 участников + ведущий), каждый сообщил, сколько у него получилось точных прогнозов. В среднем было по 7-8 совпадений, но у одного из участников их было 12, и группа ему спонтанно зааплодиро­вала. У другого участника, однако, оказалось всего 4 совпадения, и он был очень этим огорчен.

Имела ли группа статистические основания для аплодисментов? Имел ли огорченный участник статистические основания для грусти?

^ Начнем с первого вопроса.

По-видимому, группа будет иметь статистические основания для аплодисментов, если частота правильных прогнозов у участника А пре­высит теоретическую частоту случайных угадываний. Если бы участник прогнозировал ответ испытуемого случайным образом, то, в соответст­вии с теорией вероятностей, шансы случайно угадать или не угадать ответ на данный вопрос у него были бы равны P=Q=0,5. Определим теоретическую частоту правильных случайных угадывании:

где n - количество прогнозов;

Р - вероятность правильного прогноза при случайном угадывании.

ƒтеор =14*0,5=7


Итак, нам нужно определить, "перевешивают" ли 12 реально данных правильных прогнозов 7 правильных прогнозов, которые могли бы быть у данного участника, если бы он прогнозировал ответ испы­туемого случайным образом.


Требования, предусмотренные ограничением 3, соблюдены: Р=0.50; ƒэмптеор. Данный случай относится к варианту "В" Табл. 5.12.


Мы можем сформулировать гипотезы.


H0: Количество точных прогнозов у участника А не превышает часто­ты, соответствующей вероятности случайного угадывания.


Н1: Количество точных прогнозов у участника А превышает частоту, соответствующую вероятности случайного угадывания.


По Табл. XIV Приложения 1 определяем критические значения критерия m при n=14, Р=0,50:




Мы помним, что за эмпирическое значение критерия m принима­ется эмпирическая частота:

mэмпэмп =12

mэмп≥ mкр (р≤0,01)

Построим "ось значимости".




Зона значимости простирается вправо, в область более высоких значений m (более "весомых", если использовать аналогию с весами), а зона незначимости - в область более низких, "невесомых", значений т.


Ответ: H0 отвергается. Принимается H1. Количество точных прогнозов у участника А превышает (или по крайней мере равняется) критической частоте вероятности случайного угадывания (р≤0,01). Группа вполне обоснованно ему аплодировала!

Теперь попробуем ответить на второй вопрос задачи.

По-видимому, основания для грусти могут появиться, если коли­чество правильных прогнозов оказывается достоверно ниже теоретиче­ской частоты случайных угадываний. Мы должны определить, 4 точных прогноза участника Б - это достоверно меньше, чем 7 теоретически возможных правильных прогнозов при случайном угадывании или нет?


В данном случае Р=0,50; ƒэмптеор. В соответствии с ограничени­ем 4, в данном случае мы должны применить критерий знаков, кото­рый по существу является зеркальным отражением или "второй сторо­ной" одностороннего биномиального критерия (вариант "Г" Табл. 5.12).


Вначале нам нужно определить, что является типичным событием для участника Б. Это неправильные прогнозы, их 10. Теперь мы опре­деляем, достаточно ли мало у него нетипичных правильных прогнозов, чтобы считать перевешивание неправильных прогнозов достоверным.


^ Сформулируем гипотезы.

H0: Преобладание неправильных прогнозов у участника Б является случайным.


Н1: Преобладание неправильных прогнозов у участника Б не является случайным.


По Табл. V Приложения 1 определяем критические значения критерия знаков G для n=14:




Построим "ось значимости". Мы помним, что в критерии знаков зона значимости находится слева, а зона незначимости - справа, так как чем меньше нетипичных событий, тем типичные события являются бо­лее достоверно преобладающими.





Эмпирическое значение критерия G определяется как количество нетипичных событий. В данном случае:

GЭМП=4

GЭМП > GТЕОР


Эмпирическое значение критерия G попадает в зону незначимости.


Ответ: H0 принимается. Преобладание неправильных прогнозов у участника Б является случайным.

Участник Б не имел достаточных статистических оснований для огорчения. Дело, однако, в том, что психологическая "весомость" отклонения его оценки значительно перевешивает статистическую. Вся­кий практикующий психолог согласится, что повод для огорчения у уча­стника Б все же был.


Важная особенность биномиального критерия и критерия знаков состоит в том, что они превращают уникальность, единственность и жизненную резкость произошедшего события в нечто неотличимое от безликой и всепоглощающей случайности. Учитывая это, лучше исполь­зовать биномиальный критерий для решения более отвлеченных, форма­лизованных задач, например, для уравновешивания выборок по призна­ку пола, возраста, профессиональной принадлежности и т. п.


При оценке же личностно значимых событий оказывается, что статистическая сторона дела не совпадает с психологической больше, чем при использовании любого из других критериев.


Пример 2


В тренинге профессиональных наблюдателей допускается, чтобы наблюдатель ошибался в оценке возраста ребенка не более чем на 1 год в ту или иную сторону. Наблюдатель допускается к работе, если он совершает не более 15% ошибок, превышающих отклонение на 1 год. Наблюдатель Н допустил 1 ошибку в 50-ти попытках, а наблюдатель К - 15 ошибок в 50-ти попытках. Достоверно ли отличаются эти ре­зультаты от контрольной величины?


Определим частоту допустимых ошибок при n = 50:

ƒтеор =n*P=50*0.15=7.5


Для наблюдателя Н ƒэмптеор, для наблюдателя К ƒэмп теор.


^ Сформулируем гипотезы для наблюдателя Н.

H0: Количество ошибок у наблюдателя Н не меньше, чем это преду­смотрено заданной величиной.

H1: Количество ошибок у наблюдателя Н меньше, чем это предусмот­рено заданной величиной.


В данном случае Р=0,15<0,50; ƒэмптеор.


Этот случай попадает под вариант Б Табл. 5. 12. Нам придется применить критерий χ2, сопоставляя полученные эмпирические частоты ошибочных и правильных ответов с теоретическими частотами, состав­ляющими, соответственно, 7,5 для ошибочного ответа и (50-7,5)=42,5 для правильного ответа. Подсчитаем χ2 по формуле, включающей по­правку на непрерывность4:


4.Поправка на непрерывность вносится во всех случаях, когда признак принимает всего два значения и число степеней свободы поэтому равно 1 (см. параграф 4.2)





По Табл. IX Приложения 1 определяем критические значения χ2 при V=1:





χ2эмп> χ2кр (р≤0,05)


Ответ: Н0 отвергается. Количество ошибок у наблюдателя Н меньше, чем это предусмотрено заданной величиной (р≤0,05).

^ Сформулируем гипотезы для наблюдателя К.

H0: Количество ошибок у наблюдателя К не больше, чем это преду­смотрено заданной величиной.


Н1: Количество ошибок у наблюдателя К больше, чем это предусмот­рено заданной величиной.


В данном случае Р=0,15<0,5; ƒэмптеор. Этот случай подпадает под вариант А Табл. 5.12. Мы можем применить биномиальный крите­рий, поскольку n=50.

По Табл. XV Приложения 1 определяем критические значения при n=50, P=15, Q=0,85:




mэмп =fэмп =15

mэмп >mкр (р≤0,05)


Ответ: H0 отвергается. Количество ошибок у наблюдателя К больше, чем это предусмотрено заданной величиной (р<0,05).

Пример 3


В примере 1 параграфа 5.2 мы сравнивали процент справившихся с экспериментальной задачей испытуемых в двух группах. Теперь мы можем сопоставить процент успешности каждой группы со среднестати­стическим процентом успешности. Данные представлены в Табл. 5.13.

Таблица 5.13.





Количество испытуемых, решивших задачу

Количество испытуемых, не решивших задачу

Суммы

1 группа (n1=20)

12 (60%)

8 (40%)

20

1 группа (n2=25)

10 (40%)

15 (60%)

25

Суммы

22

23

45


Среднестатистический показатель успешности в решении этой за­дачи - 55%. Определим теоретическую частоту правильных ответов для групп 1 и 2:

ƒтеор 1 = n1*P=20*0.55=11.00

ƒтеор 2 = n2*P=25*0.55=13.75


Для группы 1, следовательно, Р=0,55>0,50; ƒэмп=12>ƒтеор Этот случай соответствует варианту "Д" Табл. 5.12. Мы должны были бы применить критерий χ2, но у нас всего 20 наблюдений: n<30. Ни би­номиальный критерий, ни критерий χ2 неприменимы. Остается крите­рий ф* Фишера, который мы сможем применить, если узнаем, сколько испытуемых было в выборке, по которой определялся среднестатистиче­ский процент.


Далее, для группы 2: Р=0,55>0,50; ƒэмп=10<ƒтеор. Этот случай соответствует варианту "Е" Табл. 5.12. Мы можем применить биноми­альный критерий, если будем считать "эффектом" неудачу в решении задачи. Вероятность неудачи Q=l—Р=1—0,55=0,45. Новая эмпириче­ская частота составит: ƒэмп =25-10=15.


Сформулируем гипотезы.

H0. Процент неудач в обследованной выборке не превышает заданного процента неудач.

H1: Процент неудач в обследованной выборке превышает заданный процент неудач.


По Табл. XV Приложения 1 определяем критические значения для n=25, P=0,45, Q=0.55 (мы помним, что Р и Q поменялись местами):





mэмп =fэмп =15

mэмп <mкр


Ответ: H0 принимается. Процент неудач в обследованной вы­борке не превышает заданного процента неудач.


Сформулируем общий алгоритм применения критерия m.


АЛГОРИТМ 18

Применение биномиального критерия m

1. Определить теоретическую частоту встречаемости эффекта по фор­муле:

ƒтеор =n*Р,


где n - количество наблюдений в обследованной выборке;

Р - заданная вероятность исследуемого эффекта.

По соотношению эмпирической и теоретической частот и заданной вероятности Р определить, к какой ячейке Табл. 5,12 относится данный случай сопоставлений.

Если биномиальный критерий оказывается неприменимым, исполь­зовать тот критерий, который указан в соответствующей ячейке Табл. 5.12

  1. Если критерий m применим, то определить критические значения m по Табл. XVI (при Р=0,50) или по табл. XV (при Р<0,50) для данных n и Р,

  2. Считать тэмп эмпирическую частоту встречаемости эффекта в об­
    следованной выборке: тэмпэмп

  3. Если тэмп , превышает критические значения, это означает, что эм­пирическая частота достоверно превышает частоту, соответствую­щую заданной вероятности.


Вопрос 4


Многофункциональные критерии как эффективные за­менители традиционных критериев


Как было показано в предыдущих параграфах, многофункцио­нальные критерии, главным образом критерий φ*, применим к решению всех трех типов задач, рассмотренных в Темах 3-5: сопоставление уровней, определение сдвигов и сравнение распределений признака. В тех случаях, когда обследованы две выборки испытуемых, критерий φ* может эффективно заменять или, по крайней мере, эффективно допол­нять традиционные критерии: Q - критерий Розенбаума, U - критерий Манна-Уитни, критерий χ2 Пирсона и критерий λ Колмогорова-Смирнова.


В особенности полезна такая замена в следующих случаях:


^ Случай 1. Другие критерия неприменимы


Часто бывает так, что критерий Q неприменим вследствие совпа­дения диапазонов двух выборок, а критерий U неприменим вследствие того, что количество наблюдений п>60.


В качестве примера сошлемся на задачу сравнения сдвигов оце­нок в экспериментальной и контрольной группах после просмотра ви­деозаписи и чтения текста о пользе телесных наказании (см. параграф 2 Темы 4).


Сдвиги в двух группах являются показателями, полученными не­зависимо в двух группах испытуемых. Задача сравнения таких показа­телей сдвига - это частный случай задачи сопоставления двух групп по уровню значений какого-либо признака. Такие задачи решаются с по­мощью критериев Q Розенбаума и U Манна-Уитни (см. Табл. 3.1). Сводные данные по сдвигам в двух группах представлены в Табл. 5.14.

Таблица 5.14

Эмпирические частоты сдвигов разной интенсивности и направления в экспериментальной и контрольной группах после предъявления видеоза­писи или письменного текста



Значения сдвига

Количество сдвигов в экспе­риментальной группе (гн=1б)

Количество сдвигов в кон­трольной группе (п-»=23)

Суммы

+5

+2

+1

0

3

19

1

5

11

1

8

30

0

38

65

103

-1

-2

4

0

8

2

12

2

Суммы

64

92

156


В экспериментальной группе значения сдвигов варьируют от —2 до +2, а в контрольной группе от —2 до +5. Критерий Q неприменим. Критерий U неприменим, поскольку количество наблюдений (сдвигов) в каждой группе больше 60.


Применяем критерий φ*. Построим вначале четырехклеточную таблицу для положительных сдвигов, а затем - для нулевых.


Таблица 5.15

Четырехклеточная таблица для подсчета критерия φ* при сопоставле­нии долей положительных сдвигов в экспериментальной и контрольной

группах



Группы

«Есть эффект": сдвиг положительный

"Нет аффекта*: сдвиг отрицательный или нулевой

Суммы

Группа 1

экспериментальная

22 (34,4%)

42 (65,6%)

64

Группа 2

контрольная

17 (18,5%)

75 (81,5%)

92

Суммы

39

117

156


Сформулируем гипотезы.

H0: Доля положительных сдвигов в экспериментальной группе не больше, чем в контрольной.

Н1: Доля положительных сдвигов в экспериментальной группе больше, чем в контрольной.


Далее действуем по Алгоритму 17.

φ1(34,4%)=1.254

φ2(18,5%)=0,889









Мы можем и точно определить уровень статистической значимости полученного результата по Табл. ХШ Приложения 1:

при φ* эмп=2,242 р=0,013.


Ответ: H0 отклоняется. Принимается Н1. Доля положительных сдвигов в экспериментальной группе больше, чем в контрольной (p<0.013)


Теперь перейдем к вопросу о меньшей доле нулевых сдвигов в экспериментальной группе.

Таблица 5.16

Четырехклеточная таблица для подсчета критерия φ* при сопоставле­нии долей нулевых сдвигов в экспериментальной и контрольной группах



Группы

"Есть эффект": сдвиг равен 0

"Нет эффекта": сдвиг не равен 0

Суммы

Группа 1 экспериментальная

38 (59.4%)

26 (40,6%)

64

Группа 2

контрольная

65 (70,7%)

27 (29,3%)

92

Суммы

103

53

156


^ Сформулируем гипотезы.

Но: Доля нулевых сдвигов в контрольной группе не больше, чем в экс­периментальной.


H1: Доля нулевых сдвигов в контрольной группе больше, чем в экспе­риментальной.


Далее действуем по Алгоритму 17.

φ1(70,7%)=1.998

φ2(59,4%)=1.760




φ*эмп < φ*кр


Ответ: H0 принимается. Доля нулевых сдвигов в контрольной группе не больше, чем в экспериментальной.


Итак, доля положительных сдвигов в экспериментальной группе больше, но доля нулевых сдвигов - примерно такая же, как и в кон­трольной группе. Отметим, что в критерии знаков G все нулевые сдвиги были исключены из рассмотрения, поэтому полученный резуль­тат дает дополнительную информацию, которую не мог дать критерий знаков.


^ Случай 2. Другие критерии неэффективны или слишком гро­моздки


В качестве примера можно указать на задачу с сопоставлением показателей недостаточности в группах с большей и меньшей энергией вытеснения (см. Табл. 5,4).


Критерий Q дает незначимый результат:

Q =S1 +S2=4+0=4




Критерий U в данном случае применим и даже дает значимый результат (Uэмп=l54,5; р≤0,05), однако ранжирование показателей, многие из которых имеют одно и то же значение (например, значение 30 баллов встречается 13 раз), представляет определенные трудности.

Как мы помним, с помощью критерия φ* удалось доказать, что наиболее высокие показатели недостаточности (30 и более баллов) встречаются в группе с большей энергией вытеснения чаще, чем в группе с меньшей энергией вытеснения (р=0,008) и что, с другой сто­роны, самые низкие (нулевые) показатели встречаются чаще также в этой группе (р≤0,05).


Другим примером может служить задача сопоставления распреде­ления выборов желтого цвета в отечественной выборке и в выборке Х.Клара (см. параграф 4.3).


Критерий λ не выявил достоверных различий между двумя рас­пределениями, однако позволил нам установить точку максимального накопленного расхождения между ними. Из Табл. 4.19 следует, что такой точкой является вторая позиция желтого цвета. Построим четырехклеточную таблицу, где "эффектом" будет считаться попадание жел­того цвета на одну из первых двух позиций.

Таблица 5.17

Четырехклеточная таблица для расчета φ* при сопоставлении отечест­венной выборки (n1=102) и выборки Х.Клара (n2=800) по положению желтого цвета в ряду предпочтений




Выборки

"Есть эффект": желтый цвет

на первых двух позициях

"Нет эффекта": желтый цвет на позициях 3-8


Суммы

Выборка 1 -отечественная

39 (38.2%)

63 (61,8%)

102

Выборка 2 -

Х-Клара

211 (26,4%)

589 (73,6%)

800

Суммы

250

652

902


^ Сформулируем гипотезы.

Но: Доля лиц, помещающих желтый цвет на одну из первых двух по­зиций, в отечественной выборке не больше, чем в выборке Х.Клара.


H1: Доля лиц, поместивших желтый цвет на одну из первых двух по­зиции, в отечественной выборке больше, чем в выборке X. Клара.


Далее действуем по Алгоритму 17.

φ1(38,2%)=1.333

φ2(26,4%)=1,079




Как мы помним,




φ*эмп > φ*кр


Ответ: H0 отклоняется. Принимается Н1: Доля лиц, поместив­ших желтый цвет на одну из первых двух позиций, в отечественной выборке больше, чем в выборке X.Клара (р≤0,01).


Мы еще раз столкнулись с тем случаем, когда критерий X сам по себе не выявляет достоверных различий, но помогает максимально ис­пользовать возможности критерия φ*.


^ Случай 3. Другие критерии слишком трудоемки


Этот случай чаще всего относится к критерию χ2. Заменить его критерием φ* можно при условии, если сравниваются распределения при­знака в двух выборках, а сам признак принимает всего два значения5.


5.В принципе признак может принимать и большее количество значении, так как любую шкалу, как мы убедились, можно свести к альтернативной шкале "Есть эффект" - "Нет эффекта".


В качестве примера можно привести задачу с соотношением муж­ских и женских имен в записных книжках двух психологов (см. п. 4.2, Табл. 4.11).

Преобразуем Табл. 4.11 в четырехклеточную таблицу, где "эффектом* будем считать мужские имена.


Таблица 5.18

Четырехклеточная таблица для подсчета φ* при сопоставлении запис­ных книжек двух психологов по соотношению мужских и женских имен

Группы

«Есть эффект»: мужские имена

«Нет эффекта»: женские имена

Суммы

Группа 1 – выборка имён в книжке Х.

22 (32,8%)

45 (67,2%)

67

Группа 2 – выборка имён в книжке С.

59 (35,1%)

108 (64,9%)

168

Суммы

81

154

235

^ Сформулируем гипотезы.


Н0: Доля мужских имен в записной книжке С. не больше, чем в за­писной книжке X.


H1: Доля мужских имен в записной книжке С. больше, чем в записной книжке X.


Далее действуем по алгоритму.

φ1(35,1%)=1.268

φ2(32,8%)=1,220




По Табл. XIII Приложения 1 определяем, какому уровню досто­верности соответствует это значение. Мы видим, что такого значения вообще нет в таблице.

Построим "ось значимости".



Полученное эмпирическое значение - далеко в "зоне незначимости».

φ*эмп > φ*кр


Ответ: Но принимается. Доля мужских имен в записной книжке психолога С. не больше, чем в записной книжке психолога X.


Исследователь сам может решить для себя, какой метод ему в данном случае удобнее применить – χ2 или φ*. Похоже, что во втором случае меньше расчетов, хотя чуда не произошло: различия по-прежнему недостоверны.


Итак, мы убедились, что критерий φ* Фишера может эффектив­но заменять традиционные критерии в тех случаях, когда их применение невозможно, неэффективно или неудобно по каким-то причинам.


Биномиальный критерий m может служить заменой критерия χ2 в случае альтернативных распределений или в случае, когда признак может принимать одно из нескольких значений и вероятность того, что он примет определенное значение, известна.


Курс: «Математические методы в психологии»

(Материалы для самостоятельной работы студентам психологам и социальным работникам)


Лекция № 8

^ МЕТОД РАНГОВОЙ КОРРЕЛЯЦИИ

Вопросы:

1. Обоснование задачи исследования согласованных изменений.

2. Коэффициент ранговой корреляции rs Спирмена.


Вопрос 1 Обоснование задачи исследования согласованных изменений

Первоначальное значение термина "корреляции" - взаимная связь (Oxford Advanced Learner's Dictionary of Current English, 1982). Когда говорят о корреляции, используют термины "корреляционная связь" и "корреляционная зависимость".

^ Корреляционная связь - это согласованные изменения двух при­знаков или большего количества признаков (множественная корреляци­онная связь). Корреляционная связь отражает тот факт, что изменчи­вость одного признака находится в некотором соответствии с изменчи­востью другого (Плохинский Н.А., 1970, с. 40). "Стохастическая1 связь имеется тогда, когда каждому из значений одной случайной вели­чины соответствует специфическое (условное) распределение вероятно­стей значений другой величины, и наоборот, каждому из значений этой другой величины соответствует специфическое (условное) распределение вероятностей значений первой случайной величины" (Суходольский Г.В., 1972, с. 178).


1.Стохастическая означает вероятностная. Связи между случайными явлениями называют вероятностными ,или стохастическими связями (Суходольскнй Г. В., 1972, с. 52). Этот термин подчеркивает их отличие от детерминированных или функциональных связей а физике или математике (связь площади треугольника с его высотой и основанием, связь длины окружности с ее радиусом и т. п.). В функциональных связях каждому значению первого признака всегда соответствует (в идеальных условиях) совершенно определенное значение другого признака (Плохинский Н.А., 1970, с. 41). В корреляционных связях каждому значению одного признака может соответствовать определенное распределение значений другого признака, но не определенное его значение.


^ Корреляционная зависимость - это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.

Оба термина - корреляционная связь и корреляционная зависи­мость - часто используются как синонимы (Плохинский Н.А.,1970; Суходольский Г.В.,1972; Артемьева Е.Ю., Мартынов Е.М.,1975 и др.). Между тем, согласованные изменения признаков и отражающая это корреляционная связь между ними может свидетельствовать не о зави­симости этих признаков между собой, а зависимости обоих этих при­знаков от какого-то третьего признака или сочетания признаков, не рассматриваемых в исследовании.

Зависимость подразумевает влияние, связь - любые согласованные изменения, которые могут объясняться сотнями причин. Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной связи, они свидетельствуют лишь о том, что изменениям одного при­знака, как правило, сопутствуют определенные изменения другого, но находится ли причина изменений в одном из признаков или она оказы­вается за пределами исследуемой пары признаков, нам неизвестно.


Говорить в строгом смысле о зависимости мы можем только в тех случаях, когда сами оказываем какое-то контролируемое воздействие на испытуемых или так организуем исследование, что оказывается возмож­ным точно определить интенсивность не зависящих от нас воздействий. Воздействия, которые мы можем качественно определить или даже из­мерить, могут рассматриваться как независимые переменные. Признаки, которые мы измеряем и которые, по нашему предположению, могут из­меняться под влиянием независимых переменных, считаются зависимы­ми переменными. Согласованные изменения независимой и зависимой переменной действительно могут рассматриваться как зависимость.


Однако, учитывая, что число градаций, или уровней, зависимой переменной обычно невелико, целесообразнее применять в такого рода исследованиях не корреляционный метод, а методы выявления тенден­ций изменения признака при изменении условий, например, критерии тенденций Н Крускала-Уоллиса и L Пейджа (см. Главы 2 и 3) или метод дисперсионного анализа (см. Темы 8 и 9).


Если в исследование включены независимые переменные, кото­рые мы можем по крайней мере учитывать, например, возраст, то мож­но считать выявляемые между возрастом и психологическими признаками корреляционные связи корреляционными зависимостями. В боль­шинстве же случаев нам трудно определить, что в рассматриваемой па­ре признаков является независимой, а что - зависимой переменной.


Учитывая, что термин "зависимость" явно или неявно подразуме­вает влияние, лучше пользоваться более нейтральным термином "корреляционная связь".


Корреляционные связи различаются по форме, направлению и степени (силе).


По форме корреляционная связь может быть прямолинейной или криволинейной. Прямолинейной может быть, например, связь между количеством тренировок на тренажере и количеством правильно решае­мых задач в контрольной сессии. Криволинейной может быть, напри­мер, связь между уровнем мотивации и эффективностью выполнения задачи (см. Рис. 6.1). При повышении мотивации эффективность вы­полнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффектив­ность выполнения задачи; дальнейшему повышению мотивации сопутст­вует уже снижение эффективности.




Рис. 6.1. Связь между эффективностью решения задачи и силой мотивационной тен­денции (по j.W. Atkinson. I974. р.200)


По направлению корреляционная связь может быть положитель­ной ("прямой") и отрицательной ("обратной").

При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значе­ниям одного признака - низкие значения другого (см. Рис. 6.2).


При отрицательной корреляции соотношения обратные.




Рис. 6.2. Схема прямолинейных корреляционных связей;

А - положительная (прямая) корреляционная связь;

В - отрицательная (обратная) корреляционная связь

*При положительной корреляции коэффициент корреляции имеет положительный знак, например r=+0,207,

*при отрицательной корреля­ции - отрицательный знак, например r= - 0,207.


Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.


Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции. Максимальное воз­можное абсолютное значение коэффициента корреляции r=1,00; мини­мальное r=0.


Используется две системы классификации корреляционных связей по их силе: общая и частная.


Общая классификация корреляционных связей (по Ивантер Э.В., Коросову А.В., 1992):

  1. сильная, или тесная при коэффициенте корреляции r >0,70;

  2. средняя при 0,50< r <0,69;

  3. умеренная при 0,30< r <0,49;

  4. слабая при 0,20< r <0,29;

  5. очень слабая при r <0,19.


Частная классификация корреляционных связей:

1) высокая значимая корреляция - при г, соответствующем уровню статистической значимости р<0,01;

2)значимая корреляция - при r, соответствующем уровню

статистической значимости р<0,05;

3) тенденция достоверной связи при г, соответствующем уровню статистической значимости р<0,10;

4)незначимая корреляция - при r , не достигающем уровня статистической значимости.


Две эти классификации не совпадают.


*Первая ориентирована только на величину коэффициента корреляции, а

*вторая определяет, какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, тем меньшей величины коэффициента корреляции оказывается доста­точно, чтобы корреляция была признана достоверной. В результате при малом объеме выборки может оказаться так, что сильная корреляция окажется недостоверной. В то же время при больших объемах выборки даже слабая корреляция может оказаться достоверной.


Обычно принято ориентироваться на вторую классификацию, по­скольку она учитывает объем выборки. Вместе с тем, необходимо пом­нить, что сильная, или высокая, корреляция - это корреляция с коэффи­циентом r>0,70, а не просто корреляция высокого уровня значимости.


^ В качестве мер корреляции используются:


1) эмпирические меры тесноты связи, многие из которых были получе­ны еще до открытия метода корреляции, а именно:

а) коэффициент ассоциации, или тетрахорический показатель связи;

б) коэффициенты взаимной сопряженности Пирсона и Чупрова;

в) коэффициент Фехнера;

г) коэффициент корреляции рангов;


  1. линейный коэффициент корреляции r;


3)корреляционное отношение ή


4)множественные коэффициенты корреляции и др.


Подробное описание этих мер можно найти в руководствах Венецкого И.Г., Кильдишева Г.С.(1968), Плохинского Н.А.(1970), Суходольского f.B.(1972), Ивантер Э.В., Коросова А.В.(1992) и др.


В психологических исследованиях чаще всего применяется коэф­фициент линейной корреляции r Пирсона. Однако этот метод является параметрическим и поэтому не лишен недостатков, свойственных пара­метрическим методам (см. параграф 1.8). Параметрическими являются также методы определения корреляционного отношения и подсчета множественных коэффициентов корреляции. Кроме того, эти методы, как правило, требуют машинной обработки данных. По этим причинам они остаются за пределами нашего рассмотрения.


Все эмпирические меры тесноты связи, кроме коэффициента ранговой корреляции, могут быть заменены методами сопоставления и сравнения, изложенными в Темах 3-6.


Ведь что, в сущности, мы доказываем, когда обосновываем разли­чия в долях двух выборок, характеризующихся исследуемым эффектом? Мы показываем, что если испытуемый относится к одной из выборок, то, скорее всего, он будет характеризоваться какими-то определенными значениями исследуемого признака, а если он относится к другой из двух выборок, то он будет характеризоваться (с большой степенью вероятности) другими значениями исследуемого признака. Фактически мы исследуем сопряженные изменения двух признаков: отнесенность к той или иной выборке и определенные значения исследуемого признака.


Что мы доказываем, с другой стороны, когда два распределения признака оказываются сходными или, наоборот, статистически досто­верно различающимися между собой? Мы доказываем, что в обеих выборках частоты встречаемости разных значении признака распределяют­ся согласованно или, наоборот, несогласованно.


Мы, правда, скорее определяем меру рассогласованности, чем согласованности, но все же часто метод χ2 относится к числу методов, выявляющих степень согласованности или даже связи.


Методы выявления тенденций уже напрямую заменяют меры эмпирической сопряженности, позволяя нам проследить возрастание значений признака при изменении условий. Фактически мы отвечаем на вопрос о том, согласованно ли изменяются условия и значения иссле­дуемого признака.


Быть может, современному психологу не очень просто отказаться от метода подсчета корреляций. Это очень привычно - подсчитывать корреляции. Исторически сложилось так, что этот метод является одним из основных методов статистической обработки. Главное преимущество кор­реляционного анализа состоит в том, что можно сразу провести множе­ственное сопоставление признаков.

Например, нам необходимо опреде­лить, с чем связана успешность в какой-либо деятельности. Исследова­тель может предполагать, что она связана с уровнем интеллектуального развития, с некоторыми из личностных факторов 16-факторного опрос­ника Кеттелла, а может быть, с уровнем эмпатии, тревожности или фрустрационной толерантности, с возрастом самого испытуемого или воз­растом матери в момент его рождения и т.д. и т.п. В итоге он получает связи, отражающие среднегрупповые тенденции сопряженного измене­ния признаков. Но дело как раз в том, что у каждого отдельного испы­туемого успешность в данном виде деятельности может определяться разными психологическими характеристиками или разными их сочета­ниями. Метод корреляций отдает предпочтение группе, а не отдельному индивиду.


Против этого можно возразить, что и все остальные статистиче­ские методы отдают предпочтение среднегрупповым, а не индивидуаль­ным тенденциям. Однако это не совсем так. Например, метод тенден­ций L Пейджа определяет степень согласованности индивидуальных тенденций, критерий χ2r, Фридмана—степень совпадения или несовпаде­ния индивидуальных соотношений рангов, биномиальный критерий m -степень отклонения индивидуальных значений от заданных или средне­статистических и т.п.


Прежде чем переходить к корреляциям, исследователю необходимо проанализировать полученные данные с помощью критериев сравнения и сопоставления еще и по другой причине. Возможно, размах вариатив­ности признака в обследованной выборке окажется слишком узким, чтобы можно было распространять полученную корреляцию на весь возможный диапазон его значений. Например, может оказаться так, что в обследованной группе по какому-либо из факторов 16-факторного личностного опросника Кеттелла получены лишь низкие и средние зна­чения, и в то же время выявлена значимая положительная связь этого личностного фактора с успешностью профессиональной деятельности. Не учитывая истинного размаха значений в данной выборке, можно экстраполировать полученную связь и на высокие значения фактора, что может оказаться ошибкой.

Во-первых, связь данного фактора с ус­пешностью деятельности может на самом деле быть криволинейной, как в рассмотренном выше случае связи уровня мотивации с эффективно­стью выполнения задания (см. Рис. 6.1).

Во-вторых, не исключено, что самым важным результатом исследования является как раз факт низких и средних значений данного личностного фактора в обследованной вы­борке, а исследователь не обратил на него внимания, привычно отдав предпочтение корреляционной матрице, а не таблице первичных данных.


Математическая обработка должна начинаться с использования "самых простых приемов с совершенно понятной для исследователя сутью производимых преобразований" (Дворяшнна М.Д., Пехлецкий И.Д., 1976, с. 45). Учитывая большие возможности методов первичной обра­ботки данных, изложенных в Темах 3-6, не исключено, что этими приемами математическая обработка может и заканчиваться. Эти мето­ды дают и основание для достоверных выводов, и материал для вы­движения новых гипотез, и стимул к новым размышлениям.


И все же, если исследователь хочет применить метод корреляций, в настоящем пособии предлагается использовать коэффициент ранговой корреляции Спирмена.

^ Основанием для выбора этого коэффициента служат:

а) его универсальность;

б) простота;

в) широкие возможности в решении задач сравнения индивидуаль­ных или групповых иерархий признаков.


Универсальность коэффициента ранговой корреляции проявляется в том, что он применим к любым количественно измеренным или ран­жированным данным. Простота метода позволяет подсчитывать корре­ляцию "вручную". Уникальность метода ранговой корреляции состоит в том, что он позволяет сопоставлять не индивидуальные показатели, а индивидуальные иерархии, или профили, что недоступно ни одному из других статистических методов, включая метод линейной корреляции (Плохинский Н.А., 1970, с. 167).


Коэффициент ранговой корреляции рекомендуется применять в тех случаях, когда нам необходимо проверить, согласованно ли изменя­ются разные признаки у одного и того же испытуемого и насколько совпадают индивидуальные ранговые показатели у двух отдельных ис­пытуемых или у испытуемого и группы.


Вопрос 2


Коэффициент ранговой корреляции

rs Спирмена


Назначение рангового коэффициента корреляции


Метод ранговой корреляции Спирмена позволяет определить тес­ноту (силу) и направление корреляционной связи между двумя призна­ками или двумя профилями (иерархиями) признаков.


Описание метода


Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы.

^ Такими рядами значений могут быть:

  1. два признака, измеренные в одной и той же группе испытуемых;

  2. две индивидуальные иерархии признаков, выявленные у двух испы­туемых по одному и тому же набору признаков (например, личност­ные профили по 16-факторному опроснику Р. Б. Кеттелла, иерархии ценностей по методике Р. Рокича, последовательности предпочтений в выборе из нескольких альтернатив и др.);

^ 3) две групповые иерархии признаков;

4) индивидуальная и групповая иерархии признаков.


Вначале показатели ранжируются отдельно по каждому из признаков. Как правило, меньшему значению признака начисляется меньший ранг.


Рассмотрим случай 1 (два признака).

Здесь ранжируются ин­дивидуальные значения по первому признаку, полученные разными ис­пытуемыми, а затем индивидуальные значения по второму признаку.


Если два признака связаны положительно, то испытуемые, имею­щие низкие ранги по одному из них, будут иметь низкие ранги и по другому, а испытуемые, имеющие высокие ранги по одному из призна­ков, будут иметь по другому признаку также высокие ранги. Для под­счета rs необходимо определить разности (d) между рангами, получен­ными данным испытуемым по обоим признакам. Затем эти показатели d определенным образом преобразуются и вычитаются из 1. Чем меньше разности между рангами, тем больше будет rs, тем ближе он будет к +1,


Если корреляция отсутствует, то все ранги будут перемешаны и между ними не будет никакого соответствия. Формула составлена так, что в этом случае rs окажется близким к 0.


В случае отрицательной корреляции низким рангам испытуемых по одному признаку будут соответствовать высокие ранги по другому признаку, и наоборот.


Чем больше несовпадение между рангами испытуемых по двумя переменным, тем ближе rs к -1.


Рассмотрим случай 2 (два индивидуальных профиля).


Здесь ранжируются индивидуальные значения, полученные каждым из 2-х испытуемым по определенному (одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым низким значением; второй ранг - признак с более высоким значением и т.д. Очевидно, что все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование невозможно.

Например, невозможно проранжировать показатели по личностному опроснику Кеттелла (16PF), если они вы­ражены в "сырых" баллах, поскольку по разным факторам диапазоны значений различны: от 0 до 13, от 0 до 20 и от 0 до 26. Мы не мо­жем сказать, какой из факторов будет занимать первое место по выра­женности, пока не приведем все значения к единой шкале (чаще всего это шкала стенов).


Если индивидуальные иерархии двух испытуемых связаны поло­жительно, то признаки, имеющие низкие ранги у одного из них, будут иметь низкие ранги и у другого, и наоборот. Например, если у одного испытуемого фактор Е (доминантность) имеет самый низкий ранг, то и у другого испытуемого он должен иметь низкий ранг, если у одного испытуемого фактор С (эмоциональная устойчивость) имеет высший ранг, то и другой испытуемый должен иметь по этому фактору высокий ранг и т.д.


Рассмотрим случай 3 (два групповых профиля).


Здесь ранжи­руются среднегрупповые значения, полученные в 2-х группах испытуе­мых по определенному, одинаковому для двух групп, набору признаков. В дальнейшем линия рассуждений такая же, как и в предыдущих двух случаях.


Рассмотрим случай 4 (индивидуальный и групповой профили).


Здесь ранжируются отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же набору признаков, которые полу­чены, как правило, при исключении этого отдельного испытуемого - он не участвует в среднегрупповом профиле, с которым будет сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить, насколько согласованы индивидуальный и групповой профили.


Во всех четырех случаях значимость полученного коэффициента корреляции определяется по количеству ранжированных значений N.

*В первом случае это количество будет совпадать с объемом выборки п.

*Во втором случае количеством наблюдений будет количество признаков, составляющих иерархию.

*В третьем и *четвертом случае N - это также количество сопоставляемых признаков, а не количество испытуемых в группах.

Подробные пояснения даны в примерах.


Если абсолютная величина rs достигает критического значения или превышает его, корреляция достоверна.

Гипотезы

Возможны два варианта гипотез. Первый относится к случаю 1, второй - к трем остальным случаям.

^ Первый вариант гипотез

H0: Корреляция между переменными А и Б не отличается от нуля.

H1: Корреляция между переменными А и Б достоверно отличается от нуля.


^ Второй вариант гипотез

H0: Корреляция между иерархиями А и Б не отличается от нуля. H1: Корреляция между иерархиями А и Б достоверно отличается от нуля.


^ Графическое представление метода ранговой корреляции


Чаще всего корреляционную связь представляют графически в виде облака точек или в виде линий, отражающих общую тенденцию размещения точек в пространстве двух осей: оси признака А и призна­ка Б (см. Рис. 6.2).


Попробуем изобразить ранговую корреляцию в виде двух рядов ранжированных значений, которые попарно соединены линиями (Рис. 6.3). Если ранги по признаку А и по признаку Б совпадают, то между ними оказывается горизонтальная линия, если ранги не совпадают, то линия становится наклонной. Чем больше несовпадение рангов, тем бо­лее наклонной становится линия. Слева на Рис. 6.3 отображена макси­мально высокая положительная корреляция (rs=+l,0) - практически это «лестница". В центре отображена нулевая корреляция - плетенка с неправильными переплетениями. Все ранги здесь перепутаны. Справа отображена максимально высокая отрицательная корреляция (rs= -1,0) - паутина с правильным переплетением линий.



Рис. 6.3. Графическое представление ранговой корреляции:

а) высокая положительная корреляция;

б) нулевая корреляция;

в) высокая отрицательная корреляция


Ограничения коэффициента ранговой корреляции


  1. По каждой переменной должно быть представлено не менее 5 на­блюдений. Верхняя граница выборки определяется имеющимися таб­лицами критических значений (Табл.ХУ1 Приложения 1), а именно N<40.




  1. Коэффициент ранговой корреляции Спирмена rs при большом коли­честве одинаковых рангов по одной или обеим сопоставляемым пе­ременным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпа­дающих значений. В случае, если это условие не соблюдается, необ­ходимо вносить поправку на одинаковые ранги. Соответствующая формула дана в примере 4.


^ Пример 1 - корреляция между двумя признаками


В исследовании, моделирующем деятельность авиадиспетчера (Одерышев Б.С, Шамова Е.П., Сидоренко Е.В., Ларченко Н.Н., 1978), группа испытуемых, студентов физического факультета ЛГУ проходила подготовку перед началом работы на тренажере. Испытуе­мые должны были решать задачи по выбору оптимального типа взлет­но-посадочной полосы для заданного типа самолета. Связано ли коли­чество ошибок, допущенных испытуемыми в тренировочной сессии, с показателями вербального и невербального интеллекта, измеренными по методике Д. Векслера?

Таблица 6.1

Показатели количества ошибок в тренировочной сессии и показатели уровня вербального и невербального интеллекта у студентов-физиков

(№=10)


Испытуемый

Количество ошибок

^ Показатель вербального

интеллекта

Показатель невербального интеллекта

1

Т.А.

29

131

106

2

ПА.

54

132

90

3

Ч.И.

13

121

95

4

Ц.А.

8

127

116

5

См.А.

14

136

127

6

К.Е.

26

124

107

7

КА

9

134

104

8

Б.Л.

20

136

102

9

И.А.

2

132

111

10

Ф.В.

17

136

99

Суммы

192

1309

1057

Средние

19,2

130,9

105,7
1   2   3   4   5



Скачать файл (2763 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации
Рейтинг@Mail.ru