Logo GenDocs.ru

Поиск по сайту:  


Загрузка...

Лекции - курс: Математические методы в психологии. Часть 2 - файл 1.doc


Загрузка...
Лекции - курс: Математические методы в психологии. Часть 2
скачать (2763 kb.)

Доступные файлы (1):

1.doc2763kb.16.11.2011 05:07скачать

1.doc

  1   2   3   4   5
Реклама MarketGid:
Загрузка...






Материалы к курсу

«МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ»


ЧАСТЬ 2


@Преподаватель: Голев Сергей Васильевич, адъюнкт-профессор психологии (доцент).


@Ассистент: Голева Ольга Сергеевна, магистр психологии


(ОМУРЧ «Украина» ХФ. – 2010 г.)

ИПИС ХГУ - 2010 г. )


В лекциях были использованы материалы и книги следующих авторов:


Годфруа Ж. Что такое психология? М.: Мир, 1996. Т 2 . Куликов Л. В. Психологическое исследование: методические рекомендаций по проведению. - СПб., 1995. Немов Р.С. Психология: Экспериментальная педагогическая психология и психодиагностика. - М., 1999.- Т. 3. Практикум по общей экспериментальной психологии / Под ред. А.А. Крылова. - Л. ЛГУ, 1987. Сидоренко Е.В. Методы математической обработки в психологии. –СПб.: ООО «Речь», 2000. -350 с. Шевандрин Н.И. Психодиагностика, коррекция и развитие личности. - М.: Владос, 1998.-С.123. Суходольский Г.В. Математические методы в психологии. – Харьков: Изд-во Гуманитарный Центр, 2004. – 284 с.


Курс: «Методы математической обработки в психологии»

(Материалы для самостоятельного изучения студентами психологами и социальными работниками)


ТЕМА № 6


^ ВЫЯВЛЕНИЕ РАЗЛИЧИЙ В РАСПРЕДЕЛЕНИИ ПРИЗНАКА


Вопросы:


1. Обоснование задачи сравнения распределений признака

2. χ2 – критерий Пирсона

3. λ – критерий Колмогорова-Смирнова

^ 4. Алгоритм выбора критерия для сравнения распределений


Вопрос 1.


Обоснование задачи сравнения распределений

признака


Распределения могут различаться по средним, дисперсиям, асим­метрии, эксцессу и по сочетаниям этих параметров. Рассмотрим не­сколько примеров.


На Рис. 4.1 представлены два распределения признака. Распреде­ление 1 характеризуется меньшим диапазоном вариативности и меньшей дисперсией, чем распределение 2. В распределении 1 чаще встречаются значения признака, близкие к средней, а в распределении 2 чаще встре­чаются более высокие и более низкие, чем средняя, значения признака.



Рис 4.1. Кривые распределения признака с меньшим диапазоном вариативности при­знака (1) и большим диапазоном распределений признака (2): х - значения признака; ƒ - относительная частота их встречаемости

Именно такое соотношение может наблюдаться в распределении стенотипических признаков у мужчин (кривая 2) и женщин (кривая 1). Фенотипическая дисперсия мужского пола должна быть больше, чем женского (Геодакян В.А., 1974; 1993). Мужчины - это авангардная часть популяции, ответственная за поиск новых форм приспособления, поэтому у них чаще встречаются редкие крайние значения различных фенотипических признаков. Эти отклонения, по мнению В.А. Геодакяна, носят "футуристический" характер, это "пробы", включающие как будущие возможные пути эволюции, так и ошибки (Геодакян В.А., 1974, с. 381). В то же время женская часть популяции ответственна за сохранение уже накопленных изменений, поэтому у них чаще встреча­ются средние значения фенотипических признаков.


Анализ реально получаемых в исследованиях распределений мо­жет позволить нам подтвердить или опровергнуть данные теоретические предположения.


На Рис. 4.2 представлены два распределения, различающиеся по знаку асимметрии: распределение 1 характеризуется положительной асимметрией (левосторонней), а распределение 2 — отрицательной (правосторонней).



Рис. 4.2. Кривые распределения признака с положительной (левосторонней) асимметри­ей (1) и отрицательной (правосторонней) асимметрией (2); х - значения признаке;

ƒ -относительная частота их встречаемости

Данные кривые могут отражать распределение времени решения простой задачи (кривая 1) и трудной задачи (кривая 2). Простую за­дачу большинство испытуемых решают быстро, поэтому большая часть значений группируется слева. В то же время сама простота задачи мо­жет привести к тому, что некоторые испытуемые будут думать над нею очень, очень долго, дольше даже, чем над сложной. Трудную задачу большинство испытуемых решают в тенденция дольше, чем простую, но в то же время почти всегда находятся люди, которые решают ее мгно­венно.

Если мы докажем, что распределения статистически достоверно различаются, это может стать основой для построения классификаций задач и типологий испытуемых. Например, мы можем выявлять испы­туемых со стандартным соотношением признаков: простую задачу они решают быстро, а трудную - медленно, — и испытуемых с нестандарт­ным соотношением: простую задачу решают медленно, а трудную - быстро и т.п. Далее мы можем сравнить выявленные группы испытуемых по показателям мотивации достижения, так как известно, что лица с преобладанием стремления к успеху предпочитают задачи средней труд­ности, где вероятность успеха примерно 0.5, а лица с преобладанием стремления избегать неудачи предпочитают либо очень легкие, либо, наоборот, очень трудные задачи (McClelland D.C., Winter D.G., 1969). Таким образом, и здесь сопоставление форм распределения мо­жет дать начало научному поиску.

Часто нам бывает полезно также сопоставить полученное эмпи­рическое распределение с теоретическим распределением. Например, для того, чтобы доказать, что оно подчиняется или, наоборот, не под­чиняется нормальному закону распределения. Это лучше делать с по­мощью машинных программ обработки данных, особенно при больших объемах выборок. Подробные программы машинной обработки можно найти, например, в руководстве Э.В. Ивантер и Л.В. Коросова (1992).

В практических целях эмпирические распределения должны про­веряться на "нормальность" в тех случаях, когда мы намерены исполь­зовать параметрические методы и критерии. В данном руководстве это относится лишь к методам дисперсионного анализа, поэтому способы проверки совпадения эмпирического распределения с нормальным опи­саны в Лекции 8, посвященной однофакторному дисперсионному анализу.

Традиционные для отечественной математической статистики кри­терии определения расхождения или согласия распределений - это метод χ2 К. Пирсона и критерий λ Колмогорова-Смирнова.


Оба эти метода требуют тщательной группировки данных и до­вольно сложных вычислений. Кроме того, возможности этих критериев в полной мере проявляются на больших выборках (n≥30). Тем не ме­нее, они могут оказаться столь незаменимыми, что исследователю при­дется пренебречь экономией времени и усилий.


Например, они незаме­нимы в следующих двух случаях:

  1. в задачах, требующих доказательства неслучайности предпочтений в выборе из нескольких альтернатив;

  2. в задачах, требующих обнаружения точки максимального расхожде­ния между двумя распределениями, которая затем используется для перегруппировки данных с целью применения критерия φ* (углового преобразования Фишера).


Рассмотрим вначале традиционные методы определения расхож­дения распределений, а затем возможности использования критерия φ* Фишера.


Вопрос 2

χ2 - критерий Пирсона


Назначения критерия

Критерий χ2 применяется в двух целях;

  1. для сопоставления эмпирического распределения признака с теоретическим - равномерным, нормальным или каким-то иным;

  2. для сопоставления двух, трех или более эмпирических распределе­ний одного и того же признака1.

1 На самом деле области применения критерия %2 многообразны (см., например: Суходольский Г.В., 1972, с. 293), но в данном руководстве мы ограничиваемся только этими двумя, наиболее часто встречающимися на практике, целями.

^ Описание критерия

Критерий χ2 отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.

Преимущество метода состоит в том, что он позволяет сопостав­лять распределения признаков, представленных в любой шкале, начиная от шкалы наименований. В самом простом случае альтерна­тивного распределения "да - нет", "допустил брак - не допустил бра­ка", "решил задачу - не решил задачу" и т. п. мы уже можем приме­нить критерий χ2.

Допустим, некий наблюдатель фиксирует количество пешеходов, выбравших правую или левую из двух симметричных дорожек на пути из точки А в точку Б (см. Рис. 4.3).



Рис. 4.3. Иллюстрация к примеру о теоретически равновероятном выборе из двух аль­тернатив - правой и левой дорожек, ведущих из точки А в точку Б

Допустим, в результате 70 наблюдений установлено, что 51 чело­век выбрали правую дорожку, и лишь 19 - левую. С помощью критерия χ2 мы можем определить, отличается ли данное распределение выборов от равномерного распределения, при котором обе дорожки выбирались бы с одинаковой частотой. Это вариант сопоставления полученного эм­пирического распределения с теоретическим. Такая задача может сто­ять, например, в прикладных психологических исследованиях, связанных с проектированием в архитектуре, системах сообщения и др.

Но представим себе, что наблюдатель решает совершенно другую задачу: он занят проблемами билатерального регулирования. Совпадение полученного распределения с равномерным его интересует гораздо в меньшей степени, чем совпадение или несовпадение его данных с дан­ными других исследователей. Ему известно, что люди с преобладанием правой ноги склонны делать круг против часовой стрелки, а люди с преобладанием левой ноги - круг по ходу часовой стрелки, и что в ис­следовании коллег2 преобладание левой ноги было обнаружено у 26 человек из 100 обследованных.

2Доброхотова Т. А., Брагина Н. Н. Левши- М.: "Книга", 1994.


С помощью метода χ2 он может сопоставить два эмпирических распределения: соотношение 51:19 в собственной выборке и соотноше­ние 74:26 в выборке других исследователей.

Это вариант сопоставления двух эмпирических распределений по простейшему альтернативному признаку (конечно, простейшему с математической точки зрения, а отнюдь не психологической).

Диалогичным образом мы можем сопоставлять распределения выборов из трех и более альтернатив. Например, если в выборке из 50 человек 30 выбрали ответ (а), 15 человек - ответ (б) и 5 человек - ответ (в), то мы можем с помощью метода χ2 проверить, отличается ли это распределение от равномерного распределения или от распределения ответов в другой выборке, где ответ (а) выбрали 10 человек, ответ (б) -25 человек, ответ (в) - 15 человек.

В тех случаях, если признак измеряется количественно, скажем, в баллах, секундах или миллиметрах, нам, быть может, придется объеди­нить все обилие значений признака в несколько разрядов. Например, если время решения задачи варьирует от 10 до 300 секунд, то мы мо­жем ввести 10 или 5 разрядов, в зависимости от объема выборки. На­пример, это будут разряды: 0-50 секунд; 51-100 секунд; 101-150 секунд и т. д. Затем мы с помощью метода χ2 будем сопоставлять частоты встречаемости разных разрядов признака, но в остальном принципиаль­ная схема не меняется.

При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теорети­ческими частотами.

При сопоставлении двух эмпирических распределений мы опреде­ляем степень расхождения между эмпирическими частотами и теорети­ческими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений. Формулы расчета теоретических час­тот будут специально даны для каждого варианта сопоставлений.

^ Чем больше расхождение между двумя сопоставляемыми распре­делениями, тем больше эмпирическое значение χ2.

Гипотезы

Возможны несколько вариантов гипотез, в зависимости от задач, которые мы перед собой ставим.

^ Первый вариант:

H0: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения.

H1: Полученное эмпирическое распределение признака отличается от теоретического распределения.

^ Второй вариант:

H0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2.

Н1: Эмпирическое распределение 1 отличается от эмпирического рас­пределения 2.

Третий вариант:

H0: Эмпирические распределения 1, 2, 3, ... не различаются между собой.

H1: Эмпирические распределения 1, 2, 3, ... различаются между собой.

Критерий χ2 позволяет проверить все три варианта гипотез.


^ Графическое представление критерия

Проиллюстрируем пример с выбором правой или левой дорожек на пути из точки А в точку Б. На Рис. 4.4 частота выбора левой до­рожки представлена левым столбиком, а частота выбора правой дорож­ки - правым столбиком гистограммы. На оси ординат отмеряются от­носительные частоты выбора, то есть частоты выбора той или иной до­рожки, отнесенные к общему количеству наблюдений. Для левой дорожки относительная частота, которая называется также частостью, составляет 19/70, то есть 0,27, а для правой дорожки 51/70, то есть 0.73.

Гистограмма - это диаграмма, в которой различная величина частот изображается различной высотой столбиков (Плохинский Н. А., 1970, с. 14.)




Рис. 4.4. Частоты выбора левой и правой дорожек; теоретическая частота представлена в виде горизонтальной планки, стрелками обозначены области расхождения между эмпирическими и теоретическими частотами

Если бы обе дорожки выбирались равновероятно, то половина испытуемых выбрала бы правую дорожку, а половина - левую. Вероят­ность выбора каждой из дорожек составляла бы 0,50.

Мы видим, что отклонения эмпирических частот от этой величи­ны довольно значительны. Возможно, различия между эмпирическим и теоретическим распределением окажутся достоверными.

На Рис. 4.5 фактически представлены две гистограммы, но стол­бики сгруппированы так, что слева сопоставляются частоты предпочте­ния левой дорожки в выборе нашего наблюдателя (1) и в выборке Т.А. Доброхотовой и Н.Н. Брагиной (2), а справа - частоты предпочтения правой дорожки в этих же двух выборках.



Рис. 4.5. Частоты выбора левой и правой дорожек в двух выборках испытуемых

  1. — Выборка наблюдателя;

  2. — Выборка других исследователей


Мы видим, что расхождения между выборками очень незначи­тельны. Критерий χ2 скорее всего, подтвердит совпадение двух рас­пределений.


Ограничения критерия

1. Объем выборки должен быть достаточно большим: n>50. При n<30 критерий χ2 дает весьма приближенные значения. Точность крите­рия повышается при больших п.

2. Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: f>5. Это означает, что если число разрядов задано зара­нее и не может быть изменено, то мы не можем применять метод χ2, не накопив определенного минимального числа наблюдений. Ес­ли, например, мы хотим проверить наши предположения о том, что частота обращений в телефонную службу Доверия неравномерно распределяются по 7 дням недели, то нам потребуется 5*7=35 обра­щений. Таким образом, если количество разрядов (k) задано зара­нее, как в данном случае, минимальное число наблюдений (nmin) оп­ределяется по формуле: nmin = k*5.

3. Выбранные разряды должны "вычерпывать" все распределение, то есть охватывать весь диапазон вариативности признаков. При этом группировка на разряды должна быть одинаковой во всех сопостав­ляемых распределениях.

4. Необходимо вносить "поправку на непрерывность" при сопоставле­нии распределений признаков, которые принимают всего 2 значения.
При внесении поправки значение χ2 уменьшается (см. Пример с по­правкой на непрерывность).

5. Разряды должны быть неперекрещивающимися: если наблюдение отнесено к одному разряду, то оно уже не может быть отнесено ни к какому другому разряду.

Сумма наблюдений по разрядам всегда должна быть равна общему количеству наблюдений.


Правомерен вопрос о том, что считать числом наблюдений - количество выбо­ров, реакций, действий или количество испытуемых, которые совершают выбор, проявляют реакции или производят действия. Если испытуемый проявляет не­сколько реакций, и все они регистрируются, то количество испытуемых не будет совпадать с количеством реакций. Мы можем просуммировать реакции каждого испытуемого, как, например, это делается в методике Хекхаузена для исследования мотивации достижения или в Тесте фрустрационной толерантности С. Розенцаейга, и сравнивать распределения индивидуальных сумм реакций в нескольких выборках.

В этом случае числом наблюдений будет количество испытуемых. Если же мы подсчитываем частоту реакций определенного типа в целом по выборке, то получа­ем распределение реакций разного типа, и в этом случае количеством наблюдений будет общее количество зарегистрированных реакций, а не количество испытуемых.

С математической точки зрения правило независимости разрядов соблюдается в обоих случаях: одно наблюдение относится к одному и только одному разряду рас­пределения.

Можно представить себе и такой вариант исследования, где мы изучаем рас­пределение выборов одного испытуемого. В когнитивно-бихевиоральной терапии, например, клиенту предлагается всякий раз фиксировать точной время появления нежелательной реакции, например, приступов страха, депрессии, вспышек гнева, самоуничижающих мыслей и т. п. В дальнейшем психотерапевт анализирует полу­ченные данные, выявляя часы, в которые неблагоприятные симптомы проявляются чаще, и помогает клиенту строить индивидуальную программу предупреждения неблагоприятных реакций.

Можно ли с помощью критерия χ2 доказать, что некоторые часы являются в этом индивидуальном распределении более часто встречающимися, а другие - ме­нее часто встречающимися? Все наблюдения - зависимы, так как они относятся к одному и тому же испытуемому; в то же время все разряды - неперекрещивающиеся, так как одни и тот же приступ относится к одному и только одному разря­ду (в данном случае - часу дня). По-видимому, применение метода χ2 будет в данном случае некоторым упрощением. Приступы страха, гнева или депрессии могут наступать неоднократно в течение дня, и может оказаться так, что, скажем, ранний утренний, 6-часовой, и поздний вечерний, 12-часовой, приступы обычно появляются вместе, а один и тот же день: в то же время дневной 3-часовой при­ступ появляется не ранее как через сутки после предыдущего приступа и не менее чем за двое суток до следующего и т. п. По-видимому, речь здесь может идти о сложной математической модели или вообще о чем-то таком, чего нельзя "поверить алгеброй". И тем не менее в практических целях может оказаться полезным ис­пользовать критерий для того, чтобы выявить систематическую неравномерность наступления каких-либо значимых событий, выбора, предпочтений и т. п. у одного и того же человека.

Итак, одно и то же наблюдение должно относиться только к одному разряду. Но считать ли наблюдением каждого испытуемого или каждую исследуемую реак­цию испытуемого - вопрос, решение которого зависит от целей исследования (см., напр.,Ганзен В.А., Балин В.Д-. 1991, с.10).


Главное же "ограничение" критерия χ2 – то, что но кажется большинству исследователей пугающе сложным.

Попытаемся преодолеть миф о непостижимой трудности критерия χ2. Чтобы оживить изложение, рассмотрим шутливый литературный пример.


^ Шутливый пример

В гениальной комедии Н. В. Гоголя "Женитьба" у купеческой дочери Агафьи Тихоновны было пятеро женихов. Одного она сразу исключила из рассмотрения, потому что он был купеческого звания, как и она сама. А из остальных она не знала, кого выбрать: "Уж как труд­но решиться, так просто рассказать нельзя, как трудно. Если бы губы Никанора Ивановича да приставить к носу Ивана Кузьмича, да взять сколько-нибудь развязности, какая у Балтазара Балтазарыча, да, пожа­луй, прибавить к этому еще дородности Ивана Павловича, я бы тогда тотчас решилась. А теперь поди подумай! просто голова даже стала болеть. Я думаю, лучше всего кинуть жребий" (Гоголь Н.В., 1959, с. 487). И вот Агафья Тихоновна положила бумажки с четырьмя имена­ми в ридикюль, пошарила рукою в ридикюле и вынула вместо одного — всех!

Ей хотелось, чтобы жених совмещал в себе достоинства всех чет­верых, и, вынимая все бумажки вместо одной, она бессознательно со­вершала процедуру выведения средней величины. Но вывести среднюю величину из четверых людей невозможно, и Агафья Тихоновна в смя­тении. Она влюблена, но не знает, в кого. "Такое несчастное положе­ние девицы, особливо еще влюбленной" (там же, с. 487).

Вся беда в том, что ни Агафья Тихоновна, ни ее тетушка, ни сваха Фекла Ивановна не были знакомы с критерием χ2 ! Именно он мог бы им помочь в решении их проблемы. С его помощью можно бы­ло бы попробовать установить, в кого больше влюблена Агафья Тихо­новна. Но для этого нам не нужно измерять губы Никанора Ивановича или нос Ивана Кузьмича, или объем талии дородного экзекутора Ива­на Павловича; не нужно нам и пускаться на какие-нибудь опасные экс­перименты, чтобы определить, насколько далеко простирается развяз­ность Балтазара Балтазарыча. Мы эти их достоинства принимаем как данность потому лишь, что они нравятся Агафье Тихоновне. Мы при­нимаем их за разряды одного и того же признака, например, направ­ленности взгляда Агафьи Тихоновны: сколько раз она взглянула на губы Никанора Ивановича? На нос Ивана Кузьмича? Благосклонно взирала на дородного Ивана Павловича или развязного Балтазара Балтазаровича? Внимательная сваха или тетушка вполне могла бы этот признак наблюдать. Допустим, за полчаса смотрин ею зафиксированы следующие наблюдения.

Агафья Тихоновна:

сидела с опущенными глазами 25 минут;

благосклонно смотрела на Никанора Ивановича 14 раз;

благосклонно смотрела на Ивана Кузьмича 5 раз;

благосклонно смотрела на Ивана Павловича 8 раз;

благосклонно смотрела на Балтазара Балтазарыча 5 раз.

Представим это в виде таблицы.


^ Таблица 4.1

Распределение взгляда Агафьи Тихоновны между 4 женихами


Женихи

Никанор Иванович

Иван Кузьмич

Иван

Павлович

Балтазар

Балтазарыч

Всего взглядов

Количество

взглядов

14

5

8

5

32

Теперь нам нужно сопоставить полученные эмпирические частоты с теоретическими. Если Агафья Тихоновна никому не отдает предпоч­тения, то данное распределение показателя направленности ее взгляда не будет отличаться от равномерного распределения: она на всех смот­рит примерно с одинаковой частотой. Но если достоинства одного из женихов чаще притягивают ее взор, то это может быть основанием для матримониального решения.

Гипотезы

Н0: Распределение взглядов Агафьи Тихоновны между женихами не отличается от равномерного распределения.

H1: Распределение взглядов Агафьи Тихоновны между женихами отли­чается от равномерного распределения.


Теперь нам нужно определить теоретическую частоту взгляда при равномерном распределении. Если бы все взгляды невесты распределя­лись равномерно между 4-мя женихами, то, по-видимому, каждый из них получил бы по ¼ всех её взглядов.

Переведем эти рассуждения на более формализованный язык. Теоретическая частота при сопоставлении эмпирического распределения с равномерным определяется по формуле:

4Все приведенные эмпирические частоты на самом деле пропорциональны количе­ству благосклонных высказываний невесты о женихах в тексте пьесы.




где n - количество наблюдений;

k - количество разрядов признака.

В нашем случае признак - взгляд невесты, направленный на ко­го-либо из женихов; количество разрядов признака - 4 направления взгляда, по количеству женихов; количество наблюдений - 32.

Итак, в нашем случае:



Теперь мы будем сравнивать с этой теоретической частотой все эмпирические частоты.



Никанор Иван Иван Балтазар

Иванович Кузьмич Павлович Балтазарыч

Рис. 4.6. Сопоставление эмпирических частот взгляда Агафьи Тихоновны на каждого из женихов (столбики гистограммы) с теоретической частотой {горизонтальная планка); темной штриховкой отмечены области расхождений между эмпирическими и теоретиче­скими частотами

На Рис. 4.6 сопоставления эмпирических частот с теоретической представлены графически. Похоже, что области расхождений достаточ­но значительны, и Никанор Иванович явно опережает других женихов. Иван Павлович еще может на что-то надеяться, но для Ивана Кузьми­ча и Балтазара Балтазарыча отставка, по-видимому, неизбежна.

Однако для того, чтобы доказать неравномерность полученного эмпирического распределения, нам необходимо произвести точные рас­четы. В методе χ2 они производятся с точностью до сотых, а иногда и до тысячных долей единицы.


Расчеты будем производить в таблице по алгоритму.

АЛГОРИТМ 13

Расчет критерия χ2

1.Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).

2. Рядом с каждой эмпирической частотой записать теоретическую частоту (второй столбец).

  1. Подсчитать разности между эмпирической и теоретической частотой по каждому разряду (строке) и записать их в третий столбец.

  2. Определить число степеней свободы по формуле:

ν=k-1

где k - количество разрядов признака.

Если ν=l, внести поправку на "непрерывность".

  1. Возвести в квадрат полученные разности и занести их в четвертый столбец.

  2. Разделить полученные квадраты разностей на теоретическую часто­ ту и записать результаты в пятый столбец.

  3. Просуммировать значения пятого столбца. Полученную сумму обо­значить как χ2 эмп

  4. Определить по Табл. IX Приложения 1 критические значения для данного числа степеней свободы V.

Если χ2 эмп меньше критического значения, расхождения между рас­пределениями статистически недостоверны.

Если χ2 эмп критическому значению или превышает его, рас­хождения между распределениями статистически достоверны.


Все вычисления для данного случая отражены в Табл. 4.2.


Таблица 4.2

Расчет критерия χ2 эмп при сопоставлении эмпирического

распределения взгляда Агафьи Тихоновны между женихами с равномерным распределением



Разряды-женихи

Эмпирическая частота взгляда (f’эj)

Теоретическая частота (fт)

(f’эj - fт)

(f’эj -fт)2

(f’эj -fт)/ƒт

1

Никанор Иванович

14

8

+6

36

4,500

2

Иван Кузьмич

5

8

-3

9

1,125

3

Иван Павлович

8

8

0

0

0

4

Балтазар Балтазарович

5

8

-3

9

1,125




Суммы

32

32

0




6,750

Может показаться, что удобнее суммировать все возведенные в квадрат разности между эмпирическими и теоретическими частотами, а затем уже эту сумму разделить на ƒт. В данном случае это возможно, так как ƒт для всех разрядов одинакова. Однако позже мы увидим, что так бывает далеко не всегда. Нужно быть внимательными или, экономя свое внимание, просто взять за правило всякий раз вычислять эi – ƒт)2 т до суммирования.

Необходимо также всякий раз убеждаться в том, что сумма раз­ностей между эмпирическими и теоретической частотами (сумма по третьему столбцу) равна 0. Если это равенство не соблюдается, это означает, что в подсчете частот или разностей допущена ошибка. Необ­ходимо найти и устранить её прежде чем переходить к дальнейшим расчетам.


Алгоритм вычислений, таким образом, выражается формулой:





где fэj - эмпирическая частота по j-тому разряду признака; ƒт - теоретическая частота;

j - порядковый номер разряда;

k - количество разрядов признака.


В данном случае:




Для того, чтобы установить критические значения χ2 , нам нужно определить число степеней свободы ν по формуле:

v=k-l

где k - количество разрядов.

В нашем случае ν=4-l=3.

По Табл. IX Приложения 1 определяем:



Построим "ось значимости". Ясно, что чем больше отклонения эмпирических частот от теоретической, тем больше будет величина χ2. Поэтому зона значимости располагается справа, а зона незначимости - слева.



К сожалению, на основании этих данных тетушка не сможет дать Агафье Тихоновне обоснованного ответа:

Χ2эмп < χ2кр.


Ответ: Но принимается. Распределение взгляда Агафьи Тихоновны между женихами не отличается от равномерного распределения.

Но, допустим, тетушка на этом не успокоилась. Она стала вни­мательно следить за тем, сколько раз племянница упомянет в разговоре каждого из женихов. Допустим, ею получено следующее распределение упоминаний Агафьей Тихоновной женихов и их достоинств:

Никанор Иванович - 15 раз,

Иван Кузьмич - 6 раз,

Иван Павлович - 9 раз,

Балтазар Балтазарыч - 6 раз.

Тетушка уже видит, что, похоже, Никанор Иванович ("уж такой деликатный, а губы, мать моя, - малина, совсем малина") пользуется большей благосклонностью Агафьи Тихоновны, чем все остальные же­нихи. У нее есть два пути, чтобы это доказать статистически.

1) Суммировать все проявления благосклонности со стороны невесты: взгляды + упоминания в разговоре, - и сопоставить полученное рас­пределение с равномерным. Поскольку количество наблюдений воз­росло, есть шанс, что различия окажутся достоверными.

2) Сопоставить два эмпирических распределения - взгляда и упомина­ний в разговоре, - с тем, чтобы показать, что они совпадают между собой, то есть и во взглядах, и в словах Агафья Тихоновна придер­живается одинаковой системы предпочтений.

Проанализируем оба варианта сопоставлений.

В первом случае мы будем решать уже известную нам задачу со­поставления эмпирического распределения с теоретическим. Во втором случае мы будем сопоставлять два эмпирических распределения.

Первый вариант развития шутливого примера: увеличение количества наблюдений

Вначале создадим таблицу эмпирических частот, в которой будут суммированы все замеченные проявления благосклонности невесты.

^ Таблица 4.3

Распределение проявлений благосклонности невесты между женихами


Женихи

Никанор Иванович

Иван Кузьмич

Иван Павлович

Балтазар Балтазарыч

Всего

Количество проявлений


29


11


17


11


68

Теперь сформулируем гипотезы.

Н0: Распределение проявлений благосклонности невесты (взгляды и упо­минания в разговоре) не отличается от равномерного распределения.

Н1: Распределение проявлений благосклонности невесты отличается от равномерного распределения.

Все расчеты произведем в таблице по алгоритму.

Таблица 4.4

Расчет критерия X2 при сопоставлении проявлений благосклонности Агафьи Тихоновны с равномерным распределением


Разряды-женихи

Эмпирическая частота взгляда (f’эj)

Теоретическая частота (fт)

(f’эj - fт)

(f’эj -fт)2

(f’эj -fт)/ƒт

1

Никанор Иванович

29

17

12

144

8,47

2

Иван Кузьмич

11

17

-6

36

2,12

3

Иван Павлович

17

17

0

0

0

4

Балтазар Балтазарович

11

17

-6

36

2,12




Суммы

68

68

0




12,71


ƒт=n/k=68/4=17

v=k-l=3




Х2 эмп = 12,71
Х2 эмп2 кр.

Ответ: Но отклоняется, принимается Н1. Распределение прояв­лений благосклонности невесты между женихами отличается от равно­мерного распределения (р<0,01).

На этом примере мы убедились, что увеличение числа наблюде­ний повышает достоверность результата, если, конечно, в новых наблю­дениях воспроизводится прежняя тенденция различий.

Второй вариант развития шутливого примера: сопоставление двух эмпирических распределений


Теперь мы должны ответить на вопрос, одинаковая ли система предпочтений проявляется во взгляде Агафьи Тихоновны и ее словах?

Сформулируем гипотезы.

H0: Распределения невербально и вербально выражаемых предпочтений не различаются между собой.

H1: Распределения невербально и вербально выражаемых предпочтений различаются между собой.


Для подсчета теоретических частот нам теперь придется соста­вить специальную таблицу (Табл. 4.5). Ячейки в двух столбцах слева обозначим буквами. Для каждой из них теперь будет подсчитана особая, только к данной ячейке относящаяся, теоретическая частота. Это обу­словлено тем, что количества взглядов и словесных отзывов невесты о женихах неравны; взглядов 32, а словесных отзывов - 36. Мы должны всякий раз учитывать эту пропорцию.


^ Таблица 4.5

Эмпирические и теоретические частоты взглядов и упоминаний о женихах


Разряды-женихи

Эмпирические частоты


Суммы

Теоретические частоты

Взгляда

Упоминаний в разговоре

Взгляда

Упоминаний в разговоре

1

Ник.Ив.

14 А

15 Б

29

13,63 А

15,37 Б

2

Ив.Куз.

5 В

6 Г

11

5,17 В

5,83 Г

3

Ив.Павл.

8 Д

9 Е

17

7,99 Д

9,01 Е

4

Бал.Бал.

5 Ж

6 3

11

5,17 Ж

5,83 З

Суммы:

32

36

68

32

36


Рассчитаем эту пропорцию. Всего проявлений благосклонности отмечено 68, из них 32 - взгляды и 36 - словесные высказывания. До­ля взглядов составит 32/68=0,47; доля упоминаний - 36/68=0,53.

Итак, во всех строках взгляды должны были бы составлять 0,47 всех проявлений по данной строке, а упоминания в разговоре - 0,53 всех проявлений. Теперь, зная суммы проявлений по каждой строке, мы можем рассчитать теоретические частоты для каждой ячейки

Табл. 4.5.


ƒА теор = 29*0,47=13,63

ƒБ теор = 29*0,53=15,37

ƒВ теор = 11*0,47=5,17

ƒГ теор = 11*0,53=5,83

ƒД теор = 17*0,47=7,99

ƒЕ теор = 17*0,53=9,01

ƒЖ теор = 11*0,47=5,17

ƒЗ теор = 11*0,53=5,83

Ясно, что сумма теоретических частот по строкам будет равнять­ся сумме всех проявлений по данной строке. Например,

ƒА теор + ƒБ теор =13,63+15,37=29

ƒВ теор + ƒГ теор =5,17+5,83=11

ƒД теор + ƒЕ теор =7,99+9,01=17 и.т.д.


При такого рода подсчетах лучше всякий раз себя проверить. Теперь мы можем вывести общую формулу подсчета ƒтеор для сопостав­ления двух или более эмпирических распределений:

ƒтеор = (Сумма частот по * (Сумма частот по

соответствующей строке) соответствующему столбцу)

(Общее количество наблюдений)


Соответствующими строкой и столбцом будут та строка и тот столбец, на пересечении которых находится данная ячейка таблицы. Теперь нам лучше всего сделать развертку Табл. 4.5, представив все ячейки от А до Ж в виде первого столбца - это будет столбец эмпири­ческих частот. Вторым столбцом будут записаны теоретические часто­ты. Далее будем действовать по уже известному алгоритму. В третьем столбце будет представлены разности эмпирических и теоретических частот, в четвертом - квадраты этих разностей, а в пятом - результаты деления этих квадратов разностей на соответствующие каждой строке теоретические частоты. Сумма в нижнем правом углу таблицы и будет представлять собой эмпирическую величину χ2 (Табл. 4.6).

Таблица 4.6

Расчет критерия χ2 при сопоставлении распределений невербальных и вербальных признаков благосклонности невесты

Ячейки таблицы частот

Эмпирическая частота (f’эj)

Теоретическая частота (fт)

(f’эj - fт)

(f’эj -fт)2

(f’эj -fт)/ƒт

1

А

14

13,63

+0,37

0,14

0,01

2

Б

15

15,37

-0,37

0,14

0,01

3

В

5

5,17

-0,17

0,03

0,01

4

Г

6

5,83

+0,17

0,02

0,00

5

Д

8

7,99

+0,01

0,00

0,00

6

Е

9

9,01

-0,01

0,00

0,00

7

Ж

5

5,17

-0,17

0,03

0,01

8

З

6

5,83

+0,17

0,02

0,00




Суммы

68

68

0




0,04


Число степеней свободы при сопоставлении двух эмпирических распределений определяется по формуле:

v=(k-l)*(c-l),

где k - количество разрядов признака (строк в таблице эмпири­ческих частот);

с - количество сравниваемых распределений (столбцов в таб­лице эмпирических частот).


В данном случае таблицей эмпирических частот является левая, эмпирическая часть таблицы 4.5, а не на ее развертка (Табл. 4.6).

Количество разрядов - это количество женихов, поэтому k=4.

Количество сопоставляемых распределений с=2.

Итак, для данного случая,

v=(4-l)*(2-l)=3

Определяем по Табл. IX Приложения 1 критические значения

Для ν=3:





χ2эмп=0,04

χ2 < χ2 кр


Ответ: Но принимается. Распределения невербально и вербально выражаемых невестой предпочтений не различаются между собой.

Итак, Агафья Тихоновна весьма последовательна в проявлении своих предпочтений, хотя, по-видимому, сама этого пока не замечает.


Иллюстрация 2






Третий вариант развития шутливого примера: сопоставление встречных выборов


К сожалению, в этом пункте мы от комедии вынуждены перейти к драме - истинной драме любви. Ибо, судя по тексту пьесы, прояв­ляемые женихами признаки влюбленности и симпатии по отношению к невесте отнюдь не соответствуют ее собственной системе предпочтений. У Ивана Павловича, а, главное, у Никанора Ивановича, которому не­вестой отдается столь явное предпочтение, проскальзывают в разговоре по большей части как раз отрицательные и задумчиво-неодобрительные отзывы о невесте: "Нос велик... Нет, не то. Не то... Я даже думаю, что вряд ли она знакома с обхождением высшего общества. Да и знает ли она еще по-французски".


Благосклонных отзывов ("А сказать правду - мне понравилась она потому, что полная женщина" и т. п.) поступило:

от Никанора Ивановича - ни одного;

от Ивана Кузьмича -15;

от Ивана Павловича – 6;

от Балтазара Балтазарыча - 18.


Попробуем ответить на вопрос: согласуются ли распределения благосклонных отзывов невесты о женихах и женихов о невесте?

Мы видим, что это действительно особая задача. Мы сопостав­ляем два эмпирических распределения с совпадающей классификацией разрядов, но в одном случае это распределение реакций одного челове­ка на четверых других, а в другом случае это реакции четырех человек на одного и того же человека.

Такая модель взаимных реакций может использоваться отнюдь не только в области брачных консультаций, но ив решении задач "построения команды", выбора заместителя, подбора пар в тех видах деятельности, где требуется активное постоянное взаимодействие, в ис­следованиях социальной перцепции и взаимного влияния, в тренинге сенситивности и др.

^ Сформулируем гипотезы.

Н0: Распределение положительных отзывов невесты совпадает с рас­пределением положительных отзывов женихов.

H1: Распределение положительных отзывов невесты не совпадает с распределением положительных отзывов женихов.


Построим таблицу для подсчета теоретических частот.


^ Таблица 4.7

Эмпирические и теоретические частоты положительных высказываний невесты о женихах и женихов о невесте



Разряды-женихи

Эмпирические частоты


Суммы

Теоретические частоты

Положительных высказываний невесты о женихах

Положительных высказываний женихов о невесте

Положительных высказываний невесты о женихах

Положительных высказываний женихов о невесте

1

Ник.Ив.

15 А

0 Б

15

7,20 А

7,80 Б

2

Ив.Куз.

6 В

15 Г

21

10,08 В

10,92 Г

3

Ив.Павл.

9 Д

6 Е

15

7,20 Д

7,80 Е

4

Бал.Бал.

6 Ж

18 3

24

11,52 Ж

12,48 З

Суммы:

36

39

75

36

39



Теоретические частоты рассчитываем по уже известной формуле:


ƒтеор = (Сумма частот по * (Сумма частот по

соответствующей строке) соответствующему столбцу)

(Общее количество наблюдений)


ƒА теор = 15*36/75=7,20

ƒБ теор = 15*39/75=7,80

ƒВ теор = 21*36/75=10,08

ƒГ теор = 21*39/75=10,92

ƒД теор = 15*36/75=7,20

ƒЕ теор = 15*39/75=7,80

ƒЖ теор = 24*36/75=11,52

ƒЗ теор = 24*39/75=12,48


Суммы теоретических частот по строкам совпадают. Все даль­нейшие расчеты выполним в таблице по алгоритму.


Таблица 4.8

Насчет критерия % при сопоставлении распределении высказывании невесты о женихах и женихов о невесте


Ячейки таблицы частот

Эмпирическая частота (f’эj)

Теоретическая частота (fт)

(f’эj - fт)

(f’эj -fт)2

(f’эj -fт)/ƒт

1

А

15

7,20

+7,80

60,84

8,45

2

Б

0

7,80

-7,80

60,84

7,80

3

В

6

10,08

-4,08

16,65

1,65

4

Г

15

10,92

+4,08

16,65

1,52

5

Д

9

7,20

+1,80

3,24

0,45

6

Е

6

7,80

-1,80

3,24

0,42

7

Ж

6

11,52

-5,52

30,47

2,64

8

З

18

12,48

+5,52

30,47

2,44




Суммы

75

75

0




25,37



Определим число степеней свободы ν по количеству строк k и

столбцов с в левой части Табл. 4.7: (k=4, c=2).

ν=(k-1)*(c-1)=3

Критические значения χ2 для ν =3 нам уже известны:





χ2эмп=25,37

χ2эмп2кр


Omвem: H0 отвергается. Принимается Н1.

Распределение поло­жительных отзывов предпочтений невесты не совпадает с распределени­ем положительных отзывов женихов (р<0,01).

Итак, если бы Иван Кузьмич Подколесин не сбежал, Агафью Тихоновну могло бы ожидать не меньшее разочарование: предпочитае­мый ею Никанор Иванович, "тонкого поведения человек", ее отвергает.

Мы не рассмотрели лишь третью группу возможных гипотез в методе χ2. Они, как мы помним, касаются сопоставлений одновременно 3 и более распределений. Принцип расчетов там такой же, как и при сопоставлении двух эмпирических распределений. Это касается и фор­мулы расчета теоретических частот, и алгоритма последующих расчетов.

Рассмотрим особые случаи в применении метода χ2.

Особые случав в применении критерия

  1. В случае, если число степеней свободы v=l, т. е. если признак при­нимает всего 2 значения, необходимо вносить поправку на непре­рывность5.

  2. Если признак варьирует в широком диапазоне (например, от 10 до 140 сек. и т.п.), возникает необходимость укрупнять разряды.


5 Поправка на непрерывность при V=l предназначена для корректировки несоот­ветствия между дискретным биномиальным распределением и непрерывным рас- пределением (Рунион Р., 1982, с. 39.)


^ Особый случай 1: поправка на непрерывность для призна­ков, которые принимают всего 2 значения

Поправка на непрерывность вносится при следующих условиях:


а) когда эмпирическое распределение сопоставляется с равномерным распределением, и количество разрядов признака k=2, a v=k—1=1;


6) когда сопоставляются два эмпирических распределения, и количество разрядов признака равно 2, т.е. и количество строк k=2. и количест­во столбцов с=2, и v=(k—1)*(с—1)=1.


Вариант "а": поправка на непрерывность при сопоставлении эмпириче­ского распределения с равномерным. Это тот случай сопоставлений, когда мы, говоря простым языком, проверяем, поровну ли распредели­лись частоты между двумя значениями признака.

Пример с поправкой на непрерывность.

В исследовании порогов социального атома6 профессиональных психологов просили определить, с какой частотой встречаются в их за­писной книжке мужские и женские имена коллег-психологов. Попыта­емся определить, - отличается ли распределение, полученное по записной книжке женщины-психолога X, от равномерного распределения. Эмпи­рические частоты представлены в Табл. 4.9

6 Социальный атом "... состоит из всех отношений между человеком и окружаю­щими его людьми, которые в данный момент тем или иным образом с ним связа­ны" (Moreno J. L, 1951.)

Таблица 4.9

Эмпирические частоты встречаемости имен мужчин и женщин в записной книжке психолога X


Мужчин

Женщин

Всего человек

22

45

67

^ Сформулируем гипотезы.

H0: Распределение мужских и женских имен в записной книжке X не отличается от равномерного распределения.

H1: Распределение мужских и женских имен в записной книжке X от­личается от равномерного распределения.


Количество наблюдений n=67; количество значений признака k=2.

Рассчитаем теоретическую частоту: ƒтеор = n/k=33.5

Число степеней свободы v=k—1=1.


Далее все расчеты производим по известному алгоритму, но с одним добавлением: перед возведением в квадрат разности частот мы должны уменьшить абсолютную величину этой разности на 0,5 (см. Табл. 4.10, четвертый столбец).


Таблица 4.10

Расчет критерия χ2 при сопоставлении эмпирического распределения имен с теоретическим равномерным распределением

Разряды – принадлежность к тому или иному полу

Эмпирическая частота

(ƒэj)

Теоретическая частота

(ƒт)

(ƒэj-ƒт)

(ƒэj-ƒт-0.5)

(ƒэj-ƒт-0.5)2

(ƒэj-ƒт-0.5)2

(ƒт)

1

Мужчины

22

33,5

-11,5

11

121

3,61

2

Женщины

45

33,5

+11,5

11

121

3,61

Суммы:

67

67

0







7,22


Для v=l определяем по Табл. IX Приложения 1 критические значения:





χ2эмп=7,22

χ2эмп2кр


Ответ: Но отклоняется, принимается Н1. Распределение муж­ских и женских имен в записной книжке психолога X отличается от равномерного распределения (р<0,01).


Вариант "б": поправка на непрерывность при сопоставлении двух эм­пирических распределений


Попытаемся определить, различаются ли распределения мужских и женских имен у психолога X и психолога С, тоже женщины. Эмпи­рические частоты приведены в Табл. 4.11.


^ Таблица 4.11

Эмпирические частоты встречаемости имен мужчин и женщин в записных книжках психолога X, и психолога С.





Мужчин

Женщин

Всего человек

Психолог X. Психолог С.

22 А

59 В

45 Б

109 Г

67

168

Суммы

81

154

235

Сформулируем гипотезы. H0: Распределения мужских и женских имен в двух записных книжках не различаются.

H1: Распределения мужских и женских имен в двух записных книжках различаются между собой.

Теоретические частоты рассчитываем по уже известной формуле:

ƒтеор = (Сумма частот по * (Сумма частот по

соответствующей строке) соответствующему столбцу)

(Общее количество наблюдений)


А именно, для разных ячеек таблицы эмпирических частот,

ƒА теор = 67*81/235=23,09

ƒБ теор = 67*154/235=43,91

ƒВ теор = 168*81/235=57,91

ƒГ теор = 168*154/235=110,09

Число степеней свободы v=(k—l)*(c—1)=1

Все дальнейшие расчеты проводим по алгоритму (Табл. 4.12)

^ Таблица 4.12

Расчет критерия при сопоставлении двух эмпирических распределений мужских и женских имен

Ячейки таблицы эмпирических частот

Эмпирическая частота

(ƒэj)

Теоретическая частота

(ƒт)

(ƒэj-ƒт)

(ƒэj-ƒт-0.5)

(ƒэj-ƒт-0.5)2

(ƒэj-ƒт-0.5)2

(ƒт)

1

А

22

23,09

-1,09

0,59

0,35

0,015

2

Б

45

43,91

+1,09

0,59

0,35

0,008

3

В

59

57,91

+1,09

0,59

0,35

0,006

4

Г

109

110,09

-1,09

0,59

0,35

0,03

Суммы:

235

235,00

0







0,032


Критические значения χ2 при ν=1 нам известны по предыдущему примеру:





χ2эмп=0,03

χ2эмп < χ2кр


Ответ: H0 принимается. Распределения мужских и женских имен в записных книжка двух психологов совпадают.

Поправки на непрерывность и всех остальных подсчетов можно избежать, если использовать по отношению к подобного рода задачам метод ф* Фишера (см. параграф 5.4).


^ Особый случай 2; укрупнение разрядов признака, который варьирует в широкой диапазоне значений

Если признак варьирует в широком диапазоне значений, напри­мер, от 10 до 140 сек или от 0 до 100 мм и т. п., то вряд ли мы смо­жем принимать каждое значение признака за самостоятельный разряд: 10 сек, 11 сек, 12 сек и т. д. до 100 сек. Одно из ограничений крите­рия X2 состоит в том, что теоретически на каждый разряд должно при­ходиться не менее 5 наблюдений: ƒтеор >5. Если у признака 90 значений, и каждое из них принимается за самостоятельный разряд, то необходи­мо иметь не менее 5*90=450 наблюдений! Если же наблюдений меньше 450, то придется укрупнять разряды до тех пор, пока на каждый раз­ряд не будет приходиться по 5 наблюдений. Это не означает, что в каждом разряде реально должно быть 5 наблюдений; это означает, что теоретически на каждый разряд их приходится по 5. Рассмотрим это на примере.


^ Пример с укрупнением разрядов признака

Тест Мюнстерберга для измерения избирательности перцептив­ного внимания в адаптированном варианте М.Д. Дворяшиной (1976) предъявлялся студентам факультета психологии Ленинградского универ­ситета (n1=156) и артистам балета Мариинского театра (n2=85). Мате­риал методики состоит из бланка с набором букв русского алфавита, в случайном порядке перемежающихся. Среди этого фона скрыто 24 сло­ва разной степени сложности: "факт", "хоккей", "любовь", "конкурс", "психиатрия" и т.п. Задача испытуемого возможно быстрее отыскать их и подчеркнуть (Дворяшина М.Д., 1976, с. 124). Совпадают ли рас­пределения количества ошибок (пропусков слов) в двух выборках (Табл. 4.13)?

Таблица 4.13

Эмпирические частоты пропуска слов в тесте Мюнстерберга в двух выборках испытуемых (по данным М.Д. Дворяшиной, Е.В. Сидоренко, 1973)

Разряды

Эмпирические частоты пропусков слов

В группе студентов

(n1 =156)

В группе артистов балета

(n2 =85)

Суммы

1

0 пропусков

93

22

115

11

1 пропуск

27

20

47

111

2 пропуска

11

16

27



3 пропуска

15

4

19

У

4 пропуска

5

3

8

У1

5 пропусков

3

11

14

У11

6 пропусков

2

3

5

У111

7 пропусков

0

3

3



8 пропусков

0

2

2

Х

9 пропусков

0

1

1

Суммы

156

85

241


^ Сформулируем гипотезы.

H0: Распределения ошибок (пропусков слов) в выборках студентов и артистов балета не различаются между собой.

H1: Распределения ошибок (пропусков слов) в выборках студентов и артистов балета различаются между собой.


Прежде чем перейти к расчету теоретических частот, обратим внимание на последние 4 значения признака, от 6 пропусков и ниже. Очевидно, что ƒтеор для любой из ячеек последних 4 строк таблицы бу­дет меньше 5. Например, для ячейки, отмеченной кружком:

ƒтеор = (Сумма частот по * (Сумма частот по

соответствующей строке) соответствующему столбцу)

(Общее количество наблюдений)


ƒтеор=5*85/241=1,763


Полученная теоретическая частота меньше 5.

Для того, чтобы решить, какие разряды нам следует укрупнить,
чтобы ƒтеор была не меньше 5, выведем формулу расчета минимальной суммы частот по строке по формуле:


Минимальная (ƒтеор минимальная)*(общее количество наблюдений)

сумма = ______________________________________________

по строке сумма частот по столбцу с наименьшим n


В данном случае столбцом с наименьшим количеством наблюде­ний является столбец, относящийся к выборке артистов балета (n=85).

Определим минимальную сумму частот для каждой строки:

Минимальная сумма по строке =5*241/85=14,16


Мы видим, что для получения такой суммы нам недостаточно объединения последних 4 строк Табл. 4.13, так как сумма частот по ним меньше 14 (5+3+2+1=11), а нам необходима сумма частот, пре­вышающая 14. Следовательно, придется объединять в один разряд пять нижних строк Табл. 4.13: теперь любое количество пропусков от 5 до 9 будет составлять один разряд.

Однако это еще не все. Мы видим, далее, что в строке "4 про­пуска" сумма составляет всего 8. Значит, ее необходимо объединить со следующей строкой. Теперь и 3, и 4 пропуска будут входить в один разряд. Все остальные суммы по строкам больше 14, поэтому мы не нуждаемся в дальнейшем укрупнении разрядов.

Эмпирические частоты по укрупненным разрядам представлены в Табл. 4.14

Таблица 4.14

Эмпирические частоты пропуска слов по укрупненным разрядам в двух выборках испытуемых


Разряды

Эмпирические частоты пропуска слов


Суммы

В группе студентов (n1=156)

В группе артистов (n2=85)

1

0 пропусков

93

А

22

Б

115

11

1 пропуск

27

В

20

Г

47

111

2 пропуска

11

Д

16

Е

27



3-4 пропуска

20

Ж

7

З

27

У

5-9 пропусков

5

И

20

К

25

Суммы

156




85




241


Исследователю бывает огорчительно терять информацию, заведо­мо утрачиваемую при укрупнении разрядов. Например, в данном случае нас может интересовать, удалось ли сохранить специфический для вто­рой выборки спад частот на 3 и 4 пропусках и резкий их подъем на 5 пропусках (Рис. 4.7).

С
равним графики на Рис. 4.7 и Рис. 4.8. Мы видим, что спад частот во второй выборке на 3-х и 4-х пропусках сохранился, а спад на 2-х пропусках в первой выборке стал еще более заметным. В то же время все возможные различия в частотах в диапазоне от 5-и до 9-и пропусков теперь оцениваются только глобально, по

Рис.4.7. Графики изменения эмпирических частот пропусков по «естественным»разрядам: а) в выборке студентов; б) в выборке артистов балета.


соотношению об­щих сумм частот в этих диапазонах. По графику на Рис. 4.8 мы уже не можем определить, какое максимальное количество пропусков встре­чается в первой группе и какое - во второй. Сопоставление распределе­ний на этом конце становится более грубым.



Рис. 4.8. Графики изменения эмпирических частот по укрупненным разрядам: а) в вы­борке студентов; 6) в выборке артистов балета

Если бы у нас было больше испытуемых в выборке артистов ба­лета, то, возможно, удалось бы сохранить подъем частоты на 5-и про­пусках. Сейчас же нам придется довольствоваться сопоставлением по данным укрупненным разрядам.

Перейдем к подсчету теоретических частот для каждой ячейки Табл. 4.14

ƒА теор = 115*156/241=74,44

ƒБ теор = 115*85/241=40,56

ƒВ теор = 47*156/241=30,41

ƒГ теор = 47*85/241=16,59

ƒД теор = 27*156/241=17,47

ƒЕ теор = 27*85/241=9,53

ƒЖ теор = 27*156/241=17,47

ƒЗ теор = 27*85/241=9,53

ƒИ теор 25*156/241=16,18

ƒК теор 25*85/241=8,82


Определим количество степеней свободы ν по формуле:

v=(k-l)*(c-l)

где k - количество строк (разрядов),

с - количество столбцов (выборок).

Для данного случая:

v=(5-l)*(2-l)=4

Все дальнейшие расчеты произведем в таблице по Алгоритму 13. Поправка на непрерывность не требуется, так как V>1.

Таблица 4.15

Расчет критерия X2 при сопоставлении двух эмпирических распределе­ний пропусков слов в тесте Мюнстерберга (n1=156; n2 =85)

Ячейки таблицы частот

Эмпирическая частота (f’эj)

Теоретическая частота (fт)

(f’эj - fт)

(f’эj -fт)2

(f’эj -fт)/ƒт

1

А

93

74,44

18,56

344,47

4,63

2

Б

22

46,56

-18,56

344,47

8,49

3

В

27

30,41

-3,41

11,63

0,38

4

Г

20

16,59

3,41

11,63

0,70

5

Д

11

17,47

-6,47

41,86

2,40

6

Е

16

9,53

6,47

41,86

4,40

7

Ж

20

17,47

2,53

6,401

0,37

8

З

7

9,53

-2,53

6,401

0,67

9

И

5

16,18

-11,18

124,99

7,72

10

К

20

8,82

11,18

124,99

14,17




Суммы

241

241

0,00




43,95


По Табл. IX Приложения 1 определяем критические значения при ν=4:




χ2эмп=43,95

χ2эмп > χ2кр


Ответ: Но отвергается. Принимается H1. Распределения про­пусков слов в выборках студентов и артистов балета различаются меж­ду собой (р<0,01).

В распределении ошибок у артистов балета можно заметить два выраженных максимума (0 пропускав и 5 пропусков), что может ука­зывать на два возможных источника ошибок7.

7Целесообразно было бы проверить совпадение распределения ошибок в обеих выборках с распределением Пуассона. Закону Пуассона подчиняются распределе­ния редких событий, приходящихся 0, 1, 2,... раз на сотни и тысячи наблюдений. Однако в данном случае эта модель неприменима: средняя и дисперсия не равны друг другу и составляют, соответственно, 0,91 и 1,96 в первой выборке и 2,29 и 5,43 во второй выборке.


Вопрос 3

λ - критерий Колмогорова-Смирнова


Назначение критерия

Критерий λ предназначен для сопоставления двух распределений:

а) эмпирического с теоретическим, например, равномерным или нормальным;

б) одного эмпирического распределения с другим эмпирическим распределением.


Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.

^ Описание критерия

Если в методе χ2 мы сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь мы сопоставляем сначала часто­ты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т. д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты.

Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверны­ми. В формулу критерия λ включается эта разность. Чем больше эмпи­рическое значение λ, тем более существенны различия.

Гипотезы -

Н0: Различия между двумя распределениями недостоверны (судя по точке максимального накопленного расхождения между ними).

H1: Различия между двумя распределениями достоверны (судя по точке максимального накопленного расхождения между ними).

^ Графическое представление критерия

Рассмотрим для иллюстрации распределение желтого (№4) цвета в 8-цветном тесте М. Люшера. Если бы испытуемые случайным обра­зом выбирали цвета, то желтый цвет, так же, как и все остальные, равновероятно мог бы занимать любую из 8-и позиции выбора. На практике, однако, большинство испытуемых помещают этот цвет, "цвет ожидания и надежды" на одну из первых позиций ряда.

На Рис. 4.9 столбиками представлены относительные частоты8 попадания желтого цвета сначала на 1-ю позицию (первый левый стол­бик), затем на 1-ю и 2-ю позицию (второй столбик), затем на 1-ю, 2-ю и 3-ю позиции и т. д. Мы видим, что высота столбиков постоянно воз­растает, так как они отражают относительные частоты, накопленные к данной позиции. Например, столбик на 3-й позиции имеет высоту 0,51. Это означает, что на первые три позиции желтый цвет помещают 51% испытуемых.

8 Относительная частота, или частость, - это частота, отнесенная к общему коли­честву наблюдении; в данном случае это частота попадания желтого цвета на дан­ную позицию, отнесенная к количеству испытуемых. Например, частота попадания желтого цвета на 1-ю позицию ƒ=24; количество испытуемых n=102; относительная частота ƒ*=ƒ/n=О,235.


Прерывистой линией на Рис. 4.9 соединены точки, отражающие накопленные частоты, которые наблюдались бы, если бы желтый цвет с равной вероятностью попадал на каждую из 8-и позиций. Сплошными линиями обозначены расхождения между эмпирическими и теоретически­ми относительными частотами. Эти расхождения обозначаются как d.



Рис 4.9. Сопоставления в критерии λ: стрелками отмечены расхождения между эмпирическими и теоретическими накоплениями относительными частотами по каждому разряду

Максимальное расхождение на Рис. 4.9 обозначено как dmax Именно эта, третья позиция цвета, и является переломной точкой, опре­деляющей, достоверно ли отличается данное эмпирическое распределе­ние от равномерного. Мы проверим это при рассмотрении Примера 1.

Ограничения критерия λ

1. Критерии требует, чтобы выборка была достаточно большой. При сопоставлении двух эмпирических распределений необходимо, что­бы n1,2 >50. Сопоставление эмпирического распределения с теоре­тическим иногда допускается при n>5 (Ван дер Варден Б.Л., 1960; Гублер Е.В., 1978).


2. Разряды должны быть упорядочены по нарастанию или убыванию какого-либо признака. Они обязательно должны отражать какое-то однонаправленное его изменение. Например, мы можем за разряды принять дни недели, 1-й, 2-й, 3-й месяцы после прохождения курса терапии, повышение температуры тела, усиление чувства недостаточ­ности и т. д. В то же время, если мы возьмем разряды, которые случайно оказались выстроенными в данную последовательность, то и накопление частот будет отражать лишь этот элемент случайного соседства разрядов. Например, если шесть стимульных картин в ме­тодике Хекхаузена разным испытуемым предъявляются в разном порядке, мы не вправе говорить о накоплении реакций при переходе от картины №1 стандартного набора к картине №2 и т. д. Мы не можем говорить об однонаправленном изменении признака при со­поставлении категорий "очередность рождения", "национальность", "специфика полученного образования" и т.п. Эти данные представ­ляют собой номинативные шкалы: в них нет никакого однозначного однонаправленного изменения признака.

Итак, мы не можем накапливать частоты по разрядам, которые отличаются лишь качественно и не представляют собой шкалы порядка. Во всех тех случаях, когда разряды представляют собой не упо­рядоченные по возрастанию или убыванию какого-либо признака кате­гории, нам следует применять метод χ2 .


^ Пример 1: Сопоставление эмпирического распределения с теоретическим


В выборке здоровых лиц мужского пола, студентов технических и военно-технических вузов в возрасте от 19-ти до 22 лет, средний воз­раст 20 лет, проводился тест Люшера в 8-цветном варианте. Установ­лено, что желтый цвет предпочитается испытуемыми чаще, чем отверга­ется (Табл. 4.16). Можно ли утверждать, что распределение желтого цвета по 8-и позициям у здоровых испытуемых отличается от равно­мерного распределения?

Таблица 4.16

Эмпирические частоты попадания желтого цвета на каждую из 8 позиций (n=102)





Позиции желтого цвета







1

2

3 4

5

6

7

8




Эмпирические частоты

24

25

13 | 8

15

10

9

8

102

^ Сформулируем гипотезы.

H0: Эмпирическое распределение желтого цвета по восьми позициям не отличается от равномерного распределения.

H1: Эмпирическое распределение желтого цвета по восьми позициям отличается от равномерного распределения.


Теперь приступим к расчетам, постепенно заполняя результатами таблицу расчета критерия λ. Все операции лучше прослеживать по Табл. 4.17, тогда они будут более понятными.

Занесем в таблицу наименования (номера) разрядов и соответст­вующие им эмпирические частоты (первый столбец Табл. 4.17).

Затем рассчитаем эмпирические частости ƒ* по формуле:

ƒ*j = ƒ*/n


где fj - частота попадания желтого цвета на данную позицию; n - общее количество наблюдений;

j - номер позиции по порядку.

Запишем результаты во второй столбец (см. Табл. 4.17).


Теперь нам нужно подсчитать накопленные эмпирические часто­сти ∑ƒ*. Для этого будем суммировать эмпирические частости ƒ*. На­пример, для 1-го разряда накопленная эмпирическая частость будет равняться эмпирической частости 1-го разряда, Eƒ*1=0,2359 .


Для 2-го разряда накопленная эмпирическая частость будет пред­ставлять собой сумму эмпирических частостей 1-го и 2-го разрядов:

Eƒ*1+2=O,235+0,147=0,382


Для 3-го разряда накопленная эмпирическая частость будет пред­ставлять собой сумму эмпирических частостей 1-го, 2-го и 3-го разрядов:

Eƒ*1+2+3=0,235+0,147+0,128=0,510


Мы видим, что можно упростить задачу, суммируя накопленную эмпирическую частость предыдущего разряда с эмпирической частостью данного разряда, например, для 4-го разряда:

Eƒ*1+2+3+4=0,510+0,078=О,588

Запишем результаты этой работы в третий столбец.

Теперь нам необходимо сопоставить накопленные эмпирические частости с накопленными теоретическими частостями. Для 1-го разряда теоретическая частость определяется по формуле:

f*теор=1/k

9Все формулы приведены для дискретных признаков, которые могут быть выра­жены целыми числами, например: порядковый номер, количество испытуемых, ко­личественный состав группы и т.п.


где k - количество разрядов (в данном случае - позиций цвета).

Для рассматриваемого примера:

f*теор =1/8=0,125


Эта теоретическая частость относится ко всем 8-и разрядам. Действительно, вероятность попадания желтого (или любого другого) цвета на каждую из 8-и позиций при случайном выборе составляет 1/8, т.е. 0,125.

Накопленные теоретические частости для каждого разряда определяем суммированием.

Для 1-го разряда накопленная теоретическая частость равна теоретической частости попадания в разряд:

f*т1=0,125


Для 2-го разряда накопленная теоретическая частость представ­ляет собой сумму теоретических частостей 1-го и 2-го разрядов:

f*т1+2=0,125+0,125=0,250


Для 3-го разряда накопленная теоретическая частость представ­ляет собой сумму накопленной к предыдущему разряду теоретической частости с теоретической частостью данного разряда:

f*т1+2+3=0,250+0,125=0,375


Можно определить теоретические накопленные частости и путем умножения:

S f*тj= f*теор*j

где f*теор - теоретическая частость;

j - порядковый номер разряда.

Занесем рассчитанные накопленные теоретические частости в четвертый столбец таблицы (Табл. 4.17).

Теперь нам осталось вычислить разности между эмпирическими и теоретическими накопленными частостями (столбцы 3-й и 4-й). В пя­тый столбец записываются абсолютные величины этих разностей, обо­значаемые как d.

Определим по столбцу 5, какая из абсолютных величин разности является наибольшей. Она будет называться dmax. В данном случае dmax =0,135.

Теперь нам нужно обратиться к Табл. X Приложения 1 для оп­ределения критических значений dmax при n=102.

Таблица 4.17

Расчет критерия при сопоставлении распределения выборов желтого цвета с равномерным распределением (n=102)

Позиция желтого цвета

Эмпирическая частота

Эмпирическая частость

Накопленная эмпирическая частость

Накопленная теоретическая частость

Разность

1

24

0,235

0,235

0,125

0,110

2

15

0,147

0,382

0,250

0,132

3

13

0,128

0,510

0,375

0,135

4

8

0,078

0,588

0,500

0,088

5

15

0,147

0,735

0,625

0,110

6

10

0,098

0,833

0,750

0,083

7

9

0,088

0,921

0,875

0,046

8

8

0,079

1,000

1,000

0,000

Суммы

102

1,000














Для данного случая, следовательно,




Очевидно, что чем больше различаются распределения, тем больше и различия в накопленных частостях. Поэтому нам не составит труда распределить зоны значимости и незначимое™ по соответствую­щей оси:



dэмп =0,135

dэмп- dкр


Ответ: Но отвергается при р=0,05. Распределение желтого цве­та по восьми позициям отличается от равномерного распределения. Представим все выполненные действия в виде алгоритма

АЛГОРИТМ 14

Расчет абсолютной величины разности d между эмпирическим и равномерным распределениями

1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).

2. Подсчитать относительные эмпирические частоты (частости) для каждого разряда по формуле:

ƒ*эмп = ƒэмп /n

где ƒэмп - эмпирическая частота по данному разряду;

п - общее количество наблюдений.

Занести результаты во второй столбец.

3. Подсчитать накопленные эмпирические частости ∑f*j по формуле:

f*j=∑f*j -1+f*j

где ∑f*j -1 - частость, накопленная на предыдущих разрядах;

j - порядковый номер разряда;

f*j:- эмпирическая частость данного j-ro разряда.

Занести результаты в третий столбец таблицы.

4. Подсчитать накопленные теоретические частости для каждого раз­ряда по формуле:

f*тj=∑f*тj -1+f*тj

где =∑f*тj -1 - теоретическая частость, накопленная на предыдущих разрядах;

j - порядковый номер разряда;

ƒ*тj : - теоретическая частость данного разряда. Занести результаты в третий столбец таблицы.


  1. Вычислить разности между эмпирическими и теоретическими нако­пленными частостями по каждому разряду (между значениями 3-го и 4-го столбцов).

  2. Записать в пятый столбец абсолютные величины полученных раз­ностей, без их знака. Обозначить их как d.

  3. Определить по пятому столбцу наибольшую абсолютную величину разности - dmax.

  4. По Табл. X Приложения 1 определить или рассчитать критические значения dmax для данного количества наблюдений n.

Если dmax равно критическому значению d или превышает его, различия между распределениями достоверны.


Пример 2: сопоставление двух эмпирических распределений


Интересно сопоставить данные, полученные в предыдущем при­мере, с данными обследования X. Кларом 800 испытуемых (Klar H., 1974, р. 67). X. Кларом было показано, что желтый цвет является единственным цветом, распределение которого по 8 позициям не отли­чается от равномерного. Для сопоставлений им использовался метод χ2. Полученные им эмпирические частоты представлены в Табл. 4.18.

Таблица 4.18

Эмпирические частоты попадания желтого цвета на каждую из 8 пози­ций в исследовании X. Клара (по: Klar H., 1974) (п=800)


Разряды-позиции желтого цвета

1

2

3

4

5

6

7

8

Сумма

Эмпирические частоты

98

113

116

87

91

112

97

86

800

^ Сформулируем гипотезы.

Н0: Эмпирические распределения желтого цвета по 8 позициям в отечественной выборке и выборке X. Клара не различаются.

H1: Эмпирические распределения желтого цвета по 8 позициям в отечественной выборке и выборке X. Клара отличаются друг от друга.

Поскольку в данном случае мы будем сопоставлять накопленные эмпирические частости по каждому разряду, теоретические частости нас не интересуют.


Все расчеты будем проводить в таблице по алгоритму 15.


АЛГОРИТМ 15

Расчет критерия λ при сопоставления двух эмпирических распределений

  1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты, полученные в распределении 1 (первый столбец) и в распределении 2 (второй столбец).

  2. Подсчитать эмпирические частости по каждому разряду для распределения 1 по формуле:

ƒ*ээ/n1

где ƒэ - эмпирическая частота в данном разряде;

n1[ - количество наблюдений в выборке.

Занести эмпирические частости распределения 1 в третей столбец.

3. Подсчитать эмпирические частости по каждому разряду для распределения 2 по формуле:

ƒ*ээ/n2

где ƒэ - эмпирическая частота в данном разряде;

n2 - количество наблюдений во 2-й выборке.

Занести эмпирические частости распределения 2 в четвертый столбец таблицы.

4. Подсчитать накопленные эмпирические частости для распределения 1 по форму­ле:

ƒ*j =∑ƒ*j-1 +ƒ*j

где ∑ƒ*j-1 - частость, накопленная на предыдущих разрядах;

j - порядковый номер разряда;

ƒ*j-1 - частости данного разряда.

Полученные результаты записать в пятый столбец.

  1. Подсчитать накопленные эмпирические частости для распределения 2 по той же формуле к записать результат в шестой столбец.

  2. Подсчитать разности между накопленными частостями по каждому разряду.
    Записать в седьмой столбец абсолютные величины разностей, без их знака.
    Обозначить их как d.

  3. Определить по седьмому столбцу наибольшую абсолютную величину разности

4пах-

8. Подсчитать значение критерия λ по формуле:



где n1 - количество наблюдений в первой выборке;

n2 - количество наблюдении во второй выборке.

9. По Табл. XI Приложения 1 определить, какому уровню статистической зна­чимости соответствует полученное значение λ.

Если λэмп > 1,36, различия между распределениями достоверны.


Последовательность выборок может быть выбрана произвольно, так как расхождения между ними оцениваются по абсолютной величине разностей. В нашем случае первой будем считать отечественную выбор­ку, второй - выборку Клара.


Таблица 4.19

Расчет критерия при сопоставлении эмпирических распределений

желтого цвета в отечественной выборке (n1=102)

и выборке Клара (п2=:800)

Позиция желтого цвета

Эмпирические частоты

Эмпирические частости

Накоплены эмпирические частности

Разность

ƒ*1-∑ƒ*2

ƒ1

ƒ2

ƒ*1

ƒ*2

ƒ*1

ƒ*2

1

24

98

0,235

0,123

0,235

0,123

0,112

2

15

113

0,147

0,141

0,382

0,264

0,118

3

13

116

0,128

0,145

0,510

0,409

0,101

4

8

87

0,078

0,109

0,588

0,518

0,070

5

15

91

0,147

0,114

0,735

0,632

0,103

6

10

112

0,098

0,140

0,833

0,772

0,061

7

9

97

0,088

0,121

0,921

0,893

0,028

8

8

86

0,079

0,107

1,000

1,000

0

Суммы

102

800

1,000

1,000











Максимальная разность между накопленными эмпирическими частостями составляет 0,118 и падает на второй разряд.

В соответствии с пунктом 8 алгоритма 15 подсчитаем значение λ:




По Табл. XI Приложения 1 определяем уровень статистической
значимости полученного значения: р=0,16 :

Построим для наглядности ось значимости.



На оси указаны критические значения λ соответствующие приня­тым уровням значимости: λ0,05=1,36, λ0,01=1,63.

Зона значимости простирается вправо, от 1,63 и далее, а зона незначимости – влево, от 1,36 к меньшим значениям.

λ эмп < λкр

Ответ: Но принимается. Эмпирические распределения желтого цвета по 8 позициям в отечественной выборке и выборке X. Клара совпадают. Таким образом, распределения желтого цвета в двух выбор­ках не различаются, но в то же время они по-разному соотносятся с равномерным распределением: у Клара отличий от равномерного рас­пределения не обнаружено, а 8 отечественной выборке различия обна­ружены (р<0,05). Возможно, картину могло бы прояснить применение другого метода?

Е.В. Гублер (1978) предложил сочетать использование критерия λ с критерием φ* (угловое преобразование Фишера).

Об этих возможностях сочетания методов λ и φ* мы поговорим в следующей лекции.


^ .5. Алгоритм выбора критерия для сравнения распределений




Курс: «Математические методы в психологии»


(Материалы для самостоятельного изучения студентам психологам и социальным работникам)


ТЕМА № 7


^ МНОГОФУНКЦИОНАЛЬНЫЕ СТАТИСТИЧЕСКИЕ КРИТЕРИИ


Вопросы:


1. Понятие многофункциональных критериев.

2. Критерий φ* - угловое преобразование Фишера.

3. Биноминальный критерий m.

^ 4. Многофункциональные критерии как эффективные

заменители традиционных.

Вопрос 1

Понятие многофункциональных критериев


Многофункциональные статистические критерии - это критерии, которые могут использоваться по отношению к самым разнообразным данным, выборкам и задачам.


Это означает, что данные могут быть представлены в любой шкале, начиная от номинативной (шкалы наименований).


Это означает также, что выборки могут быть как независимыми, так и "связанными", то есть мы можем с помощью многофункциональных критериев сравнивать и разные выборки испытуемых, и показатели одной и той же выборки, измеренные в разных условиях. Нижние границы вы­борок - 5 наблюдений, но возможно применение критериев и по отноше­нию к выборкам с n=2, с некоторыми оговорками (см. разделы "Ограничения критерия φ* и "Ограничения биномиального критерия m").


Верхняя граница выборок задана только в биномиальном крите­рии - 50 человек. В критерии φ* Фишера верхней границы не сущест­вует - выборки могут быть сколь угодно большими.


Многофункциональные критерии позволяют решать задачи сопос­тавления уровней исследуемого признака, сдвигов в значениях иссле­дуемого признака и сравнения распределений.


К числу многофункциональных критериев в полной мере относит­ся критерий φ* Фишера (угловое преобразование Фишера) и, с неко­торыми оговорками - биномиальный критерий m.


Многофункциональные критерии построены на сопоставлении до­лей, выраженных в долях единицы или в процентах. Суть критериев состоит в определении того, какая доля наблюдений (реакций, выборов, испытуемых) в данной выборке характеризуется интересующим иссле­дователя эффектом и какая доля этим эффектом не характеризуется.


Таким эффектом может быть:


а) определенное значение качественно определяемого признака - на­пример:

*выражение согласия с каким-либо предложением;

*выбор правой дорожки из двух симметричных дорожек;

*отнесенность к опреде­ленному полу;

*присутствие фигуры отца в раннем воспоминании и др.;


б) определенный уровень количественно измеряемого признака, напри­мер:

*получение оценки, превосходящей проходной балл;

*решение за­дачи менее чем за 20 сек;

*факт работы в команде, по численности превышающей 4-х человек;

*выбор дистанции в разговоре, превы­шающей 50 см, и др.;


в) определенное соотношение значений или уровней исследуемого при­знака, например:

*более частый выбор альтернатив А и Б по сравне­нию с альтернативами В и Г;

*преимущественное проявление крайних значений признака, как самых высоких, так и самых низких;

*преоб­ладание положительных сдвигов над отрицательными и др.


Итак, путем сведения любых данных к альтернативной шкале "Есть эффект - нет эффекта" многофункциональные критерии позволя­ют решать все три задачи сопоставлений - сравнения "уровней", оценки "сдвигов" и сравнения распределений.


Критерий φ* применяется в тех случаях, когда *обследованы две выборки испытуемых, биномиальный критерий m - в тех случаях, когда

*обследована лишь одна выборка испытуемых.


Правила выбора одного из этих критериев отражены в Алгоритме 19.


Вопрос 2

Критерий φ* — угловое преобразование Фишера


Данный метод описан во многих руководствах (Плохинский НА., 1970; Гублер Е.В., 1978; Ивантер Э.В., Коросов А.В., 1992 и др.) Настоящее описание опирается на тот вариант метода, который был разработан и изложен Е.В. Гублером.


^ Назначение критерия φ*


Критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости интересующего исследователя эффекта.


Описание критерия φ*


Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий нас эффект.


Суть углового преобразования Фишера состоит в переводе процент­ных долей в величины центрального угла , который измеряется в радианах1. Большей процентной доле будет соответствовать больший угол φ*, а меньшей доле - меньший угол, но соотношения здесь не линейные:

1. Подробнее об этом см. в Математическим сопровождении в клонце данной темы.


где Р - процентная доля, выраженная в долях единицы (см. Рис. 5.1).





При увеличении расхождения между углами φ*1 и φ*2 и увеличе­ния численности выборок значение критерия возрастает. Чем больше величина φ*, тем более вероятно, что различия достоверны.


Гипотезы

H0: Доля лиц, у которых проявляется исследуемый эффект, в выборке

1 не больше, чем в выборке 2.


Н1: Доля лиц, у которых проявляется исследуемый эффект, в выборке

1 больше, чем в выборке 2.


^ Графическое представление критерия φ*


Метод углового преобразования несколько более абстрактен, чем остальные критерии.


Формула, которой придерживается Е. В. Гублер при подсчете значений φ*, предполагает, что 100% составляют угол φ=3,142, то есть округленную величину ή=3,14159... Это позволяет нам представить со­поставляемые выборки в виде двух полукругов, каждый из которых символизирует 100% численности своей выборки. Процентные доли испытуемых с "эффектом" будут представлены как секторы, образован­ные центральными углами φ. На Рис. 5.2 представлены два полукруга, иллюстрирующие


Пример 1. В первой выборке 60% испытуемых ре­шили задачу. Этой процентной доле соответствует угол φ=1,772. Во второй выборке 40% испытуемых решили задачу. Этой процентной доле соответствует угол φ=1,369.



Рис. 5.2. Графическое представление углов, образованных процентными долями испы­туемых, решивших задачу в группе 1 (слева) и в группе 2 (справа); отсчет углов идет справа налево.


Критерий φ* позволяет определить, действительно ли один из углов статистически достоверно превосходит другой при данных объе­мах выборок.


^ Ограничения критерия φ*


  1. Ни одна из сопоставляемых долей не должна быть равной нулю. Формально нет препятствий для применения метода φ в случаях, когда доля наблюдений в одной из выборок равна 0. Однако в этих случаях результат может оказаться неоправданно завышенным (Гублер Е.В., 1978, с. 86).




  1. Верхний предел в критерии φ отсутствует - выборки могут быть сколь угодно большими.

Нижний предел - 2 наблюдения в одной из выборок. Однако должны соблюдаться следующие соотношения в численности двух выборок:


а) если в одной выборке всего 2 наблюдения, то во второй должно быть не менее 30:

n1 =2 → n2 ≥ 30;


б) если в одной из выборок всего 3 наблюдения, то во второй
должно быть не менее 7:

n1 =3 → n2 ≥7;


в) если в одной из выборок всего 4 наблюдения, то во второй
должно быть не менее 5:

n1 =4 → n2 ≥5;


г) при n1, n2 ≥5 возможны любые сопоставления.


В принципе возможно и сопоставление выборок, не отвечающих этому условию, например, с соотношением n1=2, n2=15, но в этих слу­чаях не удастся выявить достоверных различий.


Других ограничений у критерия φ* нет.


Рассмотрим несколько примеров, иллюстрирующих возможности критерия φ*.


Пример 1: сопоставление выборок по качественно

определяемому при­знаку.


Пример 2: сопоставление выборок по количественно

измеряемому при­знаку.


Пример 3: сопоставление выборок и по уровню, и по

распределению признака.


Пример 4: использование критерия φ* в сочетании с критерием λ Колмогорова-Смирнова в целях достижения максимально точного результата.


^ Пример 1 - сопоставление выборок по качественно

определяемому признаку


В данном варианте использования критерия мы сравниваем про­цент испытуемых в одной выборке, характеризующихся каким-либо ка­чеством, с процентом испытуемых в другой выборке, характеризующих­ся тем же качеством.


Допустим, нас интересует, различаются ли две группы студентов по успешности решения новой экспериментальной задачи. В первой группе из 20 человек с нею справились 12 человек, а во второй выбор­ке из 25 человек - 10. В первом случае процентная доля решивших за­дачу составит 12/20*100%=60%, а во второй 10/25*100%=40%. Дос­товерно ли различаются эти процентные доли при данных n1 и n2?


Казалось бы, и "на глаз" можно определить, что 60% значи­тельно выше 40%. Однако на самом деле эти различия при данных n1, n2 недостоверны.


Проверим это. Поскольку нас интересует факт решения задачи, будем считать "эффектом" успех в решении экспериментальной задачи, а отсутствием эффекта - неудачу в ее решении.


^ Сформулируем гипотезы.

Но: Доля лиц, справившихся с задачей, в первой группе не больше, чем во второй группе.

H1: Доля лиц, справившихся с задачей, в первой группе больше, чем во второй группе.


Теперь построим так называемую четырехклеточную, или четы­рехпольную таблицу, которая фактически представляет собой таблицу эмпирических частот по двум значениям признака: "есть эффект" - "нет эффекта".


Таблица 5.1


Четырехклеточная таблица для расчета критерия при сопоставлении двух групп испытуемых по процентной доле решивших задачу.

Группы

«Есть эффект»:

задача решена

«Нет эффект»:

задача не решена

Сум-мы

Количество испытуемых

% доля




Количество испытуемых

% доля




1 группа

12

(60%)

A

8

(40%)

Б

20

2 группа

10

(40%)

B

15

(60%)

Г

25

Суммы

22







23







45


В четырёхклеточной таблице, как правило, сверху размечаются столбцы "Есть эффект" и "Нет эффекта", а слева - строки "1 группа" и "2 группа". Участвуют в сопоставлениях, собственно, только поля (ячейки) А и В, то есть процентные доли по столбцу "Есть эффект".


По Табл. XII Приложения 1 определяем величины φ, соответст­вующие процентным долям в каждой из групп.

φ 1 (6О%)=1,772

φ 2 (4О%) =1,369


Теперь подсчитаем эмпирическое значение φ* по формуле:




где φ1 - угол, соответствующий большей % доле;

φ2 - угол, соответствующий меньшей % доле;

n1- количество наблюдений в выборке 1;

n2- количество наблюдений в выборке 2.

В данном случае:




φ1 –угол, соответствующий большей %-й доле;

φ2 - угол, соответствующий меньшей %-й доле;

n1 – количество наблюдений в выборке 1;

n2 - количество наблюдений в выборке 2.


В данном случае:





По Табл. ХШ Приложения 1 определяем, какому уровню значи­мости соответствует φ*эмп=1,34:

Р=0,09


Можно установить и критические значения φ*, соответствующие принятым в психологии уровням статистической значимости:





φэмп=1,34

φэмп< φкр


Построим «ось значимости».






Полученное эмпирическое значение φ* находится в зоне незна­чимости.


Ответ: Но принимается. Доля лиц, справившихся с задачей, в первой группе не больше, чем во второй группе.


Можно лишь посочувствовать исследователю, который считает существенными различия в 20% и даже в 10%, не проверив их досто­верность с помощью критерия φ*. В данном случае, например, досто­верными были бы только различия не менее чем в 24,3%.


Похоже, что при сопоставлении двух выборок по какому-либо качественному признаку критерий φ может нас скорее огорчить, чем обрадовать. То, что казалось существенным, со статистической точки зрения может таковым не оказаться.


Гораздо больше возможностей порадовать исследователя появля­ется у критерия Фишера тогда, когда мы сопоставляем две выборки по количественно измеренным признакам и можем варьировать "эффект".


^ Пример 2 - сопоставление двух выборок по количественно изме­ряемому признаку


В данном варианте использования критерия мы сравниваем про­цент испытуемых в одной выборке, которые достигают определенного уровня значения признака, с процентом испытуемых, достигающих этого уровня в другой выборке.


В исследовании Г. А. Тлегеновой (1990) из 70 юношей - уча­щихся ПТУ в возрасте от 14 до 16 лет было отобрано по результатам обследования по Фрайбургскому личностному опроснику 10 испытуемых с высоким показателем по шкале Агрессивности и 11 испытуемых с низким показателем по шкале Агрессивности. Необходимо определить, различаются ли группы агрессивных и неагрессивных юношей по пока­зателю расстояния, которое они спонтанно выбирают в разговоре с со­курсником. Данные Г. А. Тлегеновой представлены в Табл. 5.2. Мож­но заметить, что агрессивные юноши чаще выбирают расстояние в 50 см или даже меньше, в то время как неагрессивные юноши чаще выби­рают расстояние, превышающее 50 см.


Теперь мы можем рассматривать расстояние в 50 см как крити­ческое и считать, что если выбранное испытуемым расстояние меньше или равно 50 см, то "эффект есть", а если выбранное расстояние боль­ше 50 см, то "эффекта нет". Мы видим, что в группе агрессивных юношей эффект наблюдается в 7 из 10, т. е. в 70% случаев, а в группе неагрессивных юношей - в 2 из 11, т. е. в 18,2% случаев. Эти про­центные доли можно сопоставить по методу φ*, чтобы установить дос­товерность различий между ними.

Таблица 5.2

Показатели расстояния (в см), выбираемого агрессивными и

неагрессивными юношами в разговоре с сокурсником

(по данным Г.А. Тлегеновой, 1990)






Группа 1: юноши с высокими показателями по шкале Агрессивности FPI-R2 (n1=10)

Группа 2: юноши с низкими значениями по шкале Агрессивности FPI-R (n2=11)

d(см)

% доля

d(см)

% доля



«Есть

эффект»

d≤50см

30










40
















40










45




50

70%




18,2%

50










50










50










50












«нет

эффекта»

d>50см







65




70
















75










75










75










75




80

30%




81,8%

90
















100










100










100










100




Суммы

560

100%

850

100%

Средние

56,0




77.3




2 FPI-R - Фрайбургский личностный опросник


^ Сформулируем гипотезы.


Но- Доля лиц, которые выбирают дистанцию d≤50см, в группе агрес­сивных юношей не больше, чем в группе неагрессивных юношей.


H1: Доля лиц, которые выбирают дистанцию d≤50см , в группе агрес­сивных юношей больше, чем в группе неагрессивных юношей. Теперь построим так называемую четырехклеточную таблицу.

Таблица 5.3

Четырехклеточная таблица для расчета критерия ф* при сопоставлении групп агрессивных (n1=10) и неагрессивных юношей (п2=11)



Группы

«Есть эффект»: d≤50см

«Нет эффекта»: d>50см




Количество испытуемых

( %доля)




Количество испытуемых

( %доля)




Суммы

1 группа - агрессивные юноши

7

(70%)

А

3

(30%)

Б

10

2 группа - неагрессивные юноши

2

(18,2%)

В

9

(81,8%)

Г

11

Сумма

9







12







21


По Табл. XII Приложения 1 определяем величины φ, соответст­вующие процентным долям "эффекта" в каждой из групп.

φ*(70%) =1,982

φ*(18,2%)=0,881


Подсчитаем эмпирическое значение φ *:




Критические значения φ* нам уже известны:





Построим для наглядности «ось значимости».


Полученное эмпирическое значение φ* находится в зоне значимости.


^ Ответ: H0 отвергается. Принимается Н1.

Доля лиц, которые вы­бирают дистанцию в беседе меньшую или равную 50 см, в группе аг­рессивных юношей больше, чем в группе неагрессивных юношей (р<0,01).


На основании полученного результата мы можем сделать заклю­чение, что более агрессивные юноши чаще выбирают расстояние менее полуметра, в то время как неагрессивные юноши чаще выбирают боль­шее, чем полметра, расстояние. Мы видим, что агрессивные юноши общаются фактически на границе интимной (0—46 см) и личной зоны (от 46 см). Мы помним, однако, что интимное расстояние между парт­нерами является прерогативой не только близких добрых отношений, но и рукопашного боя (Hall E.T., 1959).


^ Пример 3 - сопоставление выборок и по уровню, и по распреде­лению признака.


В данном варианте использования критерия мы вначале можем проверить, различаются ли группы по уровню какого-либо признака, а затем сравнить распределения признака в двух выборках. Такая задача может быть актуальной при анализе различий в диапазонах или форме распределения оценок, получаемых испытуемыми по какой-либо новой методике.


В исследовании Р. Т. Чиркиной (1995) впервые использовался опросник, направленный на выявление тенденции к вытеснению из па­мяти фактов, имен, намерений и способов действия, обусловленному личными, семейными и профессиональными комплексами. Опросник был создан при участии Е. В. Сидоренко на основании материалов книги 3. Фрейда "Психопатология обыденной жизни". Выборка из 50 студентов Педагогического института, не состоящих в браке, не имею­щих детей, в возрасте от 17 до 20 лет, была обследована с помощью данного опросника, а также методики Менестера-Корзини для выявле­ния интенсивности ощущения собственной недостаточности, или "комплекса неполноценности" (Manaster G, J., Corsini R. J., 1982).


Результаты обследования представлены в Табл. 5.4.


Можно ли утверждать, что между показателем энергии вытесне­ния, диагностируемым с помощью опросника, и показателями интенсив­ности ощущения собственной недостаточности существуют какие-либо значимые соотношения?

Таблица 5.4

Показатели интенсивности ощущения собственной недостаточности в группах студентов с высокой (п1=18) и низкой (п2=24) энергией вытеснения

Группа 1: энергия вытеснения от 19 до 31 балла (n1=18)

Группа 2: энергия вытеснения от 7 до 13 баллов (n2=24)

0, 0, 0, 0, 0

0, 0,




5, 5, 5, 5




10, 10, 10, 10, 10, 10




15, 15

20, 20

20, 20, 20, 20

30, 30, 30, 30, 30, 30, 30

30, 30, 30, 30, 30, 30

50, 50




60, 60




Суммы

470

370

Средние

26,11

15,42



Несмотря на то, что средняя величина в группе с более энергич­ным вытеснением выше, в ней наблюдаются также и 5 нулевых значе­ний. Если сравнить гистограммы распределения оценок в двух выбор­ках, то между ними обнаруживается разительный контраст (Рис. 5.3).




Рис.5.3. Гистограммы распределения показателен интенсивности ощущения недостаточно­сти 8 группе с более энергичным вытеснением (а) и менее энергичным вытеснением (б)

Для сравнения двух распределений мы могли бы применить кри­терий χ2 или критерий λ, но для этого нам пришлось бы укрупнять разряды, а кроме того, в обеих выборках n<30.



Критерии ф* позволит нам проверить наблюдаемый на графике эффект несовпадения двух распределений, если мы условимся считать, что "эффект есть", если показатель чувства недостаточности принимает либо очень низкие (0), либо, наоборот, очень высокие значения (>30), и что "эффекта нет", если показатель чувства недостаточности прини­мает средние значения, от 5 до 25.


^ Сформулируем гипотезы.


H0: Крайние значения показателя недостаточности (либо 0, либо 30 и более) в группе с более энергичным вытеснением встречаются не чаще, чем в группе с менее энергичным вытеснением.


H1: Крайние значения показателя недостаточности (либо 0, либо 30 и более) в группе с более энергичным вытеснением встречаются ча­ще, чем в группе с менее энергичным вытеснением.


Создадим четырехклеточную таблицу, удобную для дальнейшего расчета критерия ф*.

Таблица 5.5

Четырехклеточная таблица для расчета критерия ф* при сопоставлении групп с большей и меньшей энергией вытеснения по соотношению

пока­зателей недостаточности



Группы

"Есть эффект": показатель недос­таточности

равен 0 или >30

"Нет эффекта": показатель недос­таточности от 5 до 25

Суммы

1 группа - с большей

энергией вытеснения

16

(88,9%)

2

(11,1%)

18

2 группа - с меньшей энергией вытеснения

8

(33,3%)

16

(66,7%)

24

Суммы

24




18




423



По Табл. XII Приложения 1 определим величины φ, соответст­вующие сопоставляемым процентным долям:

φ 1(88,9%)=2,462

φ 2(33,3%)=1.230


Подсчитаем эмпирическое значение φ*:


3. В первоначальной выборке было 50 человек, но 8 из них были исключены из рассмотрения как имеющие средний балл по показателю энергии вытеснения (14-15). Показатели интенсивности чувства недостаточности у них тоже средние: 6 значений по 20 баллов и 2 значения по 25 баллов.




Критические значения φ* при любых n1, n2, как мы помним из предыдущего примера, составляют:





φ*эмп=3,951

φ*эмп > φ*кр (p≤0.01)


Табл. XIII Приложения 1 позволяет нам и более точно опреде­лить уровень значимости полученного результата: р<0,001.

Ответ: H0 отвергается. Принимается H1. Крайние значения по­казателя недостаточности (либо 0, либо 30 и более) в группе с большей энергией вытеснения встречаются чаще, чем в группе с меньшей энер­гией вытеснения.


Итак, испытуемые с большей энергией вытеснения могут иметь как очень высокие (30 и более), так и очень низкие (нулевые) показа­тели ощущения собственной недостаточности. Можно предположить, что они вытесняют и свою неудовлетворенность, и потребность в жиз­ненном успехе. Эти предположения нуждаются в дальнейшей проверке.


Полученный результат, независимо от его интерпретации, под­тверждает возможности критерия φ* в оценке различий в форме рас­пределения признака в двух выборках.


В мощных возможностях критерия φ* можно убедиться, под­твердив совершенно иную гипотезу при анализе материалов данного примера. Мы можем доказать, например, что в группе с большей энергией вытеснения показатель недостаточности все же выше, несмот­ря на парадоксальность его распределения в этой группе.

^ Сформулируем новые гипотезы.

H0: Наиболее высокие значения показателя недостаточности (30 и бо­лее) в группе с большей энергией вытеснения встречаются не ча­ще, чем в группе с меньшей энергией вытеснения.


H1: Наиболее высокие значения показателя недостаточности (30 и бо­лее) в группе с большей энергией вытеснения встречаются чаще, чем в группе с меньшей энергией вытеснения. Построим четырехпольную таблицу, используя данные Табл. 5.4.

Таблица 5.6

Четырехклеточная таблица для расчета критерия φ* при

Сопоставлении групп с большей и меньшей энергией вытеснения по уровню показателя недостаточности



Группы

"Есть эффект": показатель недос­таточности больше или равен З0

"Н «Нет эффекта»: показатель недос­таточности меньше 30

Суммы

1 группа - с большей энергией вытеснения

11

(61,1%)

7

(38,9%)

18

2 группа - с меньшей энергией вытеснения

6

(25,0%)

18

(75,0%)

24

Суммы

17




25




42

По Табл. XII Приложения 1 определяем величины φ*:

φ*1(61,1%)=1,795

φ*2(25,0%)=1,047

Подсчитываем эмпирическое значение φ*:




По Табл. XIII Приложения 1 определяем, что этот результат со­ответствует уровню значимости р=0,008.

Ответ: H0 отвергается. Принимается Н1: Наиболее высокие показатели недостаточности (30 и более баллов) в группе с большей энергией вытеснения встречаются чаще, чем в группе с меньшей энер­гией вытеснения (р=0,008).


Итак, нам удалось доказать и то, что в группе с более энергич­ным вытеснением преобладают крайние значения показателя недоста­точности, и то, что больших своих значений этот показатель достигает именно в этой группе.


Теперь мы могли бы попробовать доказать, что в группе с большей энергией вытеснения чаще встречаются и более низкие значения пока­зателя недостаточности, несмотря на то, что средняя величина в этой группе больше (26,11 против 15,42 в группе с меньшим вытеснением).

^ Сформулируем гипотезы.

Н0: Самые низкие показателя недостаточности (нулевые) в группе с большей энергией вытеснения встречаются не чаще, чем в группе с меньшей энергией вытеснения.

Н1: Самые низкие показатели недостаточности (нулевые) встречаются в группе с большей энергией вытеснения чаще, чем в группе с менее энергичным вытеснением. Сгруппируем данные в новую четырехклеточную таблицу.

Таблица 5.7

Четырехклеточная таблица для сопоставления групп с разной энергией вытеснения по частоте нулевых значений показателя недостаточности



Группы

"Есть эффект": показатель недостаточности равен 0

"Нет эффекта": показатель недостаточности не равен 0

Суммы

1 группа - с большей энергией вытеснения

5

(27,8%)

13

(72,2%)

18

2 группа - с меньшей энергией вытеснения

2

(8,3%)

22

(91,7%)

24

Суммы

7




35




42
  1   2   3   4   5



Скачать файл (2763 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации
Рейтинг@Mail.ru