Logo GenDocs.ru

Поиск по сайту:  


Загрузка...

Лекции - курс: Математические методы в психологии. Часть 2 - файл 1.doc


Лекции - курс: Математические методы в психологии. Часть 2
скачать (2763 kb.)

Доступные файлы (1):

1.doc2763kb.16.11.2011 05:07скачать

содержание
Загрузка...

1.doc

1   2   3   4   5
Реклама MarketGid:
Загрузка...


Как видно из Табл. 6.6, оценки избирателей и индивидуальные показатели депутата варьируют в разных диапазонах. Действительно, оценки избирателей были получены по 10-балльной шкале, а индивиду­альные показатели по экспресс-видеодиагностике измеряются по 20-балльной шкале. Ранжирование позволяет нам перевести обе шкалы измерения в единую шкалу, где единицей измерения будет 1 ранг, а максимальное значение составит 18 рангов.


Ранжирование, как мы помним, необходимо произвести отдельно по каждому ряду значений. В данном случае целесообразно начислять большему значению меньший ранг, чтобы сразу можно было увидеть, на каком месте по значимости (для избирателей) или по выраженности (у депутата) находится то или иное качество.


Результаты ранжирования представлены в Табл. 6.7. Качества перечислены в последовательности, отражающей эталонный профиль.


^ Сформулируем гипотезы.


H0: Корреляция между индивидуальным профилем депутата К-ва и эталонным профилем, построенным по оценкам избирателей, не от­личается от нуля.


Н1: Корреляция между индивидуальным профилем депутата К-ва и эталонным профилем, построенным по оценкам избирателей, стати­стически значимо отличается от нуля.


Поскольку в обоих сопоставляемых ранговых рядах присутствуют группы одинаковых рангов, перед подсчетом коэффициента ранговой корреляции необходимо внести поправки на одинаковые ранги Та и Тb:

Та =∑(а3 – а)/12

Тb =∑(b3 – b)/12

где а - объем каждой группы одинаковых рангов в ранговом ряду А,

b - объем каждой группы одинаковых рангов в ранговом ряду В.


В данном случае, в ряду А (эталонный профиль) присутствует одна группа одинаковых рангов - качества "обучаемость" и "гуманизм" имеют один и тот же ранг 12,5; следовательно, а=2.


Та = (23-2)/12=0,50.


В ряду В (индивидуальный профиль) присутствует две группы одинаковых рангов, при этом Ь1=2 и b2=2.


Тb = [(23-2)+(23-2)]/12=l,00


Для подсчета эмпирического значения rs используем формулу



В данном случае:





Заметим, что если бы поправка на одинаковые ранги нами не вносилась, то величина rs была бы лишь на (на 0,0002) выше:





При больших количествах одинаковых рангов изменения rs, могут оказаться гораздо более существенными. Наличие одинаковых рангов означает меньшую степень дифференцированности упорядоченных переменных и, следовательно, меньшую возможность оценить степень связи между ними (Суходольский Г.В., 1972, с.76).


По Табл.ХУ1 Приложения 1 определяем критические значения rs при N=18:



rs эмп > rs кр (p< 0.05)


Ответ: H0 отвергается. Корреляция между индивидуальным профилем депутата К-ва и эталонным профилем, отвечающим требова­ниям избирателей, статистически значима (р<0,05) и является положи­тельной.


Из Табл. 6.7 видно, что депутат К-в имеет более низкий ранг по шкалам «Умения общаться с людьми» и более высокие ранги по шкалам «Целеустремленности» и «Стойкости», чем это предписывается избиратель­ским эталоном. Этими расхождениями, главным образом, и объясняется некоторое снижение полученного rs.

Сформулируем общий алгоритм подсчета rs.


АЛГОРИТМ 20

Расчет коэффициента ранговой корреляции Спирмена rs.


1. Определить, какие два признака или две иерархии признаков будут участвовать в сопоставлении как переменные А и В.


2. Проранжировать значения переменной А, начисляя ранг 1 наимень­шему значению, в соответствии с правилами ранжирования (см. п.2.3). Занести ранги в первый столбец таблицы по порядку номе­ров испытуемых или признаков.


3. Проранжнровать значения переменной В, в соответствии с теми же правилами. Занести ранги во второй столбец таблицы по порядку номеров испытуемых или признаков.


4. Подсчитать разности d между рангами А и В по каждой строке таблицы и занести в третий столбец таблицы.


5. Возвести каждую разность в квадрат: d2. Эти значения занести в четвертый столбец таблицы.


6. Подсчитать сумму квадратов ∑d2 ,


7. При наличии одинаковых рангов рассчитать поправки:

Та =∑(а3 – а)/12

Тb =∑(b3 – b)/12

где а - объем каждой группы одинаковых рангов в ранговом ряду А;

b - объем каждой группы одинаковых рангов в ранговом ряду В.


8. Рассчитать коэффициент ранговой корреляции rs по формуле:


а) при отсутствии одинаковых рангов



б) при наличии одинаковых рангов





где ∑d2 - сумма квадратов разностей между рангами;

Та и Тb - поправки на одинаковые ранги;

N - количество испытуемых или признаков, участвовавших в ранжировании,


9. Определить по Табл. XVI Приложения 1 критические значения rs для данного N. Если rs превышает критическое значение или по крайней мере равен ему, корреляция достоверно отличается от 0.


Курс: «Математические методы в психологии»


(Материалы для самостоятельного изучения студентам психологам и социальным работникам)


Лекция № 9


^ ДИСПЕРСИОННЫЙ АНАЛИЗ


Вопросы:


1. Понятие дисперсионного анализа.

2. Подготовка данных к дисперсионному анализу.

3. Однофакторный дисперсионный анализ для

несвязанных выборок.

^ 4. Однофакторный дисперсионный анализ для

связанных выборок.


Вопрос 1


Понятие дисперсионного анализа


Дисперсионный анализ - это анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов. В зарубеж­ной литературе дисперсионный анализ часто обозначается как ANOVA, что переводится как анализ вариативности (Analysis of Variance), Авто­ром метода является Р. А. Фишер (Fisher R.A., 1918, 1938).


Задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака вычленить вариативность троякого рода:

а) вариативность, обусловленную действием каждой из исследуемых независимых переменных;

б) вариативность, обусловленную взаимодействием исследуемых неза­висимых переменных;

в) случайную вариативность, обусловленную всеми другими неизвест­ными переменными.


Вариативность, обусловленная действием исследуемых перемен­ных и их взаимодействием, соотносится со случайной вариативностью.


Показателем этого соотношения является критерий F Фишера1.

1 Критерии F Фишера и метод углового преобразования Фишера, дающий нам критерий φ*, - это совершенно различные методы, имеющие разное предназначе­ние и разные способы вычисления.


Fэмп А= ^ Вариативность, обусловленная переменной А

Случайная вариативность


Fэмп Б = Вариативность, обусловленная переменной Б

Случайная вариативность

Fэмп АБ = ^ Вариативность, обусловленная взаимодействием переменных А и Б

Случайная вариативность


В формулу расчета критерия F входят оценки дисперсий, то есть параметров распределения признака, поэтому критерии F является па­раметрическим критерием.


Чем в большей степени вариативность признака обусловлена ис­следуемыми переменными (факторами) или их взаимодействием, тем выше эмпирические значения критерия F.


В дисперсионном анализе исследователь исходит из предположе­ния, что одни переменные могут рассматриваться как причины, а другие - как следствия.


*Переменные первого рода считаются факторами,


а *пере­менные второго рода - результативными признаками.


В этом отличие дисперсионного анализа от прямолинейного корреляционного анализа, в котором мы исходим из предположения, что изменения одного признака просто сопровождаются определенными изменениями другого.


В дисперсионном анализе возможны два принципиальных пути разделения всех исследуемых переменных на независимые переменные (факторы) и зависимые переменные (результативные признаки).


Первый путь состоит в том, что мы совершаем какие-либо воз­действия на испытуемых или учитываем какие-либо не зависящие от нас воздействия на них, и именно эти воздействия считаем независи­мыми переменными, или факторами, а исследуемые признаки рассмат­риваем как зависимые переменные, или результативные признаки.

На­пример, возраст испытуемых или способ предъявления им информации считаем факторами, а обучаемость или эффективность выполнения за­дания - результативными признаками.


Второй путь предполагает, что мы, не совершая никаких воздей­ствий, считаем, что при разных уровнях развития одних психологиче­ских признаков другие проявляются тоже по-разному. По тем или иным причинам мы решаем, что одни признаки могут рассматриваться скорее как факторы, а другие - как результат действия этих факторов.

Например, уровень интеллекта или мотивации достижения начинаем считать факторами, а профессиональную компетентность или социомет­рический статус - результативными признаками.


Второй путь весьма уязвим для критики. Допустим, мы предпо­ложили, что настойчивость - значимый фактор учебной успешности студентов. Мы принимаем настойчивость за воздействующую перемен­ную (фактор), а учебную успешность - за результативный признак. Против этого могут быть выдвинуты сразу же два возражения. Во-первых, успех может стимулировать настойчивость; во-вторых, как, собственно, измерялась настойчивость? Если она измерялась с помо­щью метода экспертных оценок, а экспертами были соученики или пре­подаватели, которым известна учебная успешность испытуемых, то не исключено, что это оценка настойчивости будет зависеть от известных экспертам показателей успешности, а не наоборот.

Допустим, что в другом исследовании мы исходим из предполо­жения, что фактор социальной смелости (фактор Н) из 16-факторного личностного опросника Р.Б. Кеттелла - это та независимая переменная, которая определяет объем заключенных торговым представителем дого­воров на поставку косметических товаров. Но если объем договоров определялся по какому-то периоду работы, скажем трехмесячному, а личностное обследование проводилось в конце этого периода или даже после его истечения, то мы не можем со всей уверенностью отделить здесь причину от следствия. Есть очень сильное направление в психо­логии и психотерапии, которое утверждает, что личностные изменения начинаются с действий и поступков: "Начни действовать, и постепенно станешь таким, как твои поступки". Таким образом, психолог, пред­ставляющий это направление, возможно, стал бы утверждать, что при­чиной должен считаться достигнутый объем договорных поставок, а результатом - повышение социальной смелости.


Только наше исследовательское чутье может подсказать нам, что должно рассматриваться как причина, а что - как результат. Однако не всегда эти ощущения у разных исследователей совпадают, поэтому нужно быть готовым к тому, что наши выводы могут быть оспорены другими специалистами, которые рассматривают данный предмет с иной точки зрения и видят в нем иные перспективы. Впрочем, спорность выводов - постоянный спутник психологического исследования.


Постараемся быть оптимистичными и представим себе, что суще­ствует все же какое-то совпадение взглядов на психологические причи­ны и следствия. На Рис. 7.1 представлены два варианта рассеивания показателей учебной успешности в зависимости от уровня развития кратковременной памяти.


Из Рис. 7.1(а) мы видим, что при низком уровне развития кратковременной памяти оценки по английскому языку, похоже, несколько ниже, чем при среднем, а при высоком уровне вы­ше, чем при среднем. Похоже, что кратковременная память может рас­сматриваться как фактор успешности овладения английским языком.


С другой стороны, Рис. 7.1(6) свидетельствует о том, что успешность в чистописании вряд ли так же определенно зависит от уровня развития кратковременной памяти.


О том, верны ли наши предположения, мы сможем судить только после вычисления эмпирических значении критерия F.



Рис. 7.1. Рассеивание индивидуальных средних оценок по английскому языку (а) и чистописа­нию (б) у учеников с низким, средним и высоким уровнями развития кратковременной памяти

Низкий, средний и высокий уровни развития кратковременной памя­ти можно рассматривать как градации фактора кратковременной памяти.


Нулевая гипотеза в дисперсионном анализе будет гласить, что средние величины исследуемого результативного признака во всех гра­дациях одинаковы.


Альтернативная гипотеза будет утверждать, что средние вели­чины результативного признака в разных градациях исследуемого фак­тора различны.


В зарубежных руководствах чаще говорят о переменных, дейст­вующих в разных условиях, а не о факторах и их градациях (Greene J., D'Olivera M., 1982, р. 91-93).


Дело в том, что градация подразумевает ступень, стадию, уро­вень развития. Говоря о градациях фактора, мы явно или неявно подра­зумеваем, что сила его возрастает при переходе от градации к градации. Между тем, схема дисперсионного анализа применима и в тех случаях, когда градации фактора представляют собой номинативную шкалу, то есть отличаются лишь качественно.


Например, градациями фактора могут быть:

*параллельные формы экспериментальных заданий;

*цвет окраски стимулов;

*жанр музыкальных произведений, сопровождающих

процесс работы;

*традиционные или специально подобранные православ­ные тексты в сеансах аутогенной тренировки;

*разные формы заболева­ния;

*разные экспериментаторы;

*разные психотерапевты и т. д.


Если градации фактора различаются лишь качественно, их лучше называть условиями действия фактора или переменной. Например, дей­ствие аутогенной тренировки при условии использования текстов право­славных молитв2 или эффективность психокоррекционных воздействий при разных формах хронических заболеваний у детей3.

2. См. исследование Е. Б. Кулевой, 1991.

3 См.исследование Н.В.Корольковой, 1994.


Экспериментальные данные, представленные по градациям фак­тора, называются дисперсионным комплексом. Данные, относящиеся к отдельным градациям - ячейками комплекса.

Дисперсионный анализ позволяет нам констатировать изменение признака, но при этом не указывает направление этих изменений. Нам необходимо специально графически представлять полученные данные по градациям фактора, чтобы получить наглядное представление о направ­лении изменений.


Подобного рода задачи, как мы помним, позволяют решать непа­раметрические методы сравнения выборок или условий измерения, а именно критерий Н. Крускала-Уоллиса и критерий χ2r Фридмана.


Однако это касается только тех задач, в кото­рых исследуется действие одного фактора, или одной переменной. За­дачи однофакторного дисперсионного анализа, действительно, могут эффективным образом решаться с помощью непараметрических методов.


Метод дисперсионного анализа становится незаменимым только когда мы исследуем одновременное действие двух (или более) факторов, по­скольку он позволяет выявить взаимодействие факторов в их влиянии на один и тот же результативный признак. Именно эти возможности двухфакторного дисперсионного анализа послужили причиной, по кото­рой изложение этого метода включено в наш курс «Методы математической обработки в психологии».


Несмотря на то, что нас интересует прежде всего двухфакторный дисперсионный анализ, который нельзя заменить другими методами, начнем рассмотрение мы с однофакторного дисперсионного анализа:


*во-первых, для того, чтобы выдержать определенную последовательность и логику в изложении;


*во-вторых, для того, чтобы на реальном примере продемонстрировать возможность замены этого метода непараметриче­скими методами.


Итак, начнем рассмотрение дисперсионного анализа с простей­шего случая, когда исследуется действие только одной переменной (одного фактора). Исследователя интересует, как изменяется опреде­ленный признак в разных условиях действия этой переменной.


Напри­мер, как изменяется время решения задачи

*при разных условиях моти­вации испытуемых (низкой, средней, высокой) или

*при разных спосо­бах предъявления задачи (устно, письменно, в виде текста с графиками и иллюстрациями),

*в разных условиях работы с задачей (в одиночестве, в одной комнате с экспериментатором, в одной комнате с эксперимен­татором и другими испытуемыми) и т.п.


*В первом случае переменной, влияние которой исследуется, является мотивация,


*во втором - степень наглядности,


*в третьем - фактор публичности.


Преимущество однофакторного дисперсионного анализа по срав­нению с непараметрическими методами Н Крускала-Уоллиса и χ2r Фридмана - неограниченность в объемах выборок. Ограничения дис­персионного анализа достаточно условны. Например, требование нор­мальности распределения признака можно обойти по крайней мере дву­мя путями: при слишком скошенном, островершинном или плосковер­шинном распределении можно,

во-первых, нормализовать данные, а

во-вторых... просто вообще по этому поводу "не волноваться", как советуют, например, А.К. Kurtz и S.T. Мауо (1979, р.417).


Вопрос 2

Подготовка данных к дисперсионному анализу


^ 1) Создание комплексов


Лучше всего для каждого испытуемого создать отдельную кар­точку, куда были бы занесены данные по всем исследованным призна­кам. Дело в том, что в процессе анализа у исследователя могут изме­ниться гипотезы. Потребуется создавать, быть может, не один, а мно­жество дисперсионных комплексов, различающихся как по факторам, так и по результативным признакам. Карточки помогут нам быстро создавать новые дисперсионные комплексы. Благодаря карточкам мы сразу увидим, равномерно ли распределяются данные по градациям в случае, если за фактор мы решили принять один из исследованных пси­хологических признаков. С помощью карточек мы можем помочь себе выделить три, четыре или более градаций этого фактора, например, уровни мотивации, настойчивости, креативности и др.


^ 2) Уравновешивание комплексов


Комплекс, в котором каждая ячейка представлена одинаковым количеством наблюдений, называется равномерным. Равномерность комплекса позволяет нам обойти требование равенства дисперсий в ка­ждой из ячеек комплекса (Шеффе Г., 1980).


Равномерные комплексы позволяют также избежать значитель­ных трудностей, которые неизбежно возникают при обсчете неравно­мерных, или неортогональных, комплексов. В настоящем методическом пособии приведены алгоритмы расчета лишь для равномерных комплексов. С методами обсчета неравномерных комплексов можно ознакомиться у Н.А. Плохинского (1970), Г.В. Суходольского (1972), Г. Шеффе (1980).


В случае, если в разных градациях комплекса оказалось неравное количество наблюдений, необходимо отсеять некоторые из них. Если в комплексе со связанными выборками кто-либо из испытуемых не был подвергнут одному из условий действия переменной (градаций факто­ра), то его данные исключаются. Если же комплекс включает незави­симые выборки, каждая из которых была подвергнута определенному условию воздействия (градации фактора), то "лишние" испытуемые в какой-либо из ячеек комплекса отсеиваются путем случайного выбора необходимого количества карточек.

3) ^ Проверка нормальности распределения результативного признака.


Дисперсионный анализ относится к группе параметрических мето­дов и поэтому его следует применять только тогда, когда известно или доказано, что распределение признака является нормальным (Суходольский Г.В., 1972; Шеффе Г., 1980 и др.). Строго говоря, перед тем, как применять дисперсионный анализ, мы должны убедиться в нормальности распределения результативного признака. Нормальность распределения результативного признака можно проверить путем расче­та показателей асимметрии и эксцесса и сопоставления их с критическими значениями (Пустыльник Е,И., 1968* Плохинский Н.А., 1970 и др.).


Произведем необходимые расчеты на примере вопроса 3 Темы №9, в котором анализируется длительность мышечного волевого усилия.


Действовать будем по следующему алгоритму:


а) определим показатели асимметрии и эксцесса по формулам Н.А.Плохинского и сопоставим их с критическими значениями, указан­ными Н.А. Плохинским;


б) рассчитаем критические значения показателей асимметрии и эксцесса по формулам Е.И. Пустыльника и сопоставим с ними эмпирические значения;


в) если эмпирические значения показателей окажутся ниже критиче­ских, сделаем вывод о том, что распределение признака не отличает­ся от нормального.


Таблица 7.1

Вычисление показателей асимметрии и эксцесса по показателю длитель­ности попыток решения анаграмм





xi

(xi – xср)

(xi – xср)2

(xi – xср)3

(xi – xср)4

1

11

0,94

0,884

0,831

0,781

2

13

2,94

8,644

25,412

74,712

3

12

1,94

3,764

7,301

14,165

4

9

-1,06

1,124

-1,191

1,262

5

10

-0,06

0,004

-0,000

0,000

6

11

0,94

0,884

0,831

0,781

7

8

-2,06

4,244

-8,742

18,009

8

10

-0,06

0,004

-0,000

0,000

9

15

4,94

24,404

120,554

595,536

10

14

3.94

15,524

61,163

240,982

11

8

-2,06

4,244

-8,742

18,009

12

7

-3.06

9,364

-28,653

87,677

13

10

-0,06

0,004

-0.000

0,000

14

10

-0,06

0,004

-0,000

0,000

15

5

-5,06

25,604

-129,554

655,544

16

8

-2,06

4,244

-8,742

18,009

Суммы

161




102,944

30,468

1725,467


Для расчетов в Табл. 7.1 необходимо сначала определить сред­нюю арифметическую по формуле:




где xi ; - каждое наблюдаемое значение признака;

п - количество наблюдений.


В данном случае:



Стандартное отклонение (сигма) вычисляется по формуле:




где xi - каждое наблюдаемое значение признака;

xср - среднее значение (среднее арифметическое);

n - количество наблюдений.


В данном случае:



Показатели асимметрии и эксцесса с их ошибками репрезента­тивности определяются по следующим формулам:













где (xi – xср) – центральные отклонения;

σ – стандартное отклонение

n –количество испытуемых


В данном случае:













Показатели асимметрии и эксцесса свидетельствуют о достовер­ном отличии эмпирических распределений от нормального в том случае, если они превышают по абсолютной величине свою ошибку репрезента­тивности в 3 и более раз:





В данном случае:







Мы видим, что оба показателя не превышают в три раза свою ошибку репрезентативности, из чего мы можем заключить, что распре­деление данного признака не отличается от нормального.


Теперь произведем проверку по формулам Е.И. Пустыльника. Рассчитаем критические значения для показателей А и Е:








где n – количество наблюдений.








Аэмп =0,106

Аэмп < Акр

Еэмп = -0,711

Еэмп < Екр


Итак, оба варианта проверки, по Н.А. Плохинскому и по Е.И. Пустыльнику, дают один и тот же результат: распределение результа­тивного признака в данном примере не отличается от нормального рас­пределения.


Можно выбрать любой из двух предложенных вариантов провер­ки и придерживаться его. При больших объемах выборки, по-видимому, стоит производить расчет первичных статистик (оценок па­раметров) на ЭВМ.


^ 4) Преобразование эмпирических данных с целью упрощения расчетов


НА. Плохинский указывает на возможность следующих преобразований:

  1. все наблюдаемые значения можно разделить на одно и то же число k,

например перевести показатели из миллиметров в сантиметры и т.п.;

  1. все наблюдаемые значения можно умножить на одно и то же число k,
    например для того, чтобы избавиться от дробных значений;

  2. от всех наблюдаемых значений можно отнять одно и то же число А,
    например наименьшее значение;

  3. можно сделать двойное преобразование: из каждого значения вычесть число А, а полученный результат разделить на другое число k.


При всех этих преобразованиях результативного признака пока­затели соотношения дисперсий получаются точными и не требуют ника­ких поправок.


Средние величины изменяются, но их можно восстановить, ум­ножая среднюю величину на число k или деля ее на k (варианты 1 и 2) или прибавляя к средней число А (вариант 3) и т. п. Стандартное от­клонение изменяется только при введении множителя или делителя; полученный результат затем придется либо разделить на число k, либо умножить на него (Плохинский Н.А.,1964, с.34-36; Плохинский Н.А., 1970, с.71-72).


В последующих трех параграфах будет рассмотрен метод однофакторного анализа в двух вариантах:

а) для дисперсионных комплексов, представляющих данные одной и той же выборки испытуемых, подвергнутой влиянию разных условий (разных градаций фактора);

б) для дисперсионных комплексов, в которых влиянию разных условий (градаций фактора) были подвергнуты разные выбор­ки испытуемых.


Первый вариант называется однофакторным дисперсионным ана­лизом для связанных выборок, второй - для несвязанных выборок.


Все предложенные алгоритмы расчетов предназначены для рав­номерных комплексов, где в каждой ячейке представлено одинаковое число наблюдений.


Вопрос 3

Однофакторный дисперсионный анализ для несвязан­ных выборок


^ Назначение метода


Метод однофакторного дисперсионного анализа применяется в тех случаях, когда исследуются изменения результативного признака под влиянием изменяющихся условий или градаций какого-либо фактора. В данном варианте метода влиянию каждой из градаций фактора подвер­гаются разные выборки испытуемых. Градаций фактора должно быть не менее трех4.

4.Градаций может быть и две, но в этом случае мы не сможем установить нели­нейных зависимостей и более разумным представляется использование более про­стых критериев (см. темы 3 и 4).


Непараметрическим вариантом этого вида анализа является кри­терий Н Крускала-Уоллиса.


^ Описание метода


Работу начинаем с того, что представляем полученные данные в виде столбцов индивидуальных значений. Каждый из столбцов соответ­ствует тому или иному из изучаемых условий (см. Табл. 7.2).

После этого нам нужно просуммировать индивидуальные значе­ния по столбцам и суммы возвести в квадрат.

Суть метода состоит в том, чтобы сопоставить сумму этих возве­денных в квадрат сумм с суммой квадратов всех значений, полученных во всем эксперименте.


Гипотезы


H0: Различия между градациями фактора (разными условиями) являются не более выраженными, чем случайные различия внутри каждой группы.

H1: Различия между градациями фактора (разными условиями) являются более выраженными, чем случайные различия внутри каждой группы.


^ Графическое представление метода для несвязанных выборок


На Рис. 7.2 показана кривая изменения объема воспроизведения слов при разной скорости их предъявления (см. Пример). Метод дис­персионного анализа позволяет определить, что перевешивает - тенден­ция, выраженная этой кривой, или вариативность признака внутри групп, которая на графике схематически изображена в виде диапазонов изменения признака от минимального значения к максимальному значе­нию в каждой группе.



Рис. 7.2. Кривая изменения объема воспроизведения при повышении скорости предъяв­ления слов; по каждому условию показаны диапазоны изменения признака (по данным Greene J.. D'Olivera M, 1989)


Ограничения метода однофакторного дисперсионного анали­за для несвязанных выборок


  1. Однофакторный дисперсионный анализ требует не менее трех града­ций фактора и не менее двух испытуемых в каждой градации.




  1. Должно соблюдаться правило равенства дисперсий в каждой ячейке дисперсионного комплекса. Условие равенства дисперсий выполняется при использовании предлагаемой схемы расчета за счет выравнивания количества наблюдений в каждом из условий (градаций). Правомер­ность этого методического приема была обоснована Г.Шеффе (1980).




  1. Результативный признак должен быть нормально распределен в ис­следуемой выборке.


Правда, обычно не указывается, идет ли речь о распределении признака во всей обследованной выборке или в той ее части, которая составляет дисперсионный комплекс.


Характерно, что зарубежные руководства, в общем, ссылаясь на необходимость нормального распределения данных для дисперсионного анализа, при рассмотрении конкретных схем и примеров к этому вопро­су уже не возвращаются и никаких данных о распределении признака в выборке в целом или в тон ее части, которая составляет дисперсионный комплекс, не приводят (см. McCall R., 1970; Welkowitz J., Ewen R.B., Cohen J., 1982; Greene J., D'Olivera M-, 1989).


Рассмотрим схему дисперсионного однофакторного анализа для не­связанных выборок, предлагаемую в руководстве J.Greene, M.D'Olivera (1989) с использованием примера этих авторов.


Пример

Три различные группы из шести испытуемых получили списки из десяти слов. Первой группе слова предъявлялись с низкой скоростью -1 слово в 5 секунд, второй группе со средней скоростью - 1 слово в 2 секунды, и третьей группе с большой скоростью - 1 слово в секунду. Было предсказано, что показатели воспроизведения будут зависеть от скорости предъявления слов. Результаты представлены в Табл. 7.2.

^ Таблица 7.2.

Количество воспроизведенных слов

(по: J.Greene, M.D'Olivera, 1989,p.99)



испытуемого

Группа 1:

низкая скорость

Группа 2:

средняя скорость

Группа 3:

высокая скорость

1

8

7

4

2

7

8

5

3

9

5

3

4

5

4

6

5

6

6

2

6

8

7

4

Суммы

43

37

24

Средние

7,17

6,17

4,00

Общая сумма

104









Поскольку сопоставляются разные группы, любые различия в по­казателях между разными условиями предъявления слов - это в то же время различия между группами испытуемых. Однако всякие различия между испытуемыми внутри каждой группы объясняются какими-то другими, не относящимися к делу переменными, будь то индивидуаль­ные различия между отдельными испытуемыми или неконтролируемые факторы, заставляющие их реагировать различным образом. Критерий F позволяет проверить гипотезы:

Но: Различия в объеме воспроизведения слов между группами являются не более выраженными, чем случайные различия внутри каждой группы.


Н1: Различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы.


Используя экспериментальные значения, представленные в Табл. 7.2, установим некоторые величины, которые будут необходимы для расчета критерия F.


^ Таблица 7.3.

Расчет основных величин для однофакторного дисперсионного анализа

Обозначение

Расшифровка обозначения

^ Экспериментальные значения

Tc

Суммы индивидуальных значений по каждому из условия

43; 37; 24

(T2c)

Сумма квадратов суммарных значений по каждому из условий

∑(T2c)=432+372+242

C

Количество условий (градаций фактора)

c=3

n

Количество испытуемых в каждой группе (в каждом из условий)

n=6

N

Общее количество индивидуальных значений

N=18

(∑xi)2

Квадрат общей суммы индивидуальных значений

(∑xi)2 =1042



Константа, которую нужно вычесть из каждой суммы квадратов

=

xi

Каждое индивидуальное значение




(xi2)

Сумма квадратов индивидуальных значений






Отметим разницу между (∑xi2), в которой все индивидуальные значения сначала возводятся в квадрат, а потом суммируются, и (∑xi)2, где индивидуальные значения сначала суммируются для получения об­щей суммы, а потом уже эта сумма возводится в квадрат.


Последовательность расчетов представлена в Табл. 7.4.


Часто встречающееся в этой и последующих таблицах обозначе­ние SS - сокращение от "суммы квадратов" (sum of squares). Это со­кращение чаще всего используется в переводных источниках (см., на­пример: Гласе Дж., Стенли Дж., 1976).

SSфакт означает вариативность признака, обусловленную действи­ем исследуемого фактора; SSобщ - общую вариативность признака; SSсл -вариативность, обусловленную неучтенными факторами, "случайную" или "остаточную" вариативность.


MS - "средний квадрат", или математическое ожидание суммы квадратов, усредненная величина соответствующих SS.


df - число степеней свободы, которое при рассмотрении непара­метрических критериев мы обозначили греческой буквой V.

Таблица 7.4

Последовательность операций в однофакторном дисперсионном анализе для несвязанных выборок



^ Примечание (см.Приложение 1).


Вывод: Н0 отклоняется. Принимается H1. Различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы (р<0,01). Итак, скорость предъявления слов влияет на объем их воспроизведения5.


Вер­немся к графику на Рис. 7.2. Мы видим, что, скорее всего, значимость различий объясняется тем, что показатель воспроизведения при самой высокой скорости предъявления слов (условие 3) гораздо ниже соот­ветствующих показателей при средней и низкой скорости.

5 Г.В. Суходольским (1972) предложена формула расчета дисперсионного отноше­ния, которая позволяет получить более строгий результат: Fэмп = (n*MSфакт+MSсл)/MSсл

где n - среднее количество наблюдений в каждой градации.

В данном случае Fэмп =6,942 (p<О,01). Эта величина действительно ниже, чем в цитируемом примере. Однако для первого знакомства с дисперсионным анализом исследователям, обрабатывающим свои данные самостоятельно, в практических целях достаточно использовать приведенный алгоритм расчетов, используемый и в большинстве других руководств (Плохинский Н.А., 1960; Венецкий И.Г., Кильдишев Г.С., 1968; Ивантер Э.В., Коросов А.В.; 1992, Kurtz A.K., Mayo S.T, 1979 и др.).


Вопрос 4

Дисперсионный анализ для связанных выборок


^ Назначение метода


Метод дисперсионного анализа для связанных выборок применяется в тех случаях, когда исследуется влияние разных градаций фактора или разных условий на одну и ту же выборку испытуемых.


Градаций фактора должно быть не менее трех.


Непараметрический вариант этого вида анализа - критерий Фридмана χ2r.


^ Описание метода

В данном случае различия между испытуемыми - возможный са­мостоятельный источник различий. В схеме однофакторного анализа для несвязанных выборок различия между условиями в то же время отра­жали различия между испытуемыми. Теперь различия между условиями могут проявиться только вопреки различиям между испытуемыми.


Фактор индивидуальных различий может оказаться более значи­мым, чем фактор изменения экспериментальных условий. Поэтому нам необходимо учитывать еще одну величину - сумму квадратов сумм ин­дивидуальных значений испытуемых.


^ Графическое представление метода


На Рис. 7.3 представлена кривая изменения времени решения анаграмм разной длины: четырехбуквенной, пятибуквенной и шестибуквенной. Однофакторный дисперсионный анализ для связанных выборок позволит определить, что перевешивает - тенденция, выраженная этой кривой, или индивидуальные различия, диапазон которых представлен на графике в виде вертикальных линий — от минимального до макси­мального значения.



Рис. 7.3. Изменение времени работы над разными анаграммами у тати испытуемых; вертикальными линиями отображены диапазоны изменчивости признака е разных усло­виях от минимального значения (снизу) до максимального значения (сверху)


^ Ограничения метода дисперсионного анализа для связанных выборок

  1. Дисперсионный анализ для связанных выборок требует не менее трех градаций фактора и не менее двух испытуемых, подвергшихся воздействию каждой из градаций фактора.




  1. Должно соблюдаться правило равенства дисперсий в каждой ячейке комплекса. Это условие косвенно выполняется за счет одинакового количества наблюдений в каждой ячейке комплекса. Предлагаемая схема расчета ориентирована только на такие равномерные комплексы.




  1. Результативный признак должен быть нормально распределен в ис­следуемой выборке.


В приводимом ниже примере показатели асимметрии и эксцесса составляют:

А=218

тА=0,632;

tA =2,18/0,632=3,45;

E=4,17;

ME =l,264;

tE =4,17/1,264=3,30.


Таким образом, распределение показателей 5-тй- человек, состав­ляющих дисперсионный комплекс, несколько отличается от нормального: tA>3; tE>3. Однако в целом по выборке распределение нормальное:

n=22;

A=1,26;

тА=0,522

tA=2,41<3;

E=2,29;

mE=1,044;

tE=2,19<3.


По-видимому, необходимо удовлетвориться тем, что в выборке в целом результативный признак распределен нормально. Случайно ото­бранные 5 человек распределением своих оценок демонстрируют неко­торое отклонение. Однако, если бы мы выбирали испытуемых таким образом, чтобы распределение их оценок подчинялось нормальному закону, это нарушило бы правило рандомизации - случайности отбора объектов без учета значений результативного признака при отборе (Плохинский Н.А. 1970).


Данные этого примера нам уже знакомы. Они использовались для иллюстрации непараметрического критерия Фридмана χ2r. Исполь­зование здесь этого же примера позволит нам сопоставить результаты, получаемые с помощью непараметрических и параметрических методов.


Пример


Группа из 5 испытуемых была обследована с помощью трех экс­периментальных заданий, направленных на изучение интеллектуальной настойчивости (Сидоренко Е. В., 1984). Каждому испытуемому инди­видуально предъявлялись последовательно три одинаковые анаграммы: четырехбуквенная, пятибуквенная и шестибуквенная. Можно ли счи­тать, что фактор длины анаграммы влияет на длительность попыток ее решения?

^ Сформулируем гипотезы.

Наборов гипотез в данном случае два.

Набор А.

Но(А): Различия в длительности попыток решения анаграмм разной длины являются не более выраженными, чем различия, обуслов­ленные случайными причинами.


Н1(А): Различия в длительности попыток решения анаграмм разной длины являются более выраженными, чем различия, обусловлен­ные случайными причинами. Набор Б.


Но(Б): Индивидуальные различия между испытуемыми являются не более выраженными, чем различия, обусловленные случайными причинами.


Н1(Б): Индивидуальные различия между испытуемыми являются более выраженными, чем различия, обусловленные случайными причи­нами.

^ Таблица 7.5

Длительность попыток решения анаграмм (сек)



Код имени

испытуемого

Условие 1:

Условие 2.

Условие 3:

Суммы

го испытуемым

Четырехбуквенная анаграмма

пятибуквенная

анаграмма

шести буквенная

анаграмма

1. Л-в

5

235

7

247

2. П-о

7

604

20

631

3. К-в

2

93

5

100

4. Ю-ч

2

171

8

181

5. Р-о

35

141

7

183

Cvmmы по столбцам

51

1244

47

1342
1   2   3   4   5



Скачать файл (2763 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации
Рейтинг@Mail.ru