Logo GenDocs.ru

Поиск по сайту:  

Загрузка...

Лекции по теории принятия решений (ТПР) - файл 1.doc


Лекции по теории принятия решений (ТПР)
скачать (728 kb.)

Доступные файлы (1):

1.doc728kb.17.11.2011 04:18скачать

содержание
Загрузка...

1.doc

1   2   3
Реклама MarketGid:
Загрузка...
^

Выбор меры



Каждая мера центральной тенденции обладает характеристиками, которые делают ее ценной в определенных условиях.

Оценка дисперсии проводится по формуле:



Однако, чаще используется стандартное отклонение в генеральной выборке:



В тех случаях, когда какие-нибудь причины благоприятствуют более частому появлению значений, которые выше или, наоборот, ниже среднего образуется асимметричное распределение.

Показатель асимметрии (A) вычисляется по формуле:



В тех случаях, когда какие-либо причины способствуют преимущественному появлению средних или близких к ним значений, образуется распределение с положительным эксцессом. Если же в распределении преобладают крайние значения, причем одновременно и более низкие и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращая его в двувершинное.

Показатель эксцесса (E) определяется по формуле:




Принцип построения большинства интервальных шкал основан на известном правиле «трех сигм». Примерно 98% всех значений признака при нормальном распределении укладывается в диапазон M  3. Можно построить шкалу в единицах долей стандартного отклонения, которая будет охватывать весь возможный диапазон изменения признака, если крайний слева крайний справа интервалы останутся открытыми.

Например, Кенделл предложил шкалу стенов («стандартной десятки»). Среднее арифметическое значение в «сырых» баллах принимается за точку отсчета. Влево и вправо отмеряются интервалы равные ½ стандартного отклонения. Очень часто этот подход применяется в психологии.





Справа от среднего значения будут располагаться интервалы, равные 6 – 10 стенам, причем последний из интервалов открыт. Слева от среднего значения будут располагаться интервалы, соответствующие с 5 по 1 стен, и крайний левый будет открыт. Теперь мы поднимаемся вверх, к оси «сырых баллов», и размечаем границы интервалов в единицах «сырых баллов». Поскольку М = 10.2,  = 2.4, вправо мы отложим 1/2, то есть 1.2 «сырых балла». Таким образом, граница интервала составит 11.4 «сырых балла». Итак, граница интервала, соответствующего 6 стену, будут простираться от 10.2 до 11.4 баллов. В этот интервал попадет одно «сырое» значение – 11.

Влево от среднего значения получаем интервал 9 – 10.2, соответствующий 5 стену. В него входит 2 «сырых» величины: 9 и 10. Отсюда мы видим, что в шкале стенов иногда на разное количество «сырых» баллов будет приходиться одинаковое количество стенов.

В принципе шкалу стенов можно построить по любым данным, измеренным по крайней мере в порядковой шкале, при объеме выборки n > 200 и нормальном распределении признака.

Другой способ построения равноинтервальной шкалы – группировка интервалов по принципу равенства накопленных частот. При нормальном распределении признак в окрестностях среднего значения группируется большая часть всех наблюдений, поэтому в этой области среднего значения интервалы оказываются уже, а по мере удаления от центра распределения они увеличиваются. Следовательно, такая процентильная шкала является равноинтервальной только относительно накопленной частоты.
^

Статистические гипотезы



Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные.

Нулевая гипотеза – это гипотеза об отсутствии различий. Она обозначается как и называется нулевой потому, что содержит число 0. , где - сопоставляемые значения признаков. Нулевая гипотеза – это то что мы пытаемся опровергнуть, если перед нами стоит задача доказать значимость различий.

Альтернативная гипотеза – это гипотеза о значимости различий. Она обозначается как . Альтернативная гипотеза – это то, что мы хотим доказать. Поэтому иногда ее называют экспериментальной гипотезой.

Бывают задачи, когда необходимо доказать как раз не значимость различий, то есть подтвердить нулевую гипотезу. Например, если нам надо убедиться, что разные испытуемые получили хотя и различные, но уравновешенные по значимости задания, или что экспериментальная и контрольная выборки не различаются между собой по каким-то значимым характеристикам. Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.

^ Направленные гипотезы:

не превышает


превышает

^ Ненаправленные гипотезы

не отличается от

отличается от

Например, если замечено, что в одной из групп изделий проверяемых по какому-либо признаку значения выше, чем в другой группе, то для проверки значимости этих различий необходимо сформировать направленную гипотезу.

Если же мы захотим доказать, что в группе А под влиянием каких-то экспериментальных воздействий произошли более выраженные изменения, чем в группе Б, то нам тоже надо сформулировать направленные гипотезы.

Если же мы хотим доказать, что различается форма распределения в группах А и Б, то формулируется ненаправленная гипотеза.

Проверка гипотез проводится с помощью критериев статистической оценки различий.

^

Статистический критерий



Статистический критерий – это решающее правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью.

Статистические критерии обозначают также метод расчета определенного числа и само это число.

Когда, мы говорим, что достоверность различий определяется по критерию , то имеем в виду, что использовали метод для расчета определенного числа.

По соотношению эмпирического и критического значений критериев судят о том, подтверждается или опровергается гипотеза. Например, если , отвергается.

В большинстве случаев для того, чтобы признать различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть критерии (например, критерий знаков), в которых надо придерживаться противоположного правила.

Эти правила должны оговариваться в руководстве по использованию критерия.

В некоторых случаях расчетная формула критерия включает в себя количество наблюдений в исследуемой выборке n. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице определяется, какому уровню статистической значимости различий соответствует данная эмпирическая величина. Примером такого критерия является критерий , вычисляемый на основе углового преобразования Фишера.

В большинстве случаев одно и то же эмпирическое значение критерия может оказаться значимым или незначимым в зависимости от количества наблюдений в исследуемой выборке n или от количества степеней свободы v.

Число степеней свободы v равно числу классов вариационного ряда минус число условий, при которых он был сформирован. К числу таких условий относится объем выборки, среднее и дисперсия.

Если наблюдения расклассифицированы по классам какой-либо номинативной шкалы и подсчитано количество наблюдений в каждой ячейке классификации, то получается частотный вариационный ряд. Единственное условие, которое соблюдается при таком формирование – объем выборки n. Поэтому, если классификация проводится по трем классам, а число испытаний равно 50, мы свободны только в определении количества наблюдений только в двух классах, количество наблюдений в третьем классе будет определяться первыми двумя. Следовательно, здесь имеем v = c – 1 = 3.

Существуют и более сложные способы подсчета степеней свободы, которые будут рассмотрены далее.

Зная n и/или число степеней свободы, по специальным таблицам можно определить критическое значение критерия и сопоставить с ним эмпирическое значение.

Критерии делятся на параметрические и непараметрические.

Параметрические критерии включают в формулу расчета параметры распределения, то есть, чаще всего, среднее и дисперсию (t – критерий Стьюдента, критерий F и др.).

Непараметрические критерии не включают в формулу расчета параметры распределения и основаны на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т. Вилкоксона и др.).


Возможности и ограничения параметрических и непараметрических критериев




^ Параметрические критерии

Непараметрические критерии

1

Позволяют прямо оценить различия в средних, полученные в двух выборках (t – критерий Стьюдента)

Позволяют оценить лишь средние тенденции, например, ответить на вопрос, чаще ли в выборке А встречаются более высокие, а в выборке Б – более низкие значения признака (критерии Q, U и др.)

2

Позволяют прямо определить различия в дисперсиях (критерий Фишера)

Позволяют оценить лишь различия в диапазонах вариативности признака (критерий )

3

Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный план), но лишь при условии нормального распределения признака

Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерии тенденций L и Q)

4

Позволяет оценивать взаимодействие двух и более факторов и их влияние на изменение признака (двухфакторный дисперсионный анализ)

Эта возможность отсутствует

5

Экспериментальные данные должны отвечать двум, а иногда трем, условиям:

А) значения признака измерены по интервальной шкале

Б) распределение признака является нормальным

В) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейке комплекса

Экспериментальные данные могут не отвечать ни одному из этих условий:

А) значения признаков могут быть представлены в любой шкале, начиная от шкалы наименований

Б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке

В) требование равенства дисперсий отсутствует

6

Математические расчеты достаточно сложны

Математические расчеты по большей части просты и занимают мало времени (за исключением критериев и )

7

Если условие 5 выполняется, параметрические критерии оказываются более мощными

Если условия 5 не выполняются, непараметрические критерии оказываются более мощными

^ Уровни значимости


Уровень значимости – это вероятность того, что мы сочли различия существенными, а они на самом деле случайны. Таким образом, уровень значимости – это вероятность отклонения нулевой гипотезы, в то время как она верна. Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время как она верна, называется ошибкой 1 рода и обозначается . Если вероятность ошибки – это , то вероятность правильного решения 1 - . Чем меньше , тем больше вероятность правильного решения.

Будем обозначать гипотезу об отсутствии различий - , а о статистической достоверности различий - .

Правило отклонения и принятия .

Если эмпирическое значение критерия равняется критическому значению, соответствующему   0.05 (например, так исторически сложилось в психологии) или превышает его, то отвергается, но мы еще не можем определенно принять .

Если эмпирическое значение критерия равняется критическому значению, соответствующему   0.01 или превышает его, то отклоняется и принимается .

Исключение: критерий знаков G, критерий Т. Вилкоксона, критерий U Манна – Уитни. Для них установлено обратное соотношение.

Для иллюстрации правила иногда используют «ось значимости».





Критические значения критерия обозначим , эмпирическое значение критерия как .

Уровень статистической значимости или критические значения критериев определяются по-разному при проверке направленных и ненаправленных статистических гипотез.

При направленной статистической гипотезе используется односторонний критерий, при ненаправленной гипотезе – двусторонний критерий.

^

Мощность критерия



Мощность критерия – это его способность выявлять различия, если они есть. Иными словами, это его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.

Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как она неверна, называется ошибкой второго рода.

Вероятность такой ошибки обозначается . Мощность критерия – это его способность не допустить ошибку второго рода. Поэтому:

«Мощность» = 1 - 

Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут быть решены разным путем. При этом обнаруживается, что некоторые критерии позволяют выявит различия там, где другие оказываются неспособны это сделать, или выявляют более высокий уровень значимости различий. Тогда возникает вопрос, зачем использовать менее мощные критерии? Дело в том, что основанием для выбора критерия может быть не только мощность критерия, но и другие его характеристики, а именно:

  1. Простота;

  2. Более широкий диапазон использования (например, по отношению к данным, определенным по номинативной шкале, или по отношению к большим n)

  3. Применимость по отношению к неравным по размеру выборкам

  4. Большая информативность результатов.


^ Классификация задач и методов их решения


Множество задач, связанных с объектным анализом, предполагают сопоставление объектов. Мы сопоставляем группы объектов по какому-либо признаку, чтобы выявить различия между ними по этому признаку. Мы сопоставляем то, что было «до» с тем, что было «после» наших экспериментальных или любых иных воздействий, чтобы определить эффективность этих воздействий. Мы сопоставляем эмпирическое распределение значений признака с каким-либо теоретическим законом распределения или два эмрирических распределения между собой, с тем, чтобы доказать неслучайность выбора альтернатив или различий в форме распределений.

Мы, даже, можем сопоставить два правила, измеренные на одной и той же выборке объектов, чтобы установить степень согласованности их изменений, их сопряженность, корреляцию между ними.

Наконец, мы можем сопоставить индивидуальные значения, полученные при разных комбинациях каких-либо существенных условий, с тем чтобы выявить характер взаимодействия этих условий и их влияния на индивидуальные значения признака.

Приведем классификацию задач и методов их решения.




Задача

Условие

Методы

1

Выявление различий в уровне исследуемого признака

А) 2 выборки объектов

Q – критерий Розенбаума

U – критерий Манна – Уитни

критерий (угловое преобразование Фишера)

Б) 3 и более выборок объектов

S – критерий Джонкира

H – критерий Крунскала - Уоллиса

2

Оценка сдвига значений исследуемого признака

А) 2 замера на одной и той же выборке объектов

T – критерий Вилкоксона

G – критерий знаков

критерий (угловое преобразование Фишера)

Б) 3 и более замеров на одной выборке объектов

- критерий Фридмана

L – критерий тенденций Пейджа

3

Выявление различий в распределении признака

А) При сопоставлении эмпирического распределения с теоретическим

- критерий Пирсона

 -критерий Колмогорова – Смирнова

m – биноминальный критерий

Б) При сопоставлении двух эмпирических распределений

- критерий Пирсона

 -критерий Колмогорова – Смирнова

критерий (угловое преобразование Фишера)

4

Выявление степени согласованности изменений

А) Двух признаков

- коэффициент ранговой корреляции Спирмена

Б) Двух иерархий или профилей

- коэффициент ранговой корреляции Спирмена

5

Анализ изменений признака под влиянием контролируемых условий

А) Под влиянием одного фактора

S – критерий тенденций Джонкира

L – критерий тенденций Пейджа

Однофакторный дисперсионный анализ Фишера

Б) Под влиянием двух факторов одновременно

Двухфакторный дисперсионный анализ Фишера



^

Принятие решения о выборе метода математической обработки



Алгоритм 1. Принятие решения о задаче и методе обработке, на стадии, когда данные уже получены.

  1. По второму столбцу таблицы, какая задача стоит в вашем исследовании.

  2. По третьему столбцу определить, каковы условия решения задачи, например, сколько выборок обследовано или на какое количество групп можно разделить обследованную выборку.

  3. Обратиться к алгоритму принятия решения о выборе критерия (приведены ниже) и определить, какой именно метод или критерий целесообразно применять.


Алгоритм 2. Принятие решения о задаче и методе обработки на стадии планирования исследования.

  1. Определить, какая модель кажется наиболее подходящей для проведения исследований.

  2. Ознакомьтесь с описанием метода.

  3. Проверьте ограничения критерия и решите, сможете ли вы собрать данные, которые будут отвечать этим ограничениям (объемы выборки, наличие нескольких выборок, монотонность по какому-либо признаку и т.д.).

  4. Провести исследование, а затем обработать данные по заранее выбранному алгоритму, если удалось выполнить ограничения.

  5. Если ограничения выполнить не удалось, обратитесь к алгоритму 1.


Желательно анализировать критерии в следующем порядке:

    • Назначение критерия

    • Описание критерия

    • Гипотезы, которые он позволяет проверить

    • Графическое представление критерия

    • Ограничения критерия

    • Пример или примеры
1   2   3



Скачать файл (728 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации
Рейтинг@Mail.ru