Logo GenDocs.ru

Поиск по сайту:  

Загрузка...

Курс математики для гуманитариев - файл Лекция 11-12 - теория вероятностей и оснвы статистика.doc


Курс математики для гуманитариев
скачать (20432 kb.)

Доступные файлы (10):

Лекция 11-12 - теория вероятностей и оснвы статистика.doc3448kb.22.05.2011 18:33скачать
Лекция 13-14 - анализ нормального распределения и статистические критерии.doc12976kb.22.05.2011 18:33скачать
Лекция 1- введение.doc220kb.22.05.2011 18:33скачать
Лекция 2 - логика1.doc289kb.22.05.2011 18:33скачать
Лекция 3 - логика2.doc1796kb.22.05.2011 18:33скачать
Лекция 4 - логика3.doc129kb.22.05.2011 18:33скачать
Лекция 5 - логика4.doc106kb.22.05.2011 18:33скачать
Лекция 6 - множества_фукнции_отношения.doc675kb.22.05.2011 18:33скачать
Лекция 7-8 - комбинаторика.doc241kb.22.05.2011 18:33скачать
Лекция 9-10 - теория вероятностей.doc553kb.22.05.2011 18:33скачать

содержание

Лекция 11-12 - теория вероятностей и оснвы статистика.doc

Лекции 11—12. Теория вероятностей и основы статистики



Статистика — это наука, изучающая количественные изменения массовых общественных явлений и процессов в неразрывной связи с их качественным содержанием. Для описания, оценки и анализа этих процессов и явлений применяют различные математические модели, в том числе и вероятностные. Эти модели строятся на следующих понятиях случайная величина; математическое ожидание; дисперсия; законы распределения и др.

В статистике модели конкретизируются с помощью основных статистических понятий: абсолютные и относительные статистические показатели; средние показатели: средняя арифметическая, геометрическая, гармоническая, средние степенные и др.; дисперсия случайной дискретной величины и законы распределения; корреляция, динамика и структурные сдвиги.

Сформулируем базовые понятия.

^ Случайной называют величину, которая в результате испытания примет одно и только одно возможное значение, наперед не известное и зависящее от случайных причин, которые заранее не могут быть учтены.

Например, число родившихся мальчиков среди ста новорожденных есть случайная величина, которая имеет следующие возможные значения: 0, 1, 2, ..., 100.
Подобные случайные величины называются дискретными, т.к. они могут быть записаны в виде конечной или бесконечной последовательности значений. Кроме этого выделяют постоянную дискретную случайную величину, которая принимает одно и то же значение при любом испытании (аналог — достоверное и невозможные события).

Если случайные величины принимают значения из некоторого числового промежутка (интервала), то они называются непрерывными (интервальными).

Пример расстояние, которое пролетит снаряд при выстреле из орудия, есть случайная величина. Действительно, расстояние зависит не только от установки прицела, но и от многих других причин (силы и направления ветра, температуры и т. д.), которые не могут быть полностью учтены. Возможные значения этой величины принадлежат некоторому промежутку (а, b).

^ Генеральной (статистической) совокупностью называют множество однородных хотя бы по одному какому-либо признаку явлений, существование которых ограничено в пространстве и времени. Количество (N) входящих в генеральную совокупность объектов называют объемом генеральной совокупности.

Выборка – множество случайно отобранных объектов (значений) из генеральной совокупности. Объемом выборки (n) называется число входящих в нее объектов. К выборке предъявляется требование, чтобы она адекватно представляла генеральную совокупность, т.е. была репрезентативной (представительной).

^ Основной характеристикой, как генеральной совокупности, так и выборки является их однородность, т.е. наличие для всех единиц совокупности основного свойства, качества, типичности.
^

Закон распределения


Для того чтобы задать (определить) дискретную случайную величину недостаточно перечислить все ее возможные значения, нужно указать вероятности этих значений.

^ Законом распределения дискретной случайной величины называют соответствие между возможными значениями и их вероятностями; его можно задать таблично, аналитически (в виде формулы) и графически.

При табличном задании закона распределения дискретной случайной величины первая строка таблицы содержит возможные упорядоченные значения, а вторая — их вероятности:

Х

х1

х2

х3



хn

т.к. все возможные значения X образуют полную группу событий,

Р

p1

p2

p3



pn

то сумма их вероятностей будет равна 1


При графическом изображении закона распределения в декартовой системе координат по оси абсцисс откладываются все возможные упорядоченные значения Х, по оси ординат — соответствующие вероятности. На пересечении значений и соответствующих им вероятностей троят точки Мnn;pn)



1. Найти ряд распределения случайной величины X — числа выпавших очков при однократном бросании игрального кубика.

Х

1

2

3

4

5

6

Р

1/6

1/6

1/6

1/6

1/6

1/6


Подобное распределение называется равномерным и графически представляет собой прямую, параллельную оси абсцисс.



2. В денежной лотерее выпущено 1000 билетов. Разыгрывается один выигрыш в 100 рублей, 10 выигрышей по 10 рублей и 100 выигрышей по 1 рублю. Найти ряд распределения случайной величины Х — стоимость выигрыша для владельца одного лотерейного билета.


Х

100

10

1

0

Р

p1

p2

p3

p4


Найдем вероятности соответствующих выигрышей:

p1=1/1000=0,001; p1=10/1000=0,01; p1=100/1000=0,1; т.к. все возможные значения Х образуют полную группу событий, то p1+p2+p3+p4=1=> p4= 1- (p1+p2+p3) = 1- 0,111 = 0,889.


Х

100

10

1

0

Р

0,001

0,01

0,1

0,889


Подобное распределение называется монотонно убывающим. Упорядочим значения Х по возрастанию на оси абсцисс, тогда на графике закон распределения будет представлять собой нисходящую кривую.




.


3. Монета брошена 2 раза. Найти закон распределения случайной величины X — числа выпадений «герба».

Вероятность появления «герба» в каждом бросании монеты р = 1/2, следовательно, вероятность непоявления «герба» q = 1/2.

При двух бросаниях монеты «герб» может появиться либо 2 раза, либо 1 раз, либо совсем не появиться. Таким образом, возможные значения X таковы:

Х

2

1

0

Р

p2

p3

p4

Найдем вероятности этих значений (сложных событий) по формуле Бернулли.

Рn(k) = Сkn * pkqn-k

Вероятность сложного события – орел выпадет дважды: Р2(2)=С222*q0=1/22=0,25

Вероятность сложного события – орел выпадет один раз: Р1(1)=С121*q1=2*1/21*1/21=0,5

Вероятность сложного события – орел не выпадет дважды: Р2(0)=С020*q2=1/22=0,25
Подобное распределение называется биномиальным, т.к. в основе определения вероятностей лежит формула бинома Ньютона.



Также в статистике используются и другие законы распределения, например, нормальное распределение. Но определение его требует ввода некоторых других математических и статистических понятий.
^

Характеристики случайной величины и статистические показатели


В некоторых случаях, например, когда не известен закон распределения, для анализа случайной величины используют так называемые «суммарные» (интегральные) свойства случайной величины, которые в статистике называются статистическими показателями. Рассмотрим некоторые из них.
^

Показатели центра распределения: математическое ожидание и средняя арифметическая величина



Математическим ожиданием дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности. Оно показывает, вокруг какой точки группируются значения случайной величины, являясь одним из показателей центра распределения.

(Х) = х11 + х22 + х33 + … + хnn

1. Найти математическое ожидание дискретной случайно величины, если известен ряд ее распределения:

Х

3

5

2

Р

0,1

0,6

0,3

М(Х) = 3*0,1 + 5*0,6 + 2*0,3 = 3,9
2. Найти математическое ожидание числа появлений события А в одном испытании, если вероятность наступления события А = р.

Случайная величина Х может принимать только два значения 1 с вероятностью р – событие А произошло или 0 с вероятностью q – событие А не произошло. Следовательно, ряд распределения будет выглядеть следующим образом:

Х

1

0

Р

p

q

Тогда М(Х) = 1*p + 0*q = p.
3. Найти математическое ожидание случайной величины Х — числа выпавших очков при однократном бросании игральной кости.

М(Х) = 1*1/6 + 2*1/6 + 3*1/6 + 4*1/6 + 5*1/6 + 6*1/6 = 21/6 = 3,5.
^ Среднее арифметическая величина – это статистическая характеристика, которая отражает только типичные проявления признака в исследуемой совокупности. Она может быть представлена в двух формах: взвешенной и невзвешенной.

Невзвешенная форма используется, если исходные данные представлены в несгруппированном виде.


Студенты

Таня

Петя

Вася

Лена

Гена

Вера

Лера

Гера

Надя

Ваня

Оценки (х)

4

3

5

3

5

4

3

4

4

2

Тогда среднюю успеваемость группы мы можем найти по формуле:



4+3+5+3+5+4+3+4+4+2 / 10 = 3,7

Эта же таблица может быть представлена сгуппированными данными. Тогда значения, которые принимает Х (пятибалльная система оценивания) будут записаны в первой строке таблицы, а количество студентов, которые эти оценки получили — во второй.

Х

1

2

3

4

5

Итого

Кол-во

студентов

0

1

3

4

2

10

студентов

Чтобы найти средне арифметическое по сгруппированным данным используется формула средней арифметической взвешенной:



где mi – количество студентов, обладающих какой-либо оценкой.

Тогда, (1*0+2*1+3*3+4*4+5*2) /10 = 3,7.

Математическое ожидание имеет вероятностный характер. Это отражается в законе больших чисел.

Эмпирическое среднее (среднее арифметическое) достаточно большой конечной выборки из фиксированного распределения близко к теоретическому среднему (математическому ожиданию) этого распределения.
^

Мода и медиана


Помимо средней арифметической к показателям центра распределения относятся также мода и медиана.

Мода распределения (Мо) — это такая величина изучаемого признака, которая в данной совокупности встречается наиболее часто, т.е. один из вариантов признака повторяется чаще, чем все другие. Мода отражает типичный, наиболее распространенный вариант значения признака.

^ По несгруппированным данным:

11 человек имеют следующие тарифные разряды: 5, 4, 3, 4, 5, 5, 6, 2, 6, 3, 5. Тарифный разряд 5 будет модальным.
Для упорядоченного дискретного ряда распределения мода, являющаяся характеристикой вариационного ряда, определяется по частотам вариантов и соответствует варианту с наибольшей частотой.



^ Медиана (Ме) — это величина изучаемого признака, которая находится в середине упорядоченного вариационного ряда. Главное свойство медианы в том, сумма отклонений значений признака от медианы меньше, чем от любой другой величины. Медиана выполняет функцию средней величины для неоднородной совокупности, не подчиняющейся нормальному закону распределения.

^ Распределения, где средняя арифметическая не дает объективной характеристики большинства из группы исследуемых характеризуется показателями медиана.



^ Пример определения медианы при нечетном числе вариантов.

11 человек имеют следующие тарифные разряды: 5, 4, 3, 4, 5, 5, 6, 2, 6, 3, 5. Для определения медианы следует провести ранжирование рабочих по тарифному разряду: 2, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6.
^ Пример определения медианы при четном числе вариантов.

Если ранжированный ряд включает 12 рабочих: 2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6; то находится средняя арифметическая двух центральных значений 4+5/2=4,5 разряда.
^

Показатели степени вариации


Показатели центра распределения не всегда дают полную характеристику вариационному ряду. Для более глубокого анализ распределения случайной величины используют показатели размаха вариации, дисперсии и среднего квадратического отклонения (стандартного отклонения).

^ Размах вариации (R) – показатель, определяющий насколько велико различие между единицами совокупности, имеющими наибольшее и наименьшее значение признака. Зависимость для его расчета имеет вид

R= хmax – хmin

Дисперсией дискретной случайной величины называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания.

D(X) = M((Х-М(Х))2)=(х1-М(Х))21 +…+ n-М(Х))2n



В статистике формулировка и запись формулы дисперсии (также как и формула математического ожидания) имеют несколько другой вид и используется в двух формах (взвешенной и невзвешенной):

Дисперсия — средняя величина квадратов отклонений индивидуальных значений признака от их средней величины.

^ Простая дисперсия для несгруппированных данных



Взвешенная дисперсия для интервального вариационного ряда


^ Среднеквадратическое отклонение корень квадратный из дисперсии. Часто используется в качестве единицы измерения отклонений от средней арифметической. Среднеквадратическое отклонение, показывает, насколько в среднем отклоняются конкретные варианты признака от среднего значения. Они выражаются в тех же единицах измерения, что и признак (метры, тонны, рубли и т.д.).

Исчисляют простое среднеквадратическое отклонение для не сгруппированных данных и взвешенное среднеквадратическое отклонение для интервального вариационного ряда.



Для нормального распределения существует следующая взаимосвязь между величиной среднеквадратического отклонения и количеством наблюдений.



Последнее отклонение в 3 сигмы считается максимально возможным. Это положение называют правилом трех сигм.

Примеры вычисления 2 и  по несгруппированным данным.



Средняя арифметическая = 300/6=50 млн руб.

2 = 448/6 = 74,67

 = КОРЕНЬ (2) = 8,64 млн. руб

Примеры вычисление 2 и  по сгруппированным данным в дискретном вариационном ряду для двух рядов данных



Средняя арифметическая = 15

2 = 118/132 = 0,89

 = КОРЕНЬ (2) = 0,94 разряда

2 = 720/170 = 4,24

 = КОРЕНЬ (2) = 2,05 разряда
^ Относительные показатели вариации используются для сравнения колеблемости различных признаков в одной и той же совокупности, либо при сравнении колеблемости одного и того же признака в разных совокупностях. Базой структуры этих показателей является средняя арифметическая.

К относительным показателям вариации относятся

^ Коэффициент осцилляции — отражает относительную колеблемость крайних значений признака вокруг средней



^ Коэффициент вариации



Последний показатель получил наибольшее распространение в практических расчетах. Совокупность считается однородной, если коэффициент вариации не превышает 33%.






Скачать файл (20432 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации