Logo GenDocs.ru

Поиск по сайту:  

Загрузка...

Симонов А.А., Выск Н.Д. Математическая статистика - файл n1.doc


Симонов А.А., Выск Н.Д. Математическая статистика
скачать (434.5 kb.)

Доступные файлы (1):

n1.doc435kb.25.12.2012 08:35скачать


n1.doc

  1   2   3


Федеральное агентство по образованию
Государственное образовательное учреждение

высшего профессионального образования
«МАТИ» – Российский государственный

технологический университет им. К.Э. Циолковского


Кафедра «Высшая математика»

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА


Методические указания и варианты курсовых заданий


Составители: Симонов А.А.

Выск Н.Д.
Москва 2005

Пособие предназначено для студентов второго курса, изучающих в рамках курса высшей математики тему «Математическая статистика». В нем рассматриваются основные способы обработки данных выборки, построение точечных и интервальных оценок параметров генеральной совокупности, определение параметров функциональной зависимости между различными случайными величинами. В каждом разделе приводится решение типовых задач. Для закрепления материала студентам предлагается выполнить курсовую работу по перечисленным выше темам. Задания для курсовой работы включают 6 задач по теме «Математическая статистика».

Настоящее пособие может быть использовано на всех факультетах и специальностях.

  1. ОСНОВНЫЕ МЕТОДЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ


Задачей математической статистики является получение информации о поведении некоторой случайной величины по относительно небольшому количеству ее значений (выборке), полученной случайным образом из всего множества значений случайной величины (генеральной совокупности).


    1. Способы первичной обработки выборки


Если из генеральной совокупности извлечена выборка, состоящая из п чисел (при этом п называется объемом выборки), в которой число х1 повторяется п1 раз, число х2п2 раза,…, число хknk раз (то есть выборка содержит k различных значений случайной величины), то числа xi называются вариантами, соответствующие им ni – частотами, а последовательность вариант, записанных в порядке возрастания, и относящихся к ним частот – статистическим рядом. При этом вместо абсолютных частот ni можно задавать распределение относительных частот .
Пример 1. Дана выборка, состоящая из чисел: 3.2, 4.1, 8.1, 8.1, 6.7, 4.4, 4.4, 3.2, 5.0, 6.7, 6.7, 7.5, 3.2, 4.4, 6.7, 6.7, 5.0, 5.0, 4.4, 8.1. Составить статистический ряд распределения абсолютных и относительных частот.
Решение.

Объем выборки п = 20. Перепишем варианты в порядке возрастания:

3.2, 3.2, 3.2, 4.4, 4.4, 4.4, 4.4, 4.4, 5.0, 5.0, 5.0, 6.7, 6.7, 6.7, 6.7, 6.7, 7.5, 8.1, 8.1, 8.1.

Составлен так называемый вариационный ряд, который показывает, что выборка состоит из шести вариант (3,4,5,6,7,8). Составим статистический ряд:



xi

3.2

4.4

5.0

6.7

7.5

8.1

ni

3

5

3

5

1

3

wi

0,15

0,25

0,15

0,25

0,05

0,15


(относительная частота ).

Если получена выборка значений непрерывной случайной величины, где число вариант очень велико, составляется сгруппированный статистический ряд. Для его получения интервал (a, b), содержащий все варианты, делится на k равных частей длины , и в качестве абсолютных частот выступают количества вариант, попавших на данный интервал.

Наглядное представление о поведении случайной величины, исследуемой по выборке, дает гистограмма – столбчатая диаграмма, состоящая из прямоугольников, основания которых – частичные интервалы длины h, а высоты – плотности абсолютных или относительных частот. При этом общая площадь гистограммы абсолютных частот равна объему выбор-ки, а гистограммы относительных частот – единице.
Пример 2. Дана выборка, вариационный ряд которой имеет вид:

10,8; 11,1; 11,7; 12,2; 13,1; 13,4; 13,9; 14,3; 14,3; 14,4; 14,8; 16,5; 17,7; 18,2; 19,9; 20,0; 20,3; 20,8; 23,1; 24,2; 25,1; 25,1; 25,7; 28,4; 28,5; 29,3; 29,8; 29,9; 30,2; 30,4.

Составить статистический ряд распределения абсолютных и относительных частот, состоящий из пяти интервалов, и построить гистограмму относительных частот.
Решение.

Объем выборки п = 30. Выберем в качестве границ интервала а = 10,5 и b = 30,5. Тогда и (a, b) разбивается на части (10,5; 14,5), (14,5; 18,5), (18,5; 22,5), (22,5; 26,5) и (26,5; 30,5). Статистический ряд при этом имеет вид:

Номер интервала

Границы

интервала

Абсолютные

частоты

Относительные

частоты

1

10,5; 14,5

10



2

14,5; 18,5

4



3

18,5; 22,5

4



4

22,5; 26,5

5



5

26,5; 30,5

7




Построим гистограмму:



x


    1. Точечные оценки параметров распределения


По имеющейся выборке можно дать оценку математического ожидания и дисперсии генеральной совокупности. Оценкой математического ожидания служит выборочное среднее



то есть среднее арифметическое всех элементов выборки, а оценкой дисперсии – выборочная дисперсия

.

Заданная таким образом оценка математического ожидания является несмещенной, то есть математическое ожидание выборочного среднего равно оцениваемому параметру (математическому ожиданию исследуемой случай-ной величины). Выборочная дисперсия, напротив, смещенная оценка генеральной дисперсии, и Поэтому вводится несмещен-ная оценка генеральной дисперсии – исправленная выборочная дисперсия



Соответственно число является несмещенной точечной оценкой среднего квадратического отклонения.
Пример 3. Найти выборочное среднее, исправленную выборочную дисперсию и исправленное среднее выборочное отклонение для выборок, заданных в примерах 1 и 2.
Решение.

1)


2) В выборке из примера 2 будем считать вариантами середины частичных интервалов, то есть определим точечные оценки для выборки


xi

12,5

16,5

20,5

24,5

28,5

ni

10

4

4

5

7


Тогда




    1. Интервальные оценки параметров распределения


Точечная оценка при малом объеме выборки может существенно отличать-ся от оцениваемого параметра, поэтому важно знать, насколько истинное значение параметра может отклоняться от найденной точечной оценки. Интервал вида где Ө­ - истинное значение оцениваемого параметра, а Ө* - его точечная оценка, называется доверительным интерва-лом, а вероятность доверительной вероятностью или надежностью. Для построения доверительного интервала требуется знать закон распределения исследуемой случайной величины. Пусть эта величина распределена по нормальному закону. Если при этом известно ее среднее квадратическое отклонение ?, то доверительный интервал для математичес-кого ожидания имеет вид:



где а – оцениваемое математическое ожидание, хВ – выборочное среднее, п – объем выборки, t – такое значение аргумента функции Лапласа Ф (t), при котором

При неизвестном среднем квадратическом отклонении доверительный интервал для математического ожидания при заданной надежности ? задается так:



Здесь s – исправленное выборочное среднее квадратическое отклонение, а критическая точка распределения Стьюдента, значение которой можно найти из таблиц по известным п и ?.

Для оценки генерального среднего квадратического отклонения ? при заданной надежности ? можно построить доверительный интервал вида



где s – исправленное выборочное среднее квадратическое отклонение, а q = q (n, ?) – значение, определяемое из таблиц.
Пример 4. Дана выборка значений нормально распределенной случайной величины: 2, 3, 3, 4, 2, 5, 5, 5, 6, 3, 6, 3, 4, 4, 4, 6, 5, 7, 3, 5. Найти с довери-тельной вероятностью ? = 0,95 границы доверительных интервалов для математического ожидания и дисперсии.
Решение.

Объем выборки п = 20. Найдем = 4,25, s = 1,37. По таблицам ([1], табл. 3 и 4) определим t (0,95; 20) = 2,093; q (0,95; 20) = 0,37. Тогда



доверительный интервал для математического ожидания;



доверительный интервал для дисперсии.


    1. Определение параметров функциональной зависимости

методом наименьших квадратов
При совместном исследовании двух случайных величин по имеющейся выборке (х1, у2), (х2, у2),…,(xk, yk) возникает задача определения зависимости между ними. Если вид функции y = f (x, a, b,...) задан, то требуется найти значения коэффициентов a, b,..., при которых yi наименее отличаются от f (xi). В методе наименьших квадратов коэффициенты должны быть такими, что принимает минимальное значение.

а) Линейная зависимость y = ax + b. Если , то из условия получаем:



б) Квадратичная зависимость y = (ax + b)2. Отсюда и система для определения a, b может быть получена по аналогии с предыдущим случаем с помощью замены yi на :



в) Показательная зависимостьЛогарифмируя, получаем: lny=ax + b, и система уравнений для a, b имеет вид:



г) Зависимость вида Тогда y2 = ax + b, и условия для а и b можно задать так:



д) Логарифмическая зависимость y = ln(ax + b), то есть ey = ax + b, и




Пример 5. Найти параметры зависимости между х и у для выборки



xi

1,4

1,7

2,6

3,1

4,5

5,3

yi

2,5

4,7

18,3

29,8

74,2

110,4


для случаев: 1) линейной зависимости y = ax + b;

2) квадратичной зависимости y = (ax + b)2;

3) показательной зависимости y = eax + b.

Определить, какая из функций является лучшим приближением зависимости между х и у.
Решение.

По виду выборки достаточно очевидно, что связь между х и у скорее всего не является линейной – у растет не пропорционально х. Проверим это предположение, найдя коэффициенты а и b для каждой из функций. Для этого вычислим предварительно = 3,1; = 40,0;



Теперь можно решать линейные системы для а и b:

1) то есть линейная зависи-мость имеет вид: у = 27,34х – 44,74.

2) квадратичная функция:

у = (2,29х – 1,68)2.

3) показательная функция:

у = е0,94х + 0,04.

Вычислим значения

:


yi

2,5

4,7

18,3

29,8

74,2

110,4



(yi)лин

-6,46

1,74

26,34

40,0

78,29

100,13

379,93

(yi)кв

2,33

4,9

18,27

29,37

74,4

109,35

1,397

(yi)показ

3,85

5,09

11,67

18,8

69,5

146,66

1503,81


Итак, наилучшим приближением является квадратичная функция.


II. ЭЛЕМЕНТЫ ТЕОРИИ КОРРЕЛЯЦИИ
1. Линейная корреляция
Если для выборки двумерной случайной величины (X, Y): {(xi, yi), i = 1, 2,..., n} вычислены выборочные средние и и выборочные средние квадратические отклонения ?х и ?у, то по этим данным можно вычислить выборочный коэффициент корреляции

.

Напомним, что коэффициент корреляции – безразмерная величина, которая служит для оценки степени линейной зависимости между Х и Y: эта связь тем сильнее, чем ближе |r| к единице.

Линейные уравнения, описывающие связь между Х и Y, называются выборочным уравнением прямой линии регрессии Y на Х:



и выборочным уравнением прямой линии регрессии Х на Y :

.
Пример 11. Для выборки двумерной случайной величины


i

1

2

3

4

5

6

7

8

9

10

xi

1,2

1,5

1,8

2,1

2, 3

3,0

3,6

4,2

5,7

6,3

yi

5,6

6,8

7,8

9,4

10,3

11,4

12,9

14,8

15,2

18,5


вычислить выборочные средние, выборочные средние квадратические отклонения, выборочный коэффициент корреляции и составить выборочное уравнение прямой линии регрессии Y на Х.
Решение.





Для определения выборочного коэффициента корреляции вычислим предварительно Тогда

Выборочное уравнение прямой линии регрессии Y на Х имеет вид: или
2. Ранговая корреляция
Рассмотрим выборку объема п, элементы которой обладают двумя качест-веными признаками: А и В (качественный признак невозможно измерить точно, но можно расположить объекты в порядке убывания или возрастания качества).

Расположим элементы выборки в порядке ухудшения качества по признаку А. При этом зададим каждому объекту ранг хi, равный его порядковому номеру в последовательности объектов: xi = i. Затем расположим элементы выборки в порядке убывания качества по признаку В и присвоим каждому второй ранг: yi, где номер i – это номер объекта в первой последовательности рангов. Таким образом, получены две последовательности рангов:

A: x1, x2, ..., xn

B: y1, y2, ..., yn.

Для исследования наличия связи между качественными признаками А и В можно использовать коэффициенты ранговой корреляции Спирмена и Кендалла.

Коэффициент ранговой корреляции Спирмена вычисляется по формуле:



где di = xiyi, n – объем выборки.

Для вычисления коэффициента ранговой корреляции Кендалла найдем величины R1, R2, ..., Rn, где Ri – количество чисел, больших yi, стоящих справа от yi в последовательности рангов по признаку В. Тогда выборочный коэффи-циент ранговой корреляции Кендалла



где R = R1 + R2 + ... + Rn.

Заметим, что оба коэффициента ранговой корреляции не превосходят по модулю единицы. При этом, чем ближе значение или к 1, тем теснее возможная связь между признаками А и В.
Пример 12. Десять школьников сдавали выпускной экзамен ЕГЭ по математике и вступительный экзамен по системе централизованного тестиро-вания. Результаты обоих экзаменов оценивались по 100-балльной шкале и оказались следующими (1-я строка – оценки ЕГЭ, вторая – централизованно-го тестирования):

87 82 80 79 63 55 40 34 33 29

57 92 80 69 71 43 49 51 20 19

Найти выборочные коэффициенты корреляции Спирмена и Кендалла.
Решение.

Составим последовательности рангов по убыванию баллов на каждом экзамене:

xi 1 2 3 4 5 6 7 8 9 10

yi 5 1 2 4 3 8 7 6 9 10 .

Вычислим di: d1 = 1 – 5 = -4; d2 = 2 – 1 = 1; d3 = 3 – 2 = 1; d4 = 4 – 4 = 0;

d5 = 5 – 3 = 2; d6 = 6 – 8 = -2; d7 = 7 – 7 = 0; d8 = 8 – 6 = 2; d9 = d10 = 0.

Найдем Тогда выборочный коэффициент ранговой корреляции Спирмена

Приступим к вычислению коэффициента корреляции Кендалла. Определим, сколько рангов, больших данного, располагается справа от каждого yi:

R1 = 5; R2 = 8; R3 = 7; R4 = 5; R5 = 5; R6 = 2; R7 = 2; R8 = 2; R9 = 1; R10 = 0;

R = 5 + 8 + 7 + 5 + 5 + 2 + 2 + 2 + 1 = 37;

Заметим, что величины выборочных коэффициентов корреляции позволяют предполагать существование связи между результатами экзаменов. Для проверки этого предположения следует проверить гипотезу о значимости соответствующего выборочного коэффициента ранговой корреляции.

Задания для курсовой работы включают по 6 задач. В них требуется выполнить следующие действия:
Задача 1. По данным выборки

1) построить статистический ряд распределения;

2) изобразить гистограмму;

3) вычислить выборочное среднее;

4) вычислить выборочную дисперсию.
Задача 2. Используя метод наименьших квадратов, найти параметры

зависимости y = f(ax + b) :

а) в предположении, что эта зависимость линейна;

б) в предположении, что зависимость нелинейна, выбрав по форме данных ее наиболее вероятный вид. В ответе требуется указать:

1) коэффициенты a и b для линейной зависимости;

2) форму нелинейной зависимости;

3) коэффициенты a и b для нелинейной зависимости;

4) величины средних квадратических отклонений для линейного и нелиней-ного случая.
Задача 3. По данным выборки, удовлетворяющей нормальному закону распределения, вычислить:

1) выборочное среднее;

2) исправленное выборочное среднее квадратическое отклонение;

3) доверительный интервал для математического ожидания при доверитель-ной вероятности ?;

4) доверительный интервал для среднего квадратического отклонения для того же значения ?.
Задача 4. По данным выборки, удовлетворяющей нормальному закону распределения со средним квадратическим отклонением s , вычислить

1) выборочное среднее;

2) доверительный интервал для математического ожидания при доверительной вероятности ?.
Задача 5. По данным выборки двумерной случайной величины определить:

1) вектор математического ожидания;

2) вектор дисперсии;

3) выборочный коэффициент корреляции;

4) выборочное уравнение прямой линии регрессии Y на X в виде Y = aX + b.
  1   2   3



Скачать файл (434.5 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации