Содержание:€¦  · web view“Доверительные интервалы”...

Post on 27-Jun-2020

23 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Выборочный методОпр.: Статистической совокупностью называют множество однородных предметов или явлений.Опр.: Число n элементов этого множества называется объёмом совокупности.Опр.: Наблюдаемые значения xi признака X называют вариантами. Варианты расположенные в возрастающей последовательности называются дискретным вариационным рядом.Опр.: Под частотой m значения признака понимают число членов совокупности с данной вариантой.Опр.: Отношения частоты к объёму статистической совокупности называют относительной частотой значения признака.

W=

Опр.: Соответствие между вариантами вариационного ряда и их частотами (или относительными частотами) называют статистическим распределением выборки.

xi X1 X2 X3 xk

ni N1 N2 N3 nk

Опр.: Средним выборочным называют величину

B = (2)

Опр.: Дисперсией признака X по отношению к его среднему

арифметическому называют величину DB (x)= (3)

Опр.: Квадратный корень из дисперсии называют средним квадратичным отклонением G(x)= распределения относительных частот.Опр.: Эмпирической функцией распределения называют функцию определяющую для каждого значения относительную частоту событий (X<x),

т.е. F*(x)=w(X<x)= , где -число вариант меньших x , а -объём выборки

Опр.: Полигоном частот называют ломаную, отрезки, которой соединяют точки (x1,n1),(x2,n2),(xk,nk)Опр.: Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых являются частичные интервалы

длинной li ,а высотой

Пример выполнения лабораторной работы №1“ Первичная обработка данных“

Цель работы: Овладеть методом вычисления ,составление эмпирической функции распределения и гистограммы частот.Задание: По данной выборке составить статистическое распределение, вычислить , составить эмпирическую функциюxi 17 18 19 20 21 22 23ni 7 7 3 1 3 2 2

1. Тогда ряд распределения относительных частот имеет видXi 17 18 19 20 21 22 23

W=0,28 0,28 0,12 0,04 0,12 0,08 0,08

2. Вычислить среднюю выборочную :

3. Дисперсия признака X равна DB (x)=

5.Тогда среднее квадратическое отклонение

6.Составим функцию распределения а)x1=17-наименьшая варианта значит F* (x3)=0 при x б) x2=18 , значение x18 , именно x1=17 наблюдалось 7 раз

F*(x)= при 17x 18

в) x3=19 значение x19 ,а именно x2=18 и x1=17 встречались 14 раз т.е.

F*(x)= при 18x 19

Аналогично F*(x)= при 14x 20

F*(x)= при 20x 21

F*(x)= при 21x 22

F*(x)= при 22x 23

Так как x=23 –наибольшая варианта, то F*(x)=1 при x23 Функция распределения имеет вид

F*(x)=

График функции распределения F*(x)

F*(x)

1 0,96 0,84 0,72 0,68 0,56 0,28 17 18 19 20 21 22 23 X 7)Построим полигон частот по точкам (17,7) ; (18;7) ; (19;3) ; (20; 1) ; (21;3); (22;2) ; (23;2) ni

7,5

17 18 19 20 21 22 23 xi

8)Построить гистограмму частотДля этого разобьем вариантный ряд на интервалы равной длины h , в нашем случае h=2Составим таблицу

17-19 19-21 21-23

ni 15 4 6

7,5

3 3 2

n 17 19 21 23

Пример выполнения лабораторной работы №2 “Метод произведений для вычислений ”

Цель работы: Овладеть методом вычисления и в случае распределения равностоящих вариант.Задание: По данной выборке вычислить , xi 12 14 16 18 20 22ni 5 15 50 16 10 4

Составить статистическое распределение.

xi 12 14 16 18 20 22ni 5 15 50 16 10 4

Данное распределение равностоящих вариант и соответствующих им частот.Для вычисления воспользуемся методом произведений.Составим расчётную таблицу 1) запишем варианты в первый столбец2) запишем частоты во второй столбец , сумму частот (100) поместим в

нижнюю клетку столбца ;3) В качестве ложного нуля C выберем варианту, которая принадлежит

строке, содержащей ложный нуль, пишем 0;над нулем последовательно запишем -1, -2; под нулём 1, 2, 3;

4) В четвёртой столбец записываем произведение частот ni на условные варианты ui , сумму произведений

5) Произведение частот на квадраты условных вариант , т.е. запишем

в пятый столбец. Сумму чисел (127) записываем в нижнюю клетку столбца.

Произведения частот на квадраты условных вариант , увеличенных на единицу , т.е. , запишем в шестой контрольный столбец ; сумму чисел столбца (273) помещаем в нижнюю клетку шестого столбца.

Таблица заполнена.Для контроля вычисления пользуются тождеством:

Контроль:

xi ni ui uini niui2 ni(ui+1)2

12 5 -2 -10 20 514 15 -1 -15 15 -16 50 0 -25 - 5018 16 1 16 16 6420 10 2 20 40 9022 4 3 12 36 64

n=100 23=

Для вычисления и воспользуемся формулами

= h –шаг (разность между двумя соседними вариантами) C-ложный ноль

- условный момент I порядка

- условный момент II порядка

С=16

Найдём h, h=14-12=2

Вычислим и

= =0,23

Статистические оценки параметров распределения

Опр. Интервальной называют оценку, которая определяется двумя числами- концами интервала, покрывающего оцениваемый параметр.Опр. Доверительным называют интервал, который с заданной надёжностью покрывает оцениваемый параметр. Для оценки математического ожидания а нормально распределённого количественного признака X по выборочной средней при известном среднем квадратическим отклонении генеральной совокупности служит доверительный интервал.

где - точность оценки; n-объём выборки; t- такое значение аргумента

функции Лапласа Ф(t), при котором Ф(t)= .

При неизвестном (и объёме выборки n>30).

исправленное среднее квадратическое отклонение, находят

по таблице Стьюдента по заданным и . Для оценки среднего квадратического отклонения нормально распределённого количественного признака X с надёжностью по исправленному отклонению S служат доверительные интервалы.

(при g<1) (при g>1)

где g находят по таблице по заданным n и .

Пример выполнения лабораторной работы №3“Доверительные интервалы”

Цель работы :Овладение методом составления доверительных интервалов для оценки математического ожидания при незвестном и для оценки среднего квадратического отклонения нормального распределения.

Порядок выполнения лабораторной работы.

1. Составьте статистическое распределение частот результатов испытаний.

xi -2 1 2 3 4 5

ni 2 1 2 2 2 1

2. Вычислить

n=103. Вычислить исправленное среднее квадратическое отклонение S по

формуле

S=24

4. Найти по таблице Стьюдента по заданным и , .Найдём искомый доверительный интервал покрывающий неизвестное математическое ожидание а с надёжностью .

Подставляя =2, , S=2,4 , Получим 5. Найти g по таблице по заданным и n=10.

6. Найти доверительный интервал для , т.к. g<1 то доверительный интервал имет вид

Подставляя S=2,4 ,g=0,65 получим 0,84

Элементы теории корреляции.Корреляционной зависимостью Y от X называют функциональную зависимость условной средней от X.

представляет уравнение регрессии Y на X.

представляет уравнение регрессии X на Y. Если обе линии регрессии- прямые, то корреляцию называют линейной. Выборочное уравнение прямой линии регрессии Y на X имеет вид:

где - условная средняя, и - выборочные средние признаков X и Y, и - выборочные средние квадратические отклонения; выборочный коэффициент корреляции, причём

Если данные наблюдений над признаками X и Y заданы в виде корреляционной таблицы с равностоящими вариантами, то целесообразно перейти к условным вариантам.

где С1 – “ложный нуль ” варианты X, где С2 – “ложный нуль” варианты Y,h1- шаг варианты X, h2- шаг варианты Y.В этом случае

Для вычисления удобно использовать метод четырёх полей.В случае не группированных данных наблюдений над признаками X и Yуравнение линии регрессии удобнее записать в виде:

где - выборочный коэффициент регрессии Y на X.

Лабораторная работа №4По заданной выборке получить уравнение линии регрессии Y на X.Цель работы: получить уравнение прямой линии регрессии по несгруппированным данным.

Порядок выполнения работы:Заполним вспомогательную таблицу:xi yi Xi

2 xiyi

2 1,25 4 2,52,5 1,4 6,25 3,55 1,5 25 7,56,5 1,75 42,25 11,3757 2,25 49 15,75

а) в первый столбец запишем варианты xi; в нижнюю клетку б) во второй столбец запишем варианты yi; в нижней клетке столбца поместим в) в третий столбец запишем квадраты вариант xi-xi

2. В нижней клетке

столбца поместим .

г) в четвёртый столбец запишем произведения вариант . В нижней

клетке столбца поместим . По формулам

и

вычислим искомые коэффициенты уравнения прямой линии регрессии.

Уравнение прямой лини регрессии имеет вид :

Лабораторная работа №5. “Метод четырёх полей”.Задание: Найти выборочное уравнение прямой линии регрессии Y на X по данным, приведённым в корреляционной таблице используя метод 4-х полей.

20 25 30 35 40 ny

16 4 6 - - - 1026 - 8 10 - - 1836 - - 32 3 9 4446 - - 4 12 6 2256 - - - 1 5 6nx 4 14 46 16 20 n=100 Цель работы: Овладеть методом вычисления коэффициентов прямой линии регрессии по данным корреляционной таблицы.

Порядок выполнения работы.

Составим корреляционную таблицу в условных вариантах, выбрав в качестве C1=30 и C2=36, h1=5 и h2=10.

-2 -1 0 1 2 nv

-2 4 6 - - - 10-1 - 8 10 - - 180 - - 32 3 9 441 - - 4 12 6 222 - - - 1 5 6nu 4 14 46 16 28 n=100Найдём и

Найдём вспомогательные величины и

Найдём

Для вычисления воспользуемся методом четырёх полей.-2 -1 0 1 2 I II

-2 4 6 - - 0

-1 0 1 - - 0

0 III IV1 - - 12 6 0 242 - - 1 5 0 21I II 0 0 36 0

III 0 0 IV 13 32 0 45

Описание заполнения таблицы.1.Найти сумму произведений и по строкам первого поля

и поместим их в дополнительный столбец 2.Найти сумму произведений и по столбцам первого поля

и и поместим их в дополнительную строку 3.Найти сумму чисел дополнительного столбца (28+8=36) и запишем её в первую итоговую клетку Для контроля сложим все числа дополнительной строки (16+20=36) .Аналогично ведётся расчёт и по остальным полям.

Вычислим по формуле

=

Найдём и , , по формулам

Составим уравнение прямой линии регрессии

Окончательно имеем

Статистическая проверка статистических гипотиз. Пусть эмпирическое распределение задано в виде последовательности равностоящих вариант и соответствующих им частот.

xi x1 x2 xN

ni n1 n2 nN

Требуется, используя критерий Пирсона, проверить гипотезу о том, что генералтная совокупность распределена нормально.Правило 1.Вычислить и

2.Вычислить теоретические частоты

n-объём выборки, h-шаг, ui=

3.Сравнить эмпирические и теоретические частоты с помощью Критерия Пирсона. Для этого а) составляют расчётную таблицу, по которой находят

наблюдаемое значение критерия

б) По таблице критических точек распределения x2 по заданному уровню значимости и числу степеней свободы k=S-3 ( S-число групп выборки ) правосторонней критической области.Если < -нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности.Если < - гипотезу отвергают.

Пример выполнения лабораторной работы №6“Критерий согласия Пирсона .”

Цель работы: Овладеть критерием Пирсона. Задание: Используя критерий Пирсона, при уровне значимости , проверить, согласуется ли, гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объёма n=200.xi 5 7 9 1 13 15 17 19 21ni 15 26 25 30 26 21 24 20 13

Порядок выполнения работы:Найдём и

Вычислим теоретические частоты, учитывая , что n=200, h=2 , по формуле

Составим расчётную таблицу

i xi

1 5 -1,62 0,1074 9,12 7 -1,20 0,1942 16,53 9 -0,77 0,2966 25,34 11 -0,35 0,3752 32,05 13 0,08 0,3977 33,96 15 0,51 0,3503 29,87 17 0,93 0,2589 22,08 19 1,36 0,1582 13,59 21 1,78 0,0818 7,0Сравним эмпирические и теоретические частоты а) Составим расчётную таблицу, из которой найдём наблюдаемое значение

критерия

1 15 9,1 5,9 34,81 3,82 26 16,5 9,5 90,25 3,63 25 25,3 -0,3 0,09 0,04 30 32 -2,0 4,00 0,15 26 33,9 -7,9 62,41 1,96 21 29,8 -8,8 77,44 2,37 24 22,0 2,0 4,0 0,28 20 13,5 6,5 42,25 3,09 13 7 6,0 36,00 5,1

200 X2наб=20

X2наб=3,8+3,6+0,0+0,1+1,9+2,3+0,2+3,0+5,1=20

По таблице критических точек распределения X2 по уровню значимости и числу степеней свободы находим

критическую точку правосторонней критической области

Так как < - гипотезу о нормальном распределении генеральной совокупности X отвергаем. Другими словами, эмпирические и теоретические частоты различаются значимо.

Однофакторный дисперсионный анализ.Пусть на количественный нормально распределённый признак X воздействует фактор F, который имеет p постоянных уровнейF1, F2 F3 Fp. На каждом уровне произведено по q испытаний.Результаты наблюдений - числа xij =где i– номер испытания (i=1,2,,q), j-номер фактора (j=1,2,,p), записывают в виде таблицы:Номер испытания Уровни фактора

i F1 F2 Fp

1 x11 X1 Xp

2 X21 X22 X2p

q xq1 Xq2 Xqp

Групповая средяя

Ставится задача: на уровне значимости проверить нулевую гипотезу о равенстве групповых средних при допущении, что групповые генеральные дисперсии хотя и неизвестны, но одинаковы. Для этой задачи вводится общая сумма квадратов отклонений наблюдаемых значений признака от общей средней.

Факторная сумма квадратов отклонений групповых средних от общей средней (характеризует рассеяние между “группами”)

Остаточная сумма квадратов отклонений наблюдаемых значений группы от своей групповой средней (характеризует рассеяние “внутри группы”)

Практически остаточную сумму находят по формуле:Sост=Sобщ-Sфакт

Для вычисления общей и факторной сумм более удобны следующие

формулы:

где – сумма квадратов наблюдаемых значений признака на уровне

Fj -сумма наблюдаемых значений признака на уровне Fj.

Если наблюдаемые значения признака сравнительно больше числа, то для упрощения вычислений вычитают из каждого наблюдаемого значения одно и то же число C, примерно равное общей средней. Если уменьшенные значения

, то

где – сумма квадратов уменьшенных значений признака на

уровне Fj; - сумма уменьшенных значений признака на уровне Fj.

Разделив уже вычисленные факторную и остаточную сумм на соответствующее число степеней свободы, находят факторную и остаточную дисперсии.

,

Сравниваем факторную и остаточную дисперсии по критерию Фишера – Снедекора. Если различие групповых средних незначимоеЕсли различие групповых средних значимое.

Пример выполнения лабораторной работы №7Цель работы: Овладеть методами однофакторного анализа для одинакового числа испытаний на всех уровнях. Задание: Произведено по 4 испытания на каждом из трёх уровней фактора F .Методом дисперсионного анализа, при уровне значимости 0,05 , проверить нулевую гипотезу о равенстве групповых средних. Предполагается, что выборки извлечены из нормальных совокупностей с одинаковыми дисперсиями.Результаты испытаний приведены в таблице.Номер испытания Уровни фактораI F1 F2 F3

1 38 20 212 36 24 223 35 26 314 31 30 34

35 25 27

Прядок выполнения работы.

1.Общая средняя

2.Для упрощения расчёта перейдём к уменьшенным величинамy11=38-29=9 , y21=36-29=7 и т.д.Составим расчётную таблицуНомер испытания Уровни фактора Итоговый столбец

F1 F2 F3

I yi1 yi12 yi2 yi2

2 yi3 yi32

1234

9762

8149364

-9-5-31

812591

-8-725

6449425

Sj=yij2 170 116 142 Sj=428

Tj=yij 24 -16 -8 Tj=0Tj

2 576 256 64 Tj2=896

=

Найдём остаточную сумму квадратов отклонений Sост=Sобщ-Sфакт=428-224=204Найдём факторную дисперсию; для этого разделим Sфакт на число степеней свободы p-1=3-1=2

Найдём остаточную дисперсию, для этого разделим Sост на число степеней свободы p(q-1)=3(4-1)=9

=

Сравним факторную и остаточную дисперсии с помощью критерия Фишера- Снедекора.

Найдём наблюдаемое значение критерия Fнабл=

Учитывая, что число степеней свободы числителя k1=2, а знаменателя k2=9 и что уровень значимости по таблице (см. приложение) находим критическую точку Fкр(0,05;2;9)=4,26Так как нулевую гипотезу о равенстве групповых средних отвергаем. То есть групповые средние “в целом ” различаются значимо.

top related