53.
Проверка гипотез
Определение. Статистической гипотезой называют гипотезу о виде неизвестного распределения или о параметрах известного распределения.Статистическими гипотезами будут следующие гипотезы: генеральная совокупность имеет нормальное распределение, генеральное среднее равно нулю, дисперсии двух нормальных совокупностей равны и тому подобные.Обычно выдвинутую гипотезу называют нулевой (основной), а гипотезу, противоречащую основной, — конкурирующей (альтернативной).Гипотезу называют простой, если она состоит из одного предположения (например, генеральное среднее равно нулю). Гипотезу называют сложной, если она состоит из конечного или бесконечного числа простых гипотез (например, генеральное среднее больше нуля).Гипотеза может оказаться правильной, а может быть неправильной. Соответственно, при принятии или отклонении нулевой гипотезы можно совершить следующие ошибки:Легко видеть, что правильное решение может быть принято также в двух случаях:Определение. Уровнем значимости α называется вероятность совершить ошибку первого рода.Обычно уровень значимости принимают α = 0,05 или α = 0,01 , и он означает вероятность отвергнуть правильную гипотезу.Определение. Статистическим критерием называют выбранную случайную величину K, которая служит для проверки нулевой гипотезы.В качестве статистического критерия проверки гипотезы о равенстве нулю генерального среднего выбирают выборочное среднее, в качестве критерия проверки гипотезы о равенстве дисперсий двух совокупностей — отношение двух «исправленных» выборочных дисперсий.Определение. Наблюдаемым значениемKнабл называют значение критерия (случайной величины), вычисленное по данным выборки (или выборок).После выбора критерия все возможные его значения можно разбить на два непересекающихся подмножества. Одно из подмножеств соответствует значениям критерия, когда нулевая гипотеза принимается, а другое подмножество — значениям критерия, когда она отвергается. Первое из подмножеств называется областью принятия гипотезы, а второе — критической областью. Точки kкр, которые разделяют область принятия гипотезы от критической области, называются критическими точками. В зависимости от того, какая из конкурирующих гипотез выдвинута, критические области разделяются на правостороннюю, левостороннюю или двустороннюю.Правостороннюю критическую область определяют из равенства:.Это означает, что вероятность того, что значение критерия будет больше, чем kкр , равно вероятности отвергнуть нулевую гипотезу.Для левосторонней критической области аналогично:.В случае двусторонней критической области:.Для проверки гипотезы задают уровень значимости α, из таблиц критических точек, соответствующих распределению выбранного критерия, определяют критическую точку (или точки). Далее по наблюдаемому значению критерия определяют, попадает ли он в критическую область. Если наблюдаемое значение критерия окажется в критической области, то гипотезу отвергают. Если оно окажется в области принятия гипотезы, то гипотезу принимают (иногда это формулируют как «нет оснований отвергнуть гипотезу»).Рассмотрим задачу проверки статистической гипотезы на примере сравнения дисперсий двух нормальных генеральных совокупностей. Такая задача возникает в случае, когда необходимо сравнить точность двух инструментов по погрешностям в характеристиках деталей, которые с помощью них изготовлены. Тот инструмент, который дает меньший разброс, очевидно, лучше.Пусть имеются две нормально распределенные генеральные совокупности, из которых извлекаются выборки объемом n1 и n2 соответственно. Зададим уровень значимости α и выдвинем нулевую гипотезу: «Генеральные дисперсии равны, D1 = D2». Для проверки нужно рассчитать «исправленные» выборочные дисперсии и . Если эти дисперсии оказались не равны, это еще не значит, что и генеральные дисперсии не равны, поскольку отличие выборочных дисперсий может быть связано со случайными причинами. Поэтому возникает задача определить, насколько значимо отличие в выборочных дисперсиях. Составим отношение большей дисперсии к меньшей:.Величина K есть случайная величина, подчиняющаяся закону распределения Фишера—Снедекора со степенями свободы и .Рассмотрим в качестве альтернативной гипотезы: « D1 > D2». В этом случае критическая область будет правосторонней. Действительно, случайная величина K может принимать значения от 1 до бесконечности, причем именно большие значения K соответствуют ситуации, что нулевую гипотезу нужно отклонить. Критическая область находится из соотношения , где kкр определяется из таблицы критических точек распределения Фишера—Снедекора (см. таблицы ниже). Если наблюдаемое на основе выборок значение критерия окажется больше, чем kкр, то гипотезу о равенстве дисперсий отвергают. Если значение критерия будет меньше kкр, то оснований для отклонения гипотезы о равенстве дисперсий нет.

Таблица критических точек распределения Фишера—Снедекора при уровне значимости α = 0,01 ( k1 — число степеней свободы большей дисперсии, k2 — число степеней свободы меньшей дисперсии)

k2

k1

1

2

3

4

5

6

7

8

9

10

11

12

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

4052
98,49
34,12
21,20
16,26
13,74
12,25
11,26
10,56
10,04
9,86
9,33
9,07
8,86
8,68
8,53
8,40

4999
99,01
30,81
18,00
13,27
10,92
9,55
8,65
8,02
7,56
7,20
6,93
6,70
6,51
6,36
6,23
6,11

5403
99,17
29,46
16,69
12,06
9,78
8,45
7,59
6,99
6,55
6,22
5,95
5,74
5,56
5,42
5,29
5,18

5625
99,25
28,71
15,98
11,39
9,15
7,85
7,01
6,42
5,99
5,67
5,41
5,20
5,03
4,89
4,77
4,67

5764
99,30
28,24
15,52
10,97
8,75
7,46
6,63
6,06
5,64
5,32
5,06
4,86
4,69
4,56
4,44
4,34

5889
99,33
27,91
15,21
10,67
8,47
7,19
6,37
5,80
5,39
5,07
4,82
4,62
4,46
4,32
4,20
4,10

5928
99,34
27,67
14,98
10,45
8,26
7,00
6,19
5,62
5,21
4,88
4,65
4,44
4,28
4,14
4,03
3,93

5981
99,36
27,49
14,80
10,27
8,10
6,84
6,03
5,47
5,06
4,74
4,50
4,30
4,14
4,00
3,89
3,79

6022
99,38
27,34
14,66
10,15
7,98
6,71
5,91
5,35
4,95
4,63
4,39
4,19
4,03
3,89
3,78
3,68

6056
99,40
27,23
14,54
10,05
7,87
6,62
5,82
5,26
4,85
4,54
4,30
4,10
3,94
3,80
3,69
3,59

6082
99,41
27,13
14,45
9,96
7,79
6,54
5,74
5,18
4,78
4,46
4,22
4,02
3,86
3,73
3,61
3,52

6106
99,42
27,05
14,37
9,89
7,72
6,47
5,67
5,11
4,71
4,40
4,16
3,96
3,80
3,67
3,55
3,45

Таблица критических точек распределения Фишера—Снедекора при уровне значимости α = 0,05 ( k1 — число степеней свободы большей дисперсии, k2 — число степеней свободы меньшей дисперсии)

k2

k1

1

2

3

4

5

6

7

8

9

10

11

12

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

161
18,51
10,13
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
4,54
4,49
4,45

200
19,00
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,88
3,80
3,74
3,68
3,63
3,59

216
19,16
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20

225
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,90

230
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,02
2,96
2,90
2,85
2,81

234
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70

237
19,36
8,88
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,92
2,84
2,77
270
2,66
2,62

239
19,37
8,84
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
2,64
2,59
2,55

241
19,38
8,81
6,00
4,78
4,10
3,68
3,39
3,18
3,02
2,90
2,80
2,72
2,65
2,59
2,54
2,50

242
19,39
8,78
5,96
4,74
4,06
3,63
3,34
3,13
2,97
2,86
2,76
2,67
2,60
2,55
2,49
2,45

243
19,40
8,76
5,93
4,70
4,03
3,60
3,31
3,10
2,94
2,82
2,72
2,63
2,56
2,51
2,45
2,41

244
19,41
8,74
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
2,48
2,42
2,38

Пример 53.1Из двух генеральных совокупностей извлечены выборки объемом и . По этим выборкам получены «исправленные» выборочные дисперсии и . При уровне значимости проверить гипотезу о равенстве генеральных дисперсий, при конкурирующей гипотезе .Наблюдаемое значение критерия составляет . Критическая область правосторонняя. По таблице критических точек распределения Фишера—Снедекора для имеем: . Поскольку мы попадаем в область принятия гипотезы и, соответственно, нет оснований отвергнуть гипотезу о равенстве генеральных дисперсий.Видеолекция «Проверка гипотез»: