52.
Интервальные оценки
В кванте 49 и кванте 50 рассматривались оценки генерального среднего и генеральной дисперсии, которые проводились одним числом. Такие оценки называются точечными. Часто бывает необходимо не просто оценить некоторый параметр генеральной совокупности одним числом, но еще и указать интервал, в который этот параметр попадает с заданной вероятностью. Оценки, которые определяются двумя числами — концами интервала — называют интервальными.Будем для определенности говорить об интервальной оценке генерального среднего, хотя рассматривают также оценки генеральной дисперсии, вероятности и т.п. Пусть  — это неизвестное генеральное среднее, которую оценивают при помощи выборочного среднего . Если (или ), то говорят, что интервал шириной 2 δ покрывает неизвестное истинное значение группового среднего . Положительное число δ характеризует точность оценки: чем меньше δ, тем точность оценки выше. Интервал называется доверительным интервалом. Выборочное среднее, а, значит, и границы интервала являются случайными величинами, поэтому можно говорить лишь о некоторой вероятности, что интервал покрывает неизвестное значение . Вероятность, что называют надежностью (или доверительной вероятностью) и будем обозначать ее символом γ. Обычно требуемую надежность задают числами 0,95, 0,99 или 0,999 и находят интервал δ в окрестности , который покрывает неизвестное с этой вероятностью. Более точно, с математической точки зрения: нужно найти такую δ, что .Чтобы посчитать вероятность, нужно сделать некоторые предположения о распределении рассматриваемого признака в генеральной совокупности. Будем считать, что случайная величина — значения рассматриваемого признака — имеет нормальное распределение с известным среднеквадратичным отклонением σ. Такое предположение вполне может быть оправдано центральной предельной теоремой, рассмотренной в кванте 43. Если случайная величина распределена нормально, то и выборочное среднее имеет нормальное распределение с тем же математическим ожиданием, но другим среднеквадратичным отклонением, а именно: . Тогда , где  — функция Лапласа, а . Здесь для получения вероятности было проинтегрировано нормальное распределение в пределах δ-окрестности от пика распределения (2 Ф (x)) и учтена четность подынтегрального выражения.Резюмируя, для получения доверительного интервала поступают следующим образом. Задается надежность γ. Далее, используя таблицу (см. квант 22) или какой-либо вычислительный пакет, работающий с функцией Лапласа (или интегралом ошибок), из соотношения 2 Ф (x) = γ определяют x. В частности, для γ, равных 0,95, 0,99 и 0,999, имеем:.Далее по найденному вычисляется доверительный интервал:.Этот интервал берется в окрестности выборочного среднего, расчет которого нами был рассмотрен в кванте 49. Следует отметить, что доверительный интервал расширяется (уменьшается точность) при увеличении надежности (увеличивается x) и сужается (увеличивается точность) при увеличении объема выборки.Пример 52.1Случайная величина распределена нормально со среднеквадратичным отклонением . Найти доверительный интервал для оценки математического ожидания по выборочному среднему (объем выборки 100) с надежностью 0,99.Для надежности 0,99 величина . Отсюда находим .Замечание. Мы рассмотрели задачу нахождения доверительного интервала по заданным надежности и объему выборки. Возможны и другие постановки задачи. Если задана надежность γ и точность δ, то с помощью формулы можно определить минимальный объем выборки, необходимый для реализации заданной точности с заданной надежностью: . Если задана точность δ и объем выборки n, то можно определить надежность:.Если среднеквадратичное отклонение нормального распределения значений случайной величины в генеральной совокупности неизвестно, то пользоваться написанными выше формулами нельзя. Для решения этого вопроса рассмотрим случайную величину , которая имеет уже не нормальное распределение, а распределение Стьюдента с n - 1 степенями свободы. Все использованные здесь обозначения уже были введены нами ранее. В итоге имеем, что вероятность , только определяется она уже не функцией Лапласа, а функцией распределенияСтьюдента, значение которой может быть взято из таблицы (см. ниже).

n

γ

n

γ

0 ,95

0,99

0,999

0 ,95

0,99

0,999

5

2 ,78

4,60

8,61

20

2,093

2,861

3,883

6

2 ,57

4,03

6,86

25

2,064

2,797

3,745

7

2 ,45

3,71

5,96

30

2,045

2,756

3,659

8

2 ,37

3,50

5,41

35

2,032

2,720

3,600

9

2 ,31

3,36

5,04

40

2,023

2,708

3,558

10

2 ,26

3,25

4,78

45

2,016

2,692

3,527

11

2 ,23

3,17

4,59

50

2,009

2,679

3,502

12

2 ,20

3,11

4,44

60

2,001

2,662

3,464

13

2 ,18

3,06

4,32

70

1,996

2,649

3,439

14

2 ,16

3,01

4,22

80

1,001

2,640

3,418

15

2 ,15

2,98

4,14

90

1,987

2,633

3,403

16

2 ,13

2,95

4,07

100

1,984

2,627

3,392

17

2 ,12

2,92

4,02

120

1,980

2,617

3,374

18
2 ,11
2,90
3,97
1,960
2,576
3,291

19

2 ,10

2,88

3,92

 

 

 

 

Таким образом для определения доверительного интервала при неизвестном среднеквадратичном отклонении поступают следующим образом: для заданной надежности γ и известном объеме выборки по таблице рассчитывают , затем из этой формулы определяют доверительный интервал δ. Процедура аналогична, рассмотренной выше, с той лишь разницей, что среднеквадратичное отклонение здесь неизвестно, а вместо него рассчитывается «исправленное» выборочное среднеквадратичное отклонение . Ввиду этого и закон распределения вероятностей случайной величины T оказывается иным.Видеолекция «Интервальные оценки»: