Доверительные интервалы. Точность оценки, доверительная вероятность (надежность)

Рассмотрим построение доверительного интервала для оценки математического ожидания.

Пусть - выборка объемаиз генеральной совокупности объема
;- выборочное среднее;- выборочное среднее квадратическое отклонение.

Доверительный интервал уровня надежности для математического ожидания (генеральной средней) имеет вид

,

где -предельная ошибка выборки , которая зависит от объема выборки , доверительной вероятностии равна половине доверительного интервала.

генеральной средней неизвестном служит доверительный интервал:

где - выборочное среднее;-исправленное выборочное среднее квадратическое отклонение; - параметр, который находится по таблице распределения Стьюдента для (
) степеней свободы и доверительной вероятности.

Интервальной оценкой с надежностью генеральной средней в случае нормального распределения генеральной совокупности приизвестном среднем квадратическом отклонении служит доверительный интервал:

где - выборочное среднее;
- выборочное среднее квадратическое отклонение;- значение аргумента функции Лапласа
, при котором
;- объем выборки.

Выводы . Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия, находится "истинное" (неизвестное) среднее значение признака.

Хорошо известно, например, что чем «неопределенней» прогноз погоды (т.е. шире доверительный интервал), тем вероятнее он будет верным.

Пример. Найти доверительный интервал с надежностью 0,95 для оценки математического ожидания нормально распределенной случайной величины, если известны ее среднее квадратическое отклонение
, выборочная средняя
и объем выборки
.

Воспользуемся формулой
. Значениенайдем по таблице значений функции Лапласа
, с учетом того, что
, т.е.
. Находим по таблице для значения функции
значение аргумента
. Получим доверительный интервал:

; или
.

Тестовые задания

1. Длина доверительного интервала уменьшается с увеличением:

1) выборочных значений 2) объема выборки

3) доверительной вероятности 4) выборочного среднего

2. Длина доверительного интервала с увеличением объема выборки:

1) уменьшается; 2) увеличивается;

3) не изменяется; 4) колеблется.

3. Длина доверительного интервала с увеличением доверительной вероятности:

1) изменяется, 2) уменьшается,

3) увеличивается, 4) постоянна.

4. Отметьте два правильных ответа. Символы ив формуле доверительного интервала означают:

1) оценка параметра; 2) доверительный интервал;

3) объем выборки; 4) доверительная вероятность.

Ответы. 1. 2). 2. 1 3. 2). 4. 4) и 3).

Контрольные Вопросы

    Что понимается под термином «интервальная оценка параметра распределения»?

    Дайте определение доверительного интервала.

    Что такое точность оценки и надежность оценки?

    Что называется доверительной вероятностью? Какие значения она принимает?

    Как изменится длина доверительного интервала, если увеличить: 1) объем выборки, 2) доверительную вероятность? Ответ обоснуйте.

    Запишите формулу для нахождения доверительного интервала математического ожидания нормально распределенной случайной величины, если генеральная дисперсия: 1) известна; 2) неизвестна.

Выборочное среднее квадратическое отклонение, размах выборки. 7. 2.

Контрольные вопросы

1. Запишите формулы для нахождения выборочного среднего по статистическим данным: 1) несгруппированным, 2) сгруппированным и поясните их. Приведите пример.

2. Запишите формулы для нахождения выборочного среднего квадратического отклонения по статистическим данным: 1) несгруппированным, 2) сгруппированным и поясните их. Приведите пример.

3. Назовите числовые характеристики выборки, которые описывают:

1) центр распределения,

2) рассеивание значений случайной величины вокруг центра,

3) симметричность распределения,

4) островершинность распределения?

Часть 2. статистические оценки параметров распределения генеральной совокупности

Тема 1. точечные оценки параметров генеральной совокупности

1. Оценка параметра и ее свойства

Изучаемая генеральная совокупность может быть очень большой. Поэтому ее изучают с помощью выборочного метода. Для выборки из генеральной совокупности вычисляют выборочную среднюю, выборочную дисперсию, и интересующие нас параметры . Например, для нормального распределения – это параметры и https://pandia.ru/text/78/148/images/image101_3.gif" width="16" height="20">.

Как оценить параметры генеральной совокупности, зная значения выборочных параметров?

Статистическая оценка

параметров распределения

Доверительный

Несмещенная Точечная Интервальная интервал

Эффективная оценка оценка

Состоятельная Доверительная

вероятность

* среднее арифметическое * размах варьирования

* медиана * выборочная дисперсия

* мода * выборочное среднее

квадратическое отклонение

Статистическое оценивание параметров распределения

Естественно возникает задача: как оценить (найти приближенное значение) параметра (параметров), которым определяется распределение?

Если генеральную совокупность описывает параметр https://pandia.ru/text/78/148/images/image104_4.gif" width="25" height="20">, которая вычислена по выборке. Например, выборочное среднее оценивает генеральную среднюю ; выборочная дисперсия оценивает генеральную дисперсию ..gif" width="25" height="28 src=">, а параметры – греческими , .

Если статистическая оценка параметра характеризуется одним числом, она называется точечной .

Для каждой конкретной выборки точечная статистическая оценка – это число, т. е. точка на числовой оси.

Статистическая оценка является случайной величиной и меняется в зависимости от выборки.

Для одной и той же неизвестной величины https://pandia.ru/text/78/148/images/image083_3.gif" width="15 height=25" height="25">, выборочная медиана , полусумма крайних элементов.

В силу многообразия оценок, применяемых для оценивания одной и той же неизвестной величины, возникает задача выбора лучшей оценки параметра в определенном смысле..gif" width="25" height="20"> должна быть несмещенной , т. е. ее математическое ожидание должно быть равно оцениваемому параметру.

2..gif" width="24" height="28 src="> представляет собой несмещенную оценку математического ожидания генеральной совокупности .

Выборочная дисперсия https://pandia.ru/text/78/148/images/image112_3.gif" width="20 height=19" height="19">.

Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия , где - поправочный коэффициент.

При больших значения и будут мало отличаться, поэтому «исправление» выборочной дисперсии производят при малых (). В целях повышения надежности полученной оценки следует увеличивать объем выборки.

Пример 1. При обследовании 50 членов семей получен дискретный вариационный ряд.

Определите средний размер (среднее число членов) семьи.

Охарактеризуйте изменчивость размера семьи.

Объясните полученные результаты, сделайте выводы.

Решение

1. В данной задаче изучаемый признак является дискретным , так как размер семей не может отличаться друг от друга менее чем на одного человека. Рассчитаем среднее число членов семьи:

https://pandia.ru/text/78/148/images/image117_3.gif" width="209" height="60">:

https://pandia.ru/text/78/148/images/image119_3.gif" width="39 height=28" height="28">).

Найдем среднее квадратическое отклонение размера семьи: . Среднее квадратическое отклонение размера семьи - 2 человека.

Найдем коэффициент вариации размера семьи по формуле . Коэффициент вариации составляет 38%. Так как коэффициент вариации больше 35%, можно сделать вывод о том, что изучаемая совокупность семей является неоднородной , чем объясняется высокая изменчивость размера семьи в данной совокупности.

Тестовые задания

1. Точечная оценка параметра распределения признака, вычисленная по выборке, характеризуется:

1) одним числом 2) средним значением признака

3) точкой на прямой 4) результатами выборки

2. В результате измерений некоторой физической величины одним прибором (без систематических ошибок) получены следующие результаты (в мм): 11, 13, 15. Тогда оценка дисперсии измерений равна:

1) 4; 2) 13; 3) 8; 4) 3.

3. Отметьте правильные ответы. Качество точечной оценки параметра распределения признака характеризуется:

1) несмещенностью; 2) эффективностью;

3) состоятельностью; 4) случайностью.

4. Отметьте правильный ответ. Несмещенная оценка математического ожидания признака:

1) https://pandia.ru/text/78/148/images/image123_2.gif" width="93 height=60" height="60">;

3) https://pandia.ru/text/78/148/images/image125_2.gif" width="115" height="60">.

5. Оценка генеральной средней признака:

1) выборочное среднее значение 2) среднее значение признака

3) наибольшее значение признака 4) математическое ожидание

6. Несмещенная оценка дисперсии признака:

1) https://pandia.ru/text/78/148/images/image127_3.gif" width="176" height="60 src=">;

3) https://pandia.ru/text/78/148/images/image129_3.gif" width="144 height=60" height="60">.

7. Проведено четыре измерения (без систематических ошибок) некоторой случайной величины (в мм): 5, 6, 9, 12 . Оценка математического ожидания равна:

1) 8,25; 2) 8,5 ; 3) 7; 4) 8.

8. Математическое ожидание оценки параметра равно:

1) параметру; 2) выборочному среднему значению;

3) выборочной дисперсии; 4) нулю.

9. Несмещенная и состоятельная оценка генеральной дисперсии:

1) выборочная дисперсия; 2) исправленная выборочная дисперсия;

3) размах признака; 4) приближенное значение дисперсии.

Ответы . 1 . 1). 2. 1). 3 . 1, 2, 3. 4. 2).

5. 1). 6. 1). 7. 4). 8. 1). 9. 2).

контрольные вопросы

1. Дайте определение точечной статистической оценки.

2. Какая оценка параметра распределения называется точечной?

3..gif" width="25" height="28 src=">?

5. Какая числовая характеристика выборки является несмещенной для математического ожидания?

6. Какая числовая характеристика выборки является несмещенной для дисперсии?

Тема 2. интервальные оценки параметров генеральной совокупности

1. Доверительная вероятность и доверительный интервал

Точечные оценки являются приближенными, так как они указывают точку на числовой оси, в которой должно находиться значение неизвестного параметра.

Оценка параметра при разных выборках одного и того же объема будет принимать разные значения. Поэтому в ряде задач требуется найти не только подходящее значение параметра, но и определить его точность и надежность .

Для этого в математической статистике используется два понятия – доверительный интервал и доверительная вероятность.

Доверительный интервал – интервал значений, в пределах которого, как можно надеяться, находится параметр генеральной совокупности.

Наша надежда выражается доверительной вероятностью вероятность, с которой доверительный интервал «захватит» истинное значение параметра генеральной совокупности. Чем выше доверительная вероятность, тем шире доверительный интервал. Значение доверительной вероятности выбирает сам исследователь. Обычно это 0,9; 0,95; 0,99.

Если статистическая оценка параметра закона распределения случайной величины https://pandia.ru/text/78/148/images/image131_3.gif" width="53" height="24 src=">, в который попадает оцениваемый параметр с заданной надежностью (вероятностью), называется доверительным интервалом , а вероятность - доверительной вероятностью или уровнем надежности. Число называется уровнем значимости .

Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин . Если это предположение не выполнено, то оценка может оказаться плохой, особенно для малых выборок. При увеличении объема выборки, скажем, до 100 или более, качество оценки улучшается и без предположения нормальности выборки.

Например, если среднее выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем p =.95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее популяции. Если мы установим больший уровень доверия, то интервал станет шире, поэтому возрастает вероятность, с которой он "накрывает" неизвестное среднее популяции, и наоборот.

Доверительный интервал применяется в случае сравнительно небольшого объема выборки , когда предполагается, что надежность точечной оценки может быть невысокой.

Доверительный интервал симметричен относительно оценки истинного значения параметра и имеет вид , где - предельная ошибка выборки (наибольшее отклонение выборочного значения параметра от его истинного значения)..gif" width="15" height="20">.

Для доверительного интервала половина его длины называется точностью интервального оценивания .

Если выполняется соотношение , то число называется точностью , а число - надежностью оценки генеральной числовой характеристики https://pandia.ru/text/78/148/images/image141_3.gif" width="115" height="25 src="> - выборка объема из генеральной совокупности объема ; - выборочное среднее; - выборочное среднее квадратическое отклонение.

Доверительный интервал уровня надежности https://pandia.ru/text/78/148/images/image105_2.gif" width="17" height="20 src="> имеет вид

,

где - предельная ошибка выборки , которая зависит от объема выборки , доверительной вероятности и равна половине доверительного интервала.

Https://pandia.ru/text/78/148/images/image144_1.gif" width="16" height="16 src="> служит доверительный интервал:

https://pandia.ru/text/78/148/images/image083_3.gif" width="15" height="25"> - выборочное среднее; - исправленное выборочное среднее квадратическое отклонение; https://pandia.ru/text/78/148/images/image147_2.gif" width="37" height="20 src=">) степеней свободы и доверительной вероятности .

Интервальной оценкой с надежностью генеральной средней https://pandia.ru/text/78/148/images/image144_1.gif" width="16" height="16 src="> служит доверительный интервал:

https://pandia.ru/text/78/148/images/image083_3.gif" width="15" height="25"> - выборочное среднее; - выборочное среднее квадратическое отклонение; https://pandia.ru/text/78/148/images/image151_1.gif" width="39" height="24">, при котором ; - объем выборки.

Выводы . Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия, находится "истинное" (неизвестное) среднее значение признака.

Хорошо известно, например, что чем «неопределенней» прогноз погоды (т. е. шире доверительный интервал), тем вероятнее он будет верным.

Пример. Найти доверительный интервал с надежностью 0,95 для оценки математического ожидания нормально распределенной случайной величины, если известны ее среднее квадратическое отклонение https://pandia.ru/text/78/148/images/image154_1.gif" width="61 height=28" height="28"> и объем выборки .

Воспользуемся формулой https://pandia.ru/text/78/148/images/image150_1.gif" width="11" height="17 src="> найдем по таблице значений функции Лапласа , с учетом того, что , т. е. ..gif" width="59 height=23" height="23">. Получим доверительный интервал:

https://pandia.ru/text/78/148/images/image162_1.gif" width="135" height="24 src=">.

Тестовые задания

1. Длина доверительного интервала уменьшается с увеличением:

1) выборочных значений 2) объема выборки

3) доверительной вероятности 4) выборочного среднего

2. Длина доверительного интервала с увеличением объема выборки:

1) уменьшается; 2) увеличивается;

3) не изменяется; 4) колеблется.

3. Длина доверительного интервала с увеличением доверительной вероятности:

1) изменяется, 2) уменьшается,

3) увеличивается, 4) постоянна.

4. Отметьте два правильных ответа..gif" width="19" height="20 src="> в формуле доверительного интервала означают:

1) оценка параметра; 2) доверительный интервал;

3) объем выборки; 4) доверительная вероятность.

Ответы. 1. 2). 2. 1 3. 2). 4. 4) и 3).

контрольные Вопросы

1. Что понимается под термином «интервальная оценка параметра распределения»?

2. Дайте определение доверительного интервала.

3. Что такое точность оценки и надежность оценки?

4. Что называется доверительной вероятностью? Какие значения она принимает?

5. Как изменится длина доверительного интервала, если увеличить: 1) объем выборки, 2) доверительную вероятность? Ответ обоснуйте.

6. Запишите формулу для нахождения доверительного интервала математического ожидания нормально распределенной случайной величины, если генеральная дисперсия: 1) известна; 2) неизвестна.

Часть 3. проверка статистических гипотез

Тема 1. Основные понятия теории принятия статистического решения

1. Нулевая и альтернативная статистические гипотезы

Статистической гипотезой называется такое предположение о виде или свойствах генерального или выборочного распределений, которое можно проверить статистическими методами на основе имеющейся выборк и.

Сущность проверки статистической гипотезы заключается в том, чтобы установить:

· согласуются ли экспериментальные данные и выдвинутая гипотеза;

· допустимо ли отнести расхождение между гипотезой и результатом статистического анализа экспериментальных данных за счет случайных причин.

· о законе распределения генеральной совокупности (например, гипотеза о том, что количество ошибок внимания у младших школьников имеет равномерное распределение);

· о числовых значениях параметров случайной величины (например, гипотеза о том, что среднее количество правильных ответов студентов контрольной группы на десять тестовых вопросов по теме равно восьми);

· об однородности выборок (т. е. принадлежности их одной и той же генеральной совокупности);

· о виде модели , описывающей статистическую зависимость между несколькими признаками (например, предположение о том, что связь между успешностью обучения математики и показателем невербального интеллекта учащихся линейная, прямо пропорциональная).

Условие (1) означает, что в большой серии независимых экспери­ментов, в каждом из которых получена выборка объема п, в среднем (1 - а) 100% из общего числа построенных доверительных интервалов содержат истинное значение параметра 0.

Длина доверительного интервала, характеризующая точность интер­вального оценивания, зависит от объема выборки n и доверительной ве­роятности 1 - α: при увеличении объема выборки длина доверительного интервала уменьшается, а с приближением доверительной вероятности к единице - увеличивается. Выбор доверительной вероятности опреде­ляется конкретными условиями. Обычно используются значения 1 - α, равные 0,90; 0,95; 0,99.

При решении некоторых задач применяются односторонние довери­тельные интервалы, границы которых определяются из условий

Ρ [θ < θ 2 ] = 1 - α или Ρ [θ 1 < θ] = 1 - α.

Эти интервалы называются соответственно левосторонними и право­сторонними доверительными интервалами.

Чтобы найти доверительный интервал для параметра θ, необходимо знать закон распределения статистики θ ’ = θ ’ (x 1 , ..., х п ), значение ко­торой является оценкой параметра θ. При этом для получения довери­тельного интервала наименьшей длины при данном объеме выборки n и заданной доверительной вероятности 1 - α в качестве оценки θ пара­метра θ следует брать эффективную либо асимптотически эффективную оценку.

2.1.5. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИЙ СОГЛАСИЯ ПИРСОНА.

Критерием согласия называется критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Пусть по выборке объема n получено эмпирическое распределение:

С помощью критерия Пирсона можно проверить гипотезу о различных законах распределения генеральной совокупности (равномерном, нормальном, показательном и др.) Для этого в предположении о конкретном виде распределения вычисляются теоретические частоты n i ’ , и в качестве критерия выбирается случайная величина.

имеющая закон распределения χ2 с числом степеней свободы k = s – 1 – r, где s – число частичных интервалов выборки, r – число параметров предполагаемого распределения. Критическая область выбирается правосторонней, и граница ее при заданном уровне значимости α находится по таблице критических точек распределения χ2.

Теоретические частоты n i ’ вычисляются для заданного закона распределения

как количества элементов выборки, которые должны были попасть в каждый интервал, если бы случайная величина имела выбранный закон распределения, параметры которого совпадают с их точечными оценками по выборке, а именно:



а) для проверки гипотезы о нормальном законе распределения n i ’ = n · Р i , где

n – объем выборки, , x i и x i +1 левая и правая

границы i-го интервала, - выборочное среднее, s – исправленное среднее квадратическое отклонение. Поскольку нормальное распределение характеризуется двумя параметрами, число степеней свободы k = n – 3.

2.1.6. КВАНТИЛЬ

Квантиль - значение, которое заданная случайная величина не превышает с фиксированной вероятностью.

Квантилью уровня P, называется решение уравнения , где P и F заданы.

Квантиль P – значение случайной величины, при котором функция распределения равна P.

В Данной работе будут использованы квантили распределения Стьюдента и хи-квадрат Пирсона.


2.2 РАСЧЁТЫ

Данная выборка

объем выборки

2.3. ВЫВОДЫ

В ходе работы над первой частью курсовой работы был написан подробный

теоретический обзор. Также были решены данные задачи. Получен опыт нахождения статистического ряда, построения гистограммы и полигона частот. После проверки гипотезы было выяснено, что теоретическое меньше, чем практическое. Это означает, что нормальный закон распределения для данной совокупности не подходит.


3 ЧАСТЬ II. РЕГРЕССИОННЫЙ АНАЛИЗ

3.1. ТЕОРИТИЧЕСКИЕ СВЕДЕНЬЯ

Часто у инженера возникает задача выделения сигнала из смеси «сигнал + шум».

Например, на промежутке от t 1 до t 2 функция f(t) имеет вид, но в силу патологического влияния шумов и помех эта кривая превратилась в смесь f(t) + f(n).

Реально мы владеем какой-то информацией и о сигнале и о шуме, но этого недостаточно.

Алгоритм восстановления сигнала из смеси «сигнал + шум»:

1. Задается функция f(t)

2. Генерируется шум с помощью датчика случайных чисел f(n)

3. Построим сумму f(t) + f(n)

4. Принимая модель f(t) в виде полинома третьей степени – кубической параболы. Находим методом МНК коэффициенты этой кубической параболы. Они будут являться функциями y(t)

3.1.1 МЕТОД НАИМЕНЬШИХ КВАДРАТОВ (МНК)

Метод наименьших квадратов (МНК) – это метод оценки неизвестных случайных величин по результатам измерений, содержащим случайные ошибки. В нашем случае дана смесь – сигнал+шум. Наша задача состоит в извлечении истинного тренда.

При помощи метода наименьших квадратов вычисляются коэффициенты аппроксимирующего многочлена. Эта задача решается следующим образом.

Пусть на некотором отрезке в точках … нам известны значения … некоторой функции f(x).

Требуется определить параметры многочлена вида

Где k

такого, что сумма квадратов отклонений значений y от значений функции f(y) в заданных точках x была минимальной, то есть .

Геометрический смысл заключается в том, что график найденного многочлена y = f(x) будет проходить как можно ближе к каждой из заданных точек.

…………………………………………………………………………….

Запишем систему уравнений в матричном виде:

Решением является следующее выражение:

Несмещенная оценка для дисперсии ошибок наблюдений равна:

Чем величина S меньше, тем точнее описывается Y.

N – Объем выборки

k-Число параметров тренда –

Считается по формуле:

Доверительный интервал для коэффициентов тренда считается так:

– квантиль распределения Стьюдента

J-ый диагональный элемент матрицы


3.2 РАСЧЕТЫ

шаг



4. ЗАКЛЮЧЕНИЕ

В ходе выполнения данной курсовой работы был получен опыт нахождения

точечной оценки и доверительного интервала для таких величин, как математическое

ожидание и дисперсия, закреплены навыки построения гистограммы и полигона частот

для некоторой выборки значений.

Так же был освоен метод наименьших квадратов (МНК), как один из способов

в регрессионном анализе для извлечения истинного тренда из смеси сигнал + шум.

Полученные в ходе работы навыки можно использовать не только в учебной

деятельности, но и в повседневной жизни.


СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1. Симонов А.А. Выск Н.Д. Проверка статистических гипотез:

Методические указания и варианты курсовых заданий. Москва, 2005, 46 с.

2. Ю. И. Галанов. Математическая статистика: учебное пособие.

Издательство ТПУ. Москва, 2010, 66 с.

3. Вентцель Е.С. Теория вероятностей: Учебник для студ. вузов, 2005. – 576 с.

4. Э. А. Вуколов, А. В. Ефимов, В.Н. Земсков, А. С. Поспелов. Сборник задач по математике для ВТУЗОВ: Учебник для студентов вузов.

Москва, 2003, 433 с.

5. Чернова Н. И. Математическая статистика: Учеб. пособие / Новосиб. гос. ун-т. Новосибирск, 2007. 148 с.

Теоремы 1 и 2 хотя и являются общими, т. е. сформулированы при достаточно широких предположениях, они не дают возможности установить, насколько близки оценки к оцениваемым параметрам. Из факта, что -оценки являются состоятельными, следует только то, что при увеличении объема выборки значение P (|θ * – θ | < δ), δ < 0, приближается к 1.

Возникают следующие вопросы.

1) Каким должен быть объем выборки п, чтобы заданная точность
|θ * – θ | = δ была гарантирована с заранее принятой вероятностью?

2) Какова точность оценки, если объем выборки известен и вероятность безошибочности вывода задана?

3) Какова вероятность того, что при заданном объеме выборки будет обеспечена заданная точность оценки?

Введем несколько новых определений.

Определение. Вероятность γ выполнения неравенства, |θ *– θ | < δ называется доверительной вероятностью или надежностью оценки θ .

Перейдем от неравенства |θ *–θ | < δ к двойному неравенству. Известно, что . Поэтому доверительную вероятность можно записать в виде

Так как θ (оцениваемый параметр) – число постоянное, а θ * – величина случайная, понятие доверительной вероятности сформулировать так: доверительной вероятностью γ называется вероятность того, что интервал (θ *– δ, θ *+ δ) накрывает оцениваемый параметр.

Определение. Случайный интервал (θ *–δ , θ *+δ ), в пределах которого с вероятностью γ находится неизвестный оцениваемый параметр, называется доверительным интервалом İ , соответствующим коэффициенту доверия γ,

İ= (θ*– δ, θ*+ δ ). (3)

Надежность оценки γ может задаваться заранее, тогда, зная закон распределения изучаемой случайной величины, можно найти доверительный интервал İ . Решается и обратная задача, когда по заданному İ находится соответствующая надежность оценки.

Пусть, например, γ = 0,95; тогда число р = 1 – у = 0,05 показывает, с какой вероятностью заключение о надежности оценки ошибочно. Число р=1–γ называется уровнем значимости. Уровень значимости задается заранее в зависимости от конкретного случая. Обычно р принимают равным 0,05; 0,01; 0,001.

Выясним, как построить доверительный интервал для математического ожидания нормально распределенного признака. Было показано, что

Оценим математическое ожидание с помощью выборочной средней учитывая, что также имеет нормальное распределение*. Имеем

(4)

а по формуле (12.9.2) получаем

Принимая во внимание (13.5.12), получим

(5)

Пусть известна вероятность γ . Тогда

Для удобства пользования таблицей функции Лапласа положим тогда а

Интервал

(7)

накрывает параметр а = М (Х ) с вероятностью γ .

В большинстве случаев среднее квадратическое отклонение σ(Х) исследуемого признака неизвестно. Поэтому вместо σ (Х ) при большой выборке (n > 30) применяют исправленное выборочное среднее квадратическое отклонение s , являющееся, в свою очередь оценкой σ (X ), доверительный интервал будет иметь вид

İ =

Пример. С вероятностью γ = 0,95 найти доверительный интервал для М (Х ) – длины колоса ячменя сорта «Московский 121». Распределение задается таблицей, в которой" вместо интервалов изменения (х i , х i + 1) взяты числа , см. Считать, что случайная величина X подчинена нормальному распределению.

Решение. Выборка большая (n = 50). Имеем

Найдем точность оценки

Определим доверительные границы:

Таким образом, с надежностью γ = 0,95 математическое ожидание заключено в доверительном интервале I = (9,5; 10,3).

Итак, в случае большой выборки (n > 30), когда исправленное среднее квадратическое отклонение незначительно отклоняется от среднего квадратического отклонения значения признака в генеральной совокупности, можно найти доверительный интервал. Но делать большую выборку удается не всегда и это не всегда целесообразно. Из (7) видно, что чем меньше п, тем шире доверительный интервал, т. е. I зависит от объема выборки п.

Английский статистик Госсет (псевдоним Стьюдент) доказал, что в случае нормального распределения признака X в генеральной совокупности нормирования случайная величина

(8)

зависит только от объема выборки. Была найдена функция распределения случайной величины Т и вероятность P (T < t γ ), t γ – точность оценки. Функция, определяемая равенством

s (n , t γ ) = P (|T | < t γ ) = γ (9)

названа t-распределением Стьюдента с п – 1 степенями свободы. Формула (9) связывает случайную величину Т, доверительный интервал İ и доверительную вероятность γ . Зная две из них, можно найти третью. Учитывая (8), имеем

(10)

Неравенство в левой части (13.7.10) заменим равносильным ему неравенством . В результате получим

(11)

где t γ =t (γ ,n ). Для функции t γ составлены таблицы (см. Приложение 5). При n >30 числа t γ и t, найденные по таблице функции Лапласа, практически совпадают.

Доверительный интервал для оценки среднего квадратического отклонения σ x в случае нормального распределения.

Теорема. Пусть известно, что случайная величина имеет нормальное распределение. Тогда для оценки параметра σ х этого закона имеет место равенство

(12)

где γ – доверительная вероятность, зависящая от объема выборки п и точности оценки β .

Функция γ = Ψ (n , β ) хорошо изучена. С ее помощью определяют β = β (γ ,п ). Для β = β (γ ,п ) составлены таблицы, по которым по известным п (объему выборки) и γ (доверительной вероятности) определяется β .

Пример. Для оценки параметра нормально распределенной случайной величины была сделана выборка (дневной удой 50 коров) и вычислено s = 1,5. Найти доверительный интервал, накрывающий с вероятностью γ = 0,95.

Решение. По таблице β (γ , п) для n = 50 и γ = 0,95 находим β = 0,21 (см. Приложение 6).

В соответствии с неравенством (13) найдем границы доверительного интервала. Имеем

1,5 – 0,21·1,5 = 1,185; 1,5 + 0,21·1,5 = 1,185;

Cтраница 2


Качество исходных данных (статистика) о показателях надежности электрооборудования (вместе с показателями ущерба от нарушений электроснабжения и сведениями о режимах работы и ППР) оценивается точностью - шириной доверительного интервала, накрывающего показатель, и достоверностью - вероятностью не совершить ошибку, выбирая этот интервал. Точность математических моделей надежности оценивается их адекватностью реальному объекту, а точность метода расчета надежности - адекватностью полученного решения идеальному.  

Теперь коэффициент вариации дебита, так же как и сам дебит, существенно зависит от &0 / &1 - Так, например, при pi 1 м и ku / k 5 средний дебит уменьшается по сравнению с первоначальным примерно в 2 раза, а ширина доверительного интервала почти в 3 раза. Очевидно, уточнение параметров призабойной зоны в этом случае дает существенную информацию и значительно улучшает качество прогноза.  


Неизменность числа испытаний п на каждой ступени оказывает существенное влияние иа точность результатов. Ширина доверительного интервала уменьшается с увеличением объема выборки.  

Доверительными называют интервалы, в пределах которых находятся с определенными (доверительными) вероятностями истинные значения оцениваемых параметров. Обычно ширину доверительного интервала выражают через СКО результатов отдельных наблюдений ах.  

Ширина доверительного интервала зависит от желаемой статистической надежности е, объема выборки п и от распределения случайных значений, в особенности от разброса. Длина и ширина доверительных интервалов определяется также имеющейся (случайной) выборкой.  

Однако ширина доверительного интервала при этом получается неприемлемо большой. Однако и в этом случае ширина доверительного интервала получается слишком большой.  


Отсюда границы доверительного интервала составляют (23 85 - 2 776 - 0 13; 23 85 2 776Х Х0 13) (23 49; 24 21) МПа. Из результатов видно, что ширина доверительного интервала для той же вероятности должна быть почти в 1 5 раза больше за счет того, что при меньшем числе измерений доверие к ним меньше.  

Из соотношения (2.29) следует, что вероятность того, что доверительный интервал (0 - Д; в Д) со случайными границами накроет известный параметр 0, равна у. Величину Д, равную половине ширины доверительного интервала, называют точностью оценки, а вероятность у - доверительной вероятностью (или надежностью) оценки.  

Интервал (04, 042) называется доверительным, его границы 04 и 0W, являющиеся случайными величинами, соответственно нижним и верхним доверительными пределами. Любая интервальная оценка может быть охарактеризована совокупностью двух чисел: шириной доверительного интервала Н 04 - 0И, являющейся мерой точности оценивания параметра 0, и доверительной вероятностью у, характеризующей степень достоверности (надежности) результатов.  

При этих условиях доверительные границы определяются: для Мэ и а с помощью - распределения, а для Мн - с помощью распределения Стьюдента. Из графиков видно, что при малом числе п наблюдавшихся отказов ширина доверительного интервала, которая характеризует возможное отклонение в оценке параметра распределения, велика. Действительное значение параметра может в несколько раз отличаться от полученного из опыта значения соответствующей статистической оценки. С увеличением п границы доверительного интервала постепенно суживаются. Для получения достаточно точных и достоверных оценок требуется, чтобы при испытании наблюдалось большое число отказов, что, в свою очередь, требует значительного объема испытаний, особенно при высокой надежности объектов.