Основные понятия, используемые при проверке гипотез
Статистическая гипотеза – любое предположение, касающееся неизвестного
распределения случайных величин (элементов). Приведем формулировки нескольких
статистических гипотез:
1. Результаты наблюдений имеют нормальное распределение с
нулевым математическим ожиданием.
2. Результаты наблюдений имеют функцию распределения N(0,1).
3. Результаты наблюдений имеют нормальное распределение.
4. Результаты наблюдений в двух независимых выборках имеют
одно и то же нормальное распределение.
5.
Результаты наблюдений в двух независимых выборках имеют одно и то же
распределение.
Различают
нулевую и альтернативную гипотезы. Нулевая гипотеза – гипотеза, подлежащая
проверке. Альтернативная гипотеза – каждая допустимая гипотеза, отличная от
нулевой. Нулевую гипотезу обозначают Н0, альтернативную – Н1 (от Hypothesis – «гипотеза» (англ.)).
Выбор
тех или иных нулевых или альтернативных гипотез определяется стоящими перед
менеджером, экономистом, инженером, исследователем прикладными задачами.
Рассмотрим примеры.
Пример
11. Пусть нулевая
гипотеза – гипотеза 2 из приведенного выше списка, а альтернативная – гипотеза
1. Сказанное означает, то реальная ситуация описывается вероятностной моделью,
согласно которой результаты наблюдений рассматриваются как реализации
независимых одинаково распределенных случайных величин с функцией распределения N(0,σ),
где параметр σ неизвестен статистику. В рамках этой модели нулевую
гипотезу записывают так:
Н0: σ = 1,
а альтернативную так:
Н1: σ ≠ 1.
Пример 12. Пусть нулевая гипотеза – по-прежнему
гипотеза 2 из приведенного выше списка, а альтернативная – гипотеза 3 из того
же списка. Тогда в вероятностной модели управленческой, экономической или
производственной ситуации предполагается, что результаты наблюдений образуют
выборку из нормального распределения N(m, σ) при некоторых
значениях m и σ. Гипотезы записываются так:
Н0: m = 0, σ = 1
(оба параметра принимают
фиксированные значения);
Н1: m ≠ 0 и/или σ ≠ 1
(т.е. либо m ≠
0, либо σ ≠ 1, либо и m ≠ 0, и σ ≠ 1).
Пример 13. Пусть Н0 – гипотеза 1
из приведенного выше списка, а Н1 – гипотеза 3 из того же
списка. Тогда вероятностная модель – та же, что в примере 12,
Н0: m = 0, σ произвольно;
Н1: m ≠ 0, σ произвольно.
Пример 14. Пусть Н0 – гипотеза 2
из приведенного выше списка, а согласно Н1 результаты наблюдений
имеют функцию распределения F(x), не совпадающую с функцией стандартного нормального
распределения Ф(х). Тогда
Н0: F(х) = Ф(х) при всех х (записывается как F(х) ≡ Ф(х));
Н1: F(х0) ≠ Ф(х0) при некотором х0 (т.е. неверно, что F(х) ≡ Ф(х)).
Примечание. Здесь ≡ - знак тождественного
совпадения функций (т.е. совпадения при всех возможных значениях аргумента х).
Пример 15. Пусть Н0 – гипотеза 3
из приведенного выше списка, а согласно Н1 результаты
наблюдений имеют функцию распределения F(x), не являющуюся нормальной. Тогда
при некоторых m, σ;
Н1: для любых m, σ найдется х0 = х0(m, σ) такое, что
.
Пример 16. Пусть Н0 – гипотеза 4
из приведенного выше списка, согласно вероятностной модели две выборки
извлечены из совокупностей с функциями распределения F(x) и G(x), являющихся нормальными с параметрами m1,
σ1 и m2, σ2 соответственно, а Н1 – отрицание Н0. Тогда
Н0: m1 = m2, σ1 = σ2, причем m1и σ1 произвольны;
Н1: m1 ≠ m2 и/или σ1 ≠ σ2.
Пример 17. Пусть в условиях примера 16 дополнительно
известно, что σ1 = σ2. Тогда
Н0: m1 = m2, σ
> 0, причем m1и σ произвольны;
Н1: m1 ≠ m2, σ > 0.
Пример 18. Пусть Н0 – гипотеза 5
из приведенного выше списка, согласно вероятностной модели две выборки
извлечены из совокупностей с функциями распределения F(x) и G(x) соответственно, а Н1 – отрицание Н0.
Тогда
Н0: F(x) ≡ G(x), где F(x) – произвольная функция распределения;
Н1: F(x) и G(x) - произвольные функции распределения, причем
F(x) ≠ G(x) при некоторых х.
Пример
19. Пусть в условиях
примера 17 дополнительно предполагается, что функции распределения F(x) и G(x) отличаются только сдвигом, т.е. G(x) = F(x - а) при некотором а. Тогда
Н0: F(x) ≡ G(x),
где F(x) – произвольная функция распределения;
Н1: G(x) = F(x - а), а ≠ 0,
где F(x) – произвольная функция распределения.
Пример
20. Пусть в условиях
примера 14 дополнительно известно, что согласно вероятностной модели ситуации F(x) - функция нормального распределения с единичной
дисперсией, т.е. имеет вид N(m, 1). Тогда
Н0: m = 0 (т.е. F(х) = Ф(х)
при всех х );(записывается как F(х) ≡ Ф(х));
Н1: m ≠ 0
(т.е. неверно, что F(х) ≡ Ф(х)).
Пример
21. При
статистическом регулировании технологических, экономических, управленческих или
иных процессов [2] рассматривают выборку, извлеченную из совокупности с
нормальным распределением и известной дисперсией, и гипотезы
Н0: m = m0,
Н1: m = m1,
где значение параметра m = m0 соответствует налаженному ходу процесса, а переход к m = m1 свидетельствует о разладке.
Пример 22. При статистическом приемочном контроле
[2] число дефектных единиц продукции в выборке подчиняется гипергеометрическому
распределению, неизвестным параметром является p = D/N – уровень дефектности, где N – объем партии продукции, D – общее число дефектных единиц продукции
в партии. Используемые в нормативно-технической и коммерческой документации
(стандартах, договорах на поставку и др.) планы контроля часто нацелены на
проверку гипотезы
Н0: p < AQL
против альтернативной гипотезы
Н1: p > LQ,
где AQL – приемочный уровень дефектности, LQ – браковочный уровень дефектности
(очевидно, что AQL < LQ).
Пример 23. В качестве показателей стабильности
технологического, экономического, управленческого или иного процесса используют
ряд характеристик распределений контролируемых показателей, в частности,
коэффициент вариации v = σ/M(X). Требуется проверить нулевую
гипотезу
Н0: v < v0
при альтернативной гипотезе
Н1: v > v0,
где v0 – некоторое заранее заданное
граничное значение.
Пример 24. Пусть вероятностная модель двух выборок –
та же, что в примере 18, математические ожидания результатов наблюдений в
первой и второй выборках обозначим М(Х) и М(У)
соответственно. В ряде ситуаций проверяют нулевую гипотезу
Н0: М(Х) = М(У)
против альтернативной гипотезы
Н1: М(Х) ≠ М(У).
Пример 25. Выше отмечалось большое значение в
математической статистике функций распределения, симметричных относительно 0,
При проверке симметричности
Н0: F(-x) = 1 – F(x) при всех x, в остальном F произвольна;
Н1: F(-x0) ≠ 1 – F(x0) при некотором x0, в остальном F произвольна.
В вероятностно-статистических методах принятия решений
используются и многие другие постановки задач проверки статистических гипотез.
Некоторые из них рассматриваются ниже.
Конкретная задача проверки статистической гипотезы полностью
описана, если заданы нулевая и альтернативная гипотезы. Выбор метода проверки
статистической гипотезы, свойства и характеристики методов определяются как
нулевой, так и альтернативной гипотезами. Для проверки одной и той же нулевой
гипотезы при различных альтернативных гипотезах следует использовать, вообще
говоря, различные методы. Так, в примерах 14 и 20 нулевая гипотеза одна и та
же, а альтернативные – различны. Поэтому в условиях примера 14 следует
применять методы, основанные на критериях согласия с параметрическим семейством
(типа Колмогорова или типа омега-квадрат), а в условиях примера 20 – методы на
основе критерия Стьюдента или критерия Крамера-Уэлча [2,11]. Если в условиях
примера 14 использовать критерий Стьюдента, то он не будет решать поставленных
задач. Если в условиях примера 20 использовать критерий согласия типа
Колмогорова, то он, напротив, будет решать поставленные задачи, хотя, возможно,
и хуже, чем специально приспособленный для этого случая критерий Стьюдента.
При обработке реальных данных большое значение имеет
правильный выбор гипотез Н0 и Н1.
Принимаемые предположения, например, нормальность распределения, должны быть
тщательно обоснованы, в частности, статистическими методами. Отметим, что в
подавляющем большинстве конкретных прикладных постановок распределение
результатов наблюдений отлично от нормального [2].
Часто возникает ситуация, когда вид нулевой гипотезы
вытекает из постановки прикладной задачи, а вид альтернативной гипотезы не
ясен. В таких случаях следует рассматривать альтернативную гипотезу наиболее
общего вида и использовать методы, решающие поставленную задачу при всех
возможных Н1. В частности при проверке гипотезы 2 (из
приведенного выше списка) как нулевой следует в качестве альтернативной
гипотезы использовать Н1 из примера 14, а не из примера 20,
если нет специальных обоснований нормальности распределения результатов
наблюдений при альтернативной гипотезе.