ГОСТ Р 50779.25-2005
(ИСО 3494:1976)
Группа Т59
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Статистические методы
СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
Мощность тестов для средних и дисперсий
Statistical methods. Statistical interpretation of data.
Power of tests relating to means and variances
ОКС 03.120.30
Дата введения 2006-01-01
Предисловие
Цели и принципы стандартизации в Российской Федерации установлены Федеральным законом от 27 декабря 2002 года N 184-ФЗ "О техническом регулировании", а правила применения национальных стандартов Российской Федерации - ГОСТ Р 1.0-2004 "Стандартизация в Российской Федерации. Основные положения"
Сведения о стандарте
1 ПОДГОТОВЛЕН Открытым акционерным обществом "Научно-исследовательский центр контроля и диагностики технических систем" (ОАО НИЦ КД) и Техническим комитетом по стандартизации ТК 125 "Статистические методы в управлении качеством продукции" на основе собственного аутентичного перевода стандарта, указанного в пункте 4
2 ВНЕСЕН Управлением развития, информационного обеспечения и аккредитации Федерального агентства по техническому регулированию и метрологии
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 30 сентября 2005 года N 235-ст
4 Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 3494:1976 "Статистическое представление данных - Мощность тестов для средних и дисперсий" (ISO 3494:1976 "Statistical interpretation of data - Power of tests relating to means and variances") путем изменения его структуры.
Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2004 (подраздел 3.5).
Сопоставление структуры настоящего стандарта со структурой указанного международного стандарта приведено в дополнительном приложении А
5 ВВЕДЕН ВПЕРВЫЕ
Информация об изменениях к настоящему стандарту публикуется в ежегодно издаваемом информационном указателе "Национальные стандарты", а текст изменений и поправок - в ежемесячно издаваемых информационных указателях "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячно издаваемом информационном указателе "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте национального органа Российской Федерации по стандартизации в сети Интернет
1 Область применения
1 Область применения
Общие замечания
1) Настоящий стандарт согласован с ГОСТ Р 50779.21.
Настоящий стандарт применим, если распределение наблюдаемой случайной величины является нормальным в каждой совокупности. В ГОСТ Р 50779.21 упомянут только риск первого рода (или уровень значимости). Настоящий стандарт вводит понятия риска второго рода и мощности критерия.
2) Риск первого рода, обозначаемый , является вероятностью отклонения нулевой гипотезы (проверяемой гипотезы), если эта гипотеза верна (случай двусторонних критериев), или максимальным значением этой вероятности (случай односторонних критериев). Неотклонение нулевой гипотезы приводит к принятию гипотезы, хотя не означает, что гипотеза верна.
Соответственно, риск второго рода, обозначаемый , - это вероятность неотклонения нулевой гипотезы, когда она является ложной. Дополнение вероятности ошибки второго рода - это мощность критерия (1-) (см. далее в "Исторических замечаниях").
3) Поскольку значение риска первого рода выбирает потребитель в соответствии с последствиями (обычно используют значение =0,05 или =0,01), риск второго рода зависит от истинной гипотезы (нулевая гипотеза является ложной), т.е. альтернативной гипотезы. При сравнении среднего совокупности (далее - среднее) с заданным значением конкретная альтернатива [которая была отклонена ()] может соответствовать значению среднего совокупности . Как правило, при сравнительных испытаниях средние и дисперсии альтернативы определены значениями параметра.
4) Кривая оперативной характеристики критерия показывает значение риска второго рода как функцию параметра, определяющего альтернативу. Значение зависит также от выбранного значения риска первого рода, объема выборки и типа критерия (двусторонний или односторонний).
При проверке гипотез о средних также зависит от стандартного отклонения совокупности(ей). Если стандартное отклонение неизвестно, риск не может быть известен точно.
5) Кривые оперативной характеристики позволяют решать следующие задачи:
а) задача 1: Для данной альтернативы и заданного объема выборки определить вероятность неотклонения нулевой гипотезы (риск второго рода);
b) задача 2: Для данной альтернативы и заданного значения определить объем выборки.
Хотя решить обе задачи позволяет единственный набор кривых, для облегчения практического использования приведены два набора кривых:
- наборы кривых 1.1-14.1, задающие риск как функцию альтернативы для =0,05 или =0,01 и различных значений объема выборки;
- наборы кривых 1.2-14.2, задающие объем(ы) выборки как функцию альтернативы для =0,05 или =0,01 и различных значений риска
.
6) Необходимо обратить внимание на практическое значение представления статистик с помощью кривых. При проверке гипотезы вида (или ) желательно знать, можно ли сделать заключение с небольшим риском ошибки, что ненамного отличается от (или не отличается от ). Кроме того, выбор значения =0,05 или =0,01 для риска первого рода является достаточно произвольным. Поэтому полезно исследовать результаты процедуры проверки гипотез для значений, близких к (или значения разности , близкие к 0), используя оба значения риска первого рода =0,05 и =0,01, и оценить посредством кривых оперативной характеристики значения риска , соответствующие различным альтерн