Рассмотрим задачу по проверке близости теоретической и эмпирической функций распределения для дискретного распределения [7]. При этом закон распределения задаётся набором вероятностей р1,., рk, а гипотеза сводится к тому, что эти вероятности приняли определенные значения. То есть гипотеза Н0: р1 = р10, р2 = р20,., рk = рk0. Для решения такой задачи используется теорема Пирсона.
Теорема Пирсона
Пусть n - число независимых повторений некоего опыта, который заканчивается одним из k (k - натуральное число) элементарных исходов А1,., Аk, причём вероятности этих исходов - р1,., рk, p1 +. + рk = 1. Обозначим через m1,.,mk (m1 +. + mk = n) то количество опытов, которые закончились исходами А1,., Аk. Введем случайную величину
. (91)
Тогда при неограниченном росте n → ∞ случайная величина асимптотически подчиняется распределению с (k - 1) степенями свободы.
Для проверки гипотезы Н0 о том, что вероятности р1,…, рk приняли определенные значения Н0: р1 = р10, р2 = р20,., рk = рk0, рассмотрим следующую статистику: Статистика
(92)
называется статистикой хи-квадрат Пирсона для простой гипотезы.
Фактически величина XІ/n представляет собой квадрат некоего расстояния между двумя k-мерными векторами: вектором наблюдаемых относительных частот (mi/n) и вектором предсказанных ненаблюдаемых вероятностей (рi0). От евклидового расстояния это расстояние отличается тем, что разные координаты входят в него с разными весами. Если верна гипотеза Н0, то асимптотическое поведение XІ при n → ∞ указывает теорема Пирсона. Чтобы понять, что происходит, когда Н0 неверна, заметим, что по закону больших чисел (mi/n) → рi при n → ∞ для всех допустимых i = 1,.,k. Поэтому при n → ∞:
. (93)
Если гипотеза неверна, то XІ → ∞ при n → ∞. Значит, гипотеза Н0 должна быть отвергнута, если полученное в опыте значение XІ слишком велико. Термин "слишком велико" означает, что наблюденное значение XІ имеет малую вероятность, то есть превосходит критическое значение, которое можно взять из таблиц распределения хи-квадрат. Так как вероятность Р ( ≥ XІ) - малая величина, то маловероятно случайно получить такое же, как в опыте, или еще большее расхождение между вектором частот и вектором вероятностей.
Асимптотический характер теоремы Пирсона, лежащий в основе этого правила, требует осторожности при его практическом использовании. На него можно полагаться только при больших n. Достаточно велико должно быть и n, и все произведения npi. Проблема применимости аппроксимации (непрерывное распределение) к статистике XІ, распределение которой дискретно, оказалась сложной. Согласно имеющемуся опыту, аппроксимация применима, если все ожидаемые частоты npi > 10. Если число различных исходов k велико, граница для npi может быть снижена (до 5 или даже до 3, если k порядка нескольких десятков). Чтобы соблюсти эти требования, на практике порой приходится объединять несколько исходов и переходить к схеме Бернулли с меньшим k.
Вопрос о сравнении наблюденных в опыте частот с теми, которые предписывает теория (ради проверки этой теории) возникает во многих задачах. Рассмотрим способ сопоставления наблюдаемых частот с частотами, рассчитанными по модели. Обозначим наблюдаемые частоты через Н; ожидаемые (теоретические) частоты - Т. Если модель правильно описывает действительность, числа Н и Т должны быть близки друг к другу, сумма квадратов отклонений (Н - Т) І не должна быть большой. Разумно в общую сумму отдельные слагаемые вносить с различными весами, поскольку чем больше Т, тем больше Н может от него отклоняться за счет действия случая без отступления от модели. В качестве меры близости наблюдаемых и ожидаемых частот используется величина:
Самое читаемое:
Конструкторско-технологическое проектирование печатной платы
печатная плата
Проектирование печатных плат (ПП) представляет трудоемкий, но очень
важный процесс. Для того, чтобы обеспечить функционирование электронной
аппаратуры (ЭА) необходимы не только схемотехнические решения, функциональная
точность, надежность, но и учет влияния внешней среды, конструктивных,
эксплуатационных требований, пр ...