Изучаемые нами распределения вероятностей служат теоретическими моделями для анализа данных,
порожденных явлениями со случайной природой.
Однако на практике перед аналитиком встают две основные проблемы:
во-первых, не всегда очевидно, какое именно распределение описывает имеющиеся данные,
а во-вторых, даже если тип распределения известен,
требуется статистически оценить его параметры — такие как математическое ожидание, дисперсия и другие.
Справиться с такой задачей нам помогут параметрические оценки.
Параметрические оценки
Пусть X1,X2,…,Xn — выборка, полученная из какого-то распределения одного семейства.
Элементы выборки независимы и одинаково распределены, то есть они представляют собой
независимые реализации случайной величины с одним и тем же распределением.
Пусть вектор параметров этого распределения θ.
Он может состоять из любых параметров, определяющих распределение:
для нормального распределения это математическое ожидание и дисперсия,
для равномерного распределения это границы (сдвиг и масштаб),
для экспоненциального распределения это интенсивность и так далее.
Величина θ^(X1,X2,…,Xn),
построенная по выборке X1,X2,…,Xn,
называется оценкой вектора параметров θ,
или просто параметрической оценкой распределения.
Оценка θ^ строится
по значениям X1,X2,…,Xn какой-то случайной величины.
Значит, саму оценку θ^ можно считать случайной величиной,
у которой можно считать математическое ожидание, дисперсию,
смотреть на сходимость и совершать другие полезные действия.
Свойства параметрических оценок
Оценивать параметры можно по-разному, но нам хочется делать это хорошо.
Хорошесть оценок оценивать трудно, а в общем случае это вообще сделать невозможно.
Тем не менее, существует несколько базовых свойств, которыми должны обладать хорошие оценки.
Несмещённость
Оценка θ^ параметра θ называется несмещённой, если
Eθ^=θ
Несмещённость оценки означает, что она в среднем будет равна истинному значению параметра.
Интуитивно можно понимать несмещённость следующим образом.
Если мы сгенерируем много-много выборок X1[j],X2[j],…,Xn[j] и для каждой посчитаем эту оценку θ^[j]=θ^(X1[j],X2[j],…,Xn[j]),
то в среднем мы получим θ:
m1j=1∑mθ^[j]≈θ
.
Самый естественный и простой пример — оценка выборочного среднего.
Для выборки X1,X2,…,Xn оценка Xˉ называется оценкой выборочного среднего. Эта оценка для математического ожидания μ распределения той выборки.
Xˉ=defnX1+X2+⋯+Xn
Эта оценка является несмещённой, ведь
E(n1j=1∑nXj)=n1j=1∑nEXj=μ
Давайте попробуем по выборке X1,X2,…,Xn построить оценку σ2 дисперсии σ2.
Довольно естественной кажется оценка средний квадрат отклонений от выборочного среднего
σ2=n1j=1∑n(Xj−Xˉ)2
Неожиданно, но эта оценка смещённая. Давайте найдём её математическое ожидание
Для того, чтобы получить несмещённую оценку, надо делить не на n, а на n−1.
σ2=n−11j=1∑n(Xj−Xˉ)2
1
Дана выборка X1,X2,…,Xn∼i.i.d.uniform[0,2θ].
Для оценки параметра θ мы используем выборочную медиану
med(X1,X2,…,Xn)
Докажите, что это несмещённая оценка.
Мы научились качественно оценивать смещённость оценки. Давайте теперь поймём, как оценить смещённость количественно.
Для этого есть специальная величина — смещение оценки.
Смещение
Пусть θ^=θ^(X1,X2,…,Xn) —
оценка параметра θ.
Смещением оценки θ^ называется величина
biasθ^=defEθ^−θ
Чем больше смещение оценки, тем больше зазор
между ожидаемым значением оценки и истинным значением оцениваемого параметра,
а значит тем хуже наша оценка.
Оценка θ^ может быть смещённой, но смещение может уменьшаться с ростом n.
В таком случае оценка называется асимптотически несмещённой.
Асимптотически несмещённая оценка
Пусть θ^=θ^(X1,X2,…,Xn) —
оценка параметра θ.
Оценка θ^ называется асимптотически несмещённой, если
n→∞limEθ^=θили, чтоэквивалентно,n→∞limbiasθ^=0
Вот например мы ранее поняли, что оценка S=1/n⋅j=1∑n(Xj−Xˉ)2 для дисперсии является смещённой.
ES=nn−1⋅σ2
Значит, смещение этой оценки равно
biasS=ES−σ2=−nσ2
Смещение оказалось отрицательным — наша оценка S в среднем занижает истинную дисперсию.
Но тем не менее, эта оценка является асимптотически несмещённой, ведь
n→∞limbiasS=n→∞lim(−nσ2)=0
Другой пример.
Пусть наша выборка X1,X2,…,Xn∼i.i.d.uniform[0,θ].
Возьмём в качестве оценки параметра θ самый большой элемент выборки
θ^=θ^(X1,X2,…,Xn)=X(n)=max{X1,X2,…,Xn}
Каждый элемент Xj выборки X удовлетворяет неравенству 0⩽Xj⩽θ.
Давайте найдём функцию распределения Fθ^ нашей оценки θ^.
Дифференцируя Fθ^(x) по x получаем, что плотность нашей оценки равна f(x)=nxn−1/θn.
Тогда можно вычислить математическое ожидание
Eθ^=0∫θxf(x)dt=θnn0∫θxndx=n+1n⋅θ
Получается, что оценка θ^ смещённая.
Однако, она является асимптотически несмещённой, ведь
n→∞limEθ^=n→∞limn+1n⋅θ=θ
0
Пусть у нас есть выборка X1,X2,…,Xn∼i.i.d.∗, распределение нам не важно.
Математическое ожидание и дисперсия каждого элемента Xj нашей выборки равны соответственно EXj=μ и varXj=σ2.
Мы хотим оценить квадрат математического ожидания μ2.
Для этого используем квадрат выборочного среднего
Xˉ2=(n1j=1∑nXj)2
Найдите смещение оценки. Является ли оценка несмещённой? асимптотически несмещённой?
Состоятельность
Оценка θ^=θ^(X1,X2,…,Xn) параметра θ называется состоятельной, если
Состоятельность означает, что с ростом размера выборки всё менее вероятны отклонения оценки
от истинного значения оцениваемого параметра.
Посмотрим на состоятельность выборочного среднего Xˉ для оценки математического ожидания μ для выборки X1,X2,…,Xn∼i.i.d.∗ с произвольным распределением.
По закону больших чисел
Xˉ=nX1+X2+⋯+XnPμ
А значит, выборочное среднее является состоятельной оценкой.
Состоятельность и несмещённость это независимые свойства:
оценки могут быть состоятельными, но не несмещенными и наоборот.
Продолжим анализировать наш пример
с выборкой X1,X2,…,Xn∼i.i.d.uniform[0,θ].
Для оценки параметра θ мы используем самый большой элемент выборки
θ^=θ^(X1,X2,…,Xn)=X(n)=max{X1,X2,…,Xn}
Мы уже установили, что эта оценка несмещённая. Однако, она состоятельна, ведь
Дана выборка X1,X2,…,Xn∼i.i.d. с EXj=μ и varXj=σ2.
Для оценки параметра μ мы используем первый элемент выборки X1.
Понятно, что это несмещённая оценка, ведь EX1=μ.
Является ли эта оценка состоятельной?
Давайте получим количественную меру надёжности и эффективности оценок.
Когда мы работали со случайными величинами, мы мерили их дисперсию —
разброс относительно математического ожидания.
С оценками можно поступить точно так же, и мерить разброс относительно ожидаемого значения оценки
Дисперсия оценки
Пусть θ^=θ^(X1,X2,…,Xn) —
оценка параметра θ.
Дисперсией оценки θ^ —
это мера разброса оценки вокруг её математического ожидания
varθ^=E((θ^−Eθ^)2)
Это определение полностью скопировано с определения дисперсии случайных величин.
Ну и это не с проста: оценка тоже является случайной величиной, так как мы работаем априорно.
Чем больше дисперсия оценки, тем больше разброс её значений и тем менее надёжна и менее эффективна оценка.
Пусть у нас есть две несмещённые оценки θ^1 и θ^2 одного и того же параметра θ.
Говорят, что оценка θ^1эффективнее оценки θ^2,
если дисперсия оценки θ^1 меньше дисперсии оценки θ^2:
θ^1эффективнеечемθ^2≡≡defvarθ^1<varθ^2
Давайте в качестве примера рассмотрим выборку X1,X2,…,Xn∼i.i.d.uniform[0,2θ].
Будем оценивать математическое ожидание с помощью двух оценок:
выборочного среднего Xˉ и медианы medX.
Какая оценка эффективнее?
Найдём сначала дисперсию выборочного среднего.
Для случайной величины ξ∼uniform[0,2θ] дисперсия равна varξ=θ2/3, значит varXˉ=θ2/3n.
Найти дисперсию медианы чуть сложнее. Но нас ничто не остановит.
Для упрощения жизни будем считать, что в выборке нечётное число величин, то есть n=2m+1.
Тогда medX=X(m+1).
Для равномерного распределения uniform[0,2θ] плотность и функция распределения соответственно равны
Теперь, чтобы посчитать дисперсию медианы, нам нужно из только что полученного значения вычесть квадрат
математического ожидания медианы (E(medX))2=θ2:
Возвращаемся к нашей задаче.
Мы получили, что varXˉ=θ2/3n и var(medX)=θ2/(n+2).
Получается, что при n>1 выборочное среднее эффективнее медианы.
0
Мы бросаем много раз монетку, которая может выпасть
с вероятностью p орлом и с вероятностью 1−p решкой.
То есть мы генерируем выборку X1,X2,…,Xn∼i.i.d.Bern(p).
Для оценки параметра p мы используем аналог выборочного среднего,
где ещё добавляем два фиктивных броска: один с успехом, другой с неудачей.
p^=n+21(1+j=1∑nXj)
Является ли эта оценка несмещённой? асимптотически несмещённой? состоятельной?