Математическая статистика, весна 2015: Лекция 3....
TRANSCRIPT
Лекция 3. Доверительные интервалы
Грауэр Л.В., Архипова О.А.
CS Center
Санкт-Петербург, 2015
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 1 / 41
Cодержание
Содержание
1 Оценка параметров конечной генеральной совокупности
2 Стратифицированные выборки
3 Распределения χ2, Стьюдента, ФишераРаспределение χ2
Распределение СтьюдентаРаспределение Фишера
4 Доверительные интервалыОбщая схема построения доверительных интерваловТочные доверительные интервалы для нормальной генеральнойсовокупностиАсимптотические доверительные интервалыДоверительное оценивание по вариационному рядуДоверительный интервал для медианы
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 2 / 41
Оценка параметров конечной генеральной совокупности
Оценка параметров конечной генеральной совокупности
Рассмотрим генеральную совокупность конечного объема N.Пусть x1, x2, . . ., xN — элементы генеральной совокупности.Математическое ожидание генеральной совокупности:
µ =1
N
N∑i=1
xi .
Дисперсия генеральной совокупности
σ2 =1
N
N∑i=1
(xi − µ)2.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 3 / 41
Оценка параметров конечной генеральной совокупности
Наиболее простой способ сэмплирования - простое случайноесэмплирование:
элементы генеральной совокупности выбираются случайнымобразом без возвращения,все случайные выборки объема n имеют одинаковые вероятностиреализации.
Рассмотрим выборку объема n X1, . . . ,Xn из генеральнойсовокупности.Если все элементы генеральной совокупности различны, тоP(Xi = xj) = 1
N , ∀ i , j .По выборке X1, . . . ,Xn найдем оценки µ и σ генеральной совокупностии исследуем их свойства.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 4 / 41
Оценка параметров конечной генеральной совокупности
В качестве оценки математического ожидания возьмем выборочноесреднее
X̄ =1
n
n∑i=1
Xi .
Найдем математическое ожидание X̄
E X̄ =1
n
n∑i=1
EXi = µ.
Найдем дисперсию X̄
Var(X̄ ) =1
n2
n∑i=1
n∑j=1
Cov(Xi ,Xj).
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 5 / 41
Оценка параметров конечной генеральной совокупности
Если бы элементы выборки извлекались с возвращением, тоCov(Xi ,Xj) = 0, i 6= j и
VarX̄ =1
n2
n∑i=1
Var(Xi ) =σ2
n
Однако выборка без возвращений порождает зависимости междуX1, . . . ,Xn.Не трудно показать, что
Cov(Xi ,Xj) = − σ2
N − 1, i 6= j
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 6 / 41
Оценка параметров конечной генеральной совокупности
Таким образом,
Var(X̄ ) =σ2
n
(N − n
N − 1
)=σ2
n
(1− n − 1
N − 1
)
Коэффициент(
1− n−1N−1
)называется коррекционным коэффициентом
генеральной совокупности.
Как правило, n << N, в этом случае
Var(X̄ ) ∼ σ2
n.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 7 / 41
Оценка параметров конечной генеральной совокупности
Найдем оценку дисперсии генеральной совокупности σ2.В качестве оценки возьмем выборочную дисперсию
σ̂2 =1
n
n∑i=1
(Xi − X̄ )2.
Найдем математическое ожидание выборочной дисперсии
E (σ̂2) = σ2
(n − 1
n
)N
N − 1.
Как видим, оценка смещенная.
Несмещенной оценкой дисперсии σ2 будет оценка вида
s̃2 =
(1
n − 1
)N − 1
N
n∑i=1
(Xi − X̄ )2.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 8 / 41
Оценка параметров конечной генеральной совокупности
Тогда несмещенной оценкой Var(X̄ ) будет
s2X̄
=1
n(n − 1)
(1− n
N
) n∑i=1
(Xi − X̄ )2.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 9 / 41
Оценка параметров конечной генеральной совокупности
Стратифицированные выборки
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 10 / 41
Стратифицированные выборки
Стратифицированные выборки
Разобьем генеральную совокупность на подклассы или страты.
Примерысовокупность людей можно сгруппировать в страты погеографической принадлежностипользователей интернета — по используемому браузеруфинансовые транзакции — по величине транзации: большая,маленькая, средняя
Зачем?Правильная стратификация может уменьшить разброс значенийоценок неизвестных параметров. Стратификация гарантируетприсутствие в выборке представителей всех страт.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 11 / 41
Стратифицированные выборки
Рассмотрим генеральную совокупность объема Nx1, x2, . . . , xn.Разобьем множество ее значений на L страт объемом N1, . . . ,NL:
N = N1 + . . .+ NL.
Wl — доля страты l в генеральной совокупности.
Обозначим через µl и σ2l математическое ожидание и дисперсию
страты l .Пусть xil — i-й элемент страты l . Тогда математическое ожиданиегенеральной совокупности
µ =1
N
L∑l=1
Nl∑i=1
xil =1
N
L∑l=1
Nlµl =L∑
l=1
Wlµl .
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 12 / 41
Стратифицированные выборки
В рамках каждой страты l возьмем простую случайную выборкуобъема nl (X1l , . . . ,Xnl l).Выборочное среднее внутри страты l обозначим
X̄l =1
nl
nl∑i=1
Xil .
Очевидно, что EX̄l = µl .
В качестве оценки мат. ожидания генеральной совокупностирассмотрим оценку вида
X̄S =L∑
l=1
Nl X̄l
N=
L∑l=1
Wl X̄l . (1)
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 13 / 41
Стратифицированные выборки
Оценка X̄S является несмещенной оценкой µ:
EX̄S =L∑
l=1
WlEX̄l =1
N
L∑l=1
Nlµl = µ.
Несложно показать, что
Var(X̄S) =L∑
l=1
W 2l Var(X̄l) =
L∑l=1
W 2l
(1
nl
)(1− nl − 1
Nl − 1
)σ2l .
Если nl << Nl , то
Var(X̄S) ∼L∑
l=1
W 2l σ
2l
nl
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 14 / 41
Стратифицированные выборки
Какими выбрать объемы выборок из страт?
Теорема 1Объемы выборок n1, . . . , nL такие, что
nl = nWlσl∑L
k=1 Wkσk, (2)
l = 1, . . . , L, n = n1 + . . .+ nL,минимизируют дисперсию Var(X̄S).
Такое распределение называют оптимальным или Неймана.Соответствующую оценку обозначим X̄SO .
Var(X̄SO) =
(∑Ll=1 Wlσl
)2
n.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 15 / 41
Стратифицированные выборки
Пропорциональное распределениеОбъем выборки для каждой страты определяется правилом
nl = nNL
N= nWl , l = 1, . . . , L, n = n1 + . . .+ nL. (3)
Соответствующую оценку обозначим X̄SP . Так как Wl/nl = 1/n,
X̄SP =L∑
k=1
Wk X̄k =1
n
L∑l=1
nl∑i=1
Xil
Дисперсия оценки XSP будет равна без учета поправки на конечностьгенеральной совокупности
Var(X̄SP) =1
n
L∑l=1
Wlσ2l .
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 16 / 41
Стратифицированные выборки
Чем больше разница дисперсий между стратами, тем больше разницамежду дисперсиями оценок XSO и XSP и, следовательно, большепреимущество у оценки XSO .
XSP всегда имеет дисперсию меньше, чем дисперсия оценки X̄ ,полученной простым случайным выбором, если страты имеют разныематематические ожидания.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 17 / 41
Распределения χ2, Стьюдента, Фишера
Распределения χ2, Стьюдента, Фишера
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 18 / 41
Распределения χ2, Стьюдента, Фишера Распределение χ2
Распределение χ2
Определение 1
Пусть ζ1,. . .,ζk — взаимно независимые случайные величины,подчиняющиеся стандартному нормальному распределению.Распределение случайной величины
τk = ζ21 + . . .+ ζ2
k
называется распределением хи-квадрат с k степенями свободы иобозначается через χ2
k .
Распределение хи-квадрат с k степенями свободы представляет собойгамма-распределение с параметрами формы k/2 и масштаба 1/2:
fτ (x) =
( 12 )
k2xk2 −1
Γ( k2
)e−
x2 , x > 0;
0, x ≤ 0.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 19 / 41
Распределения χ2, Стьюдента, Фишера Распределение Стьюдента
Распределение Стьюдента
Определение 2
Пусть заданы случайные величины ζ ∼ N(0, 1) и τk ∼ χ2k . Пусть
случайные величины ζ и τk взаимно независимы. Распределениеслучайной величины
ξ =ζ√τkk
называется распределением Стьюдента с k степенями свободы иобозначается через Tk .
Очевидно, что если ζ ∼ N(0, 1) и ζ1,. . .,ζk — взаимно независимыеслучайные величины, подчиняющиеся стандартному нормальномураспределению, независимые с ζ, тогда
ζ√ζ2
1 +...+ζ2k
k
∼ Tk .
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 20 / 41
Распределения χ2, Стьюдента, Фишера Распределение Стьюдента
Плотность распределения Стьюдента с k степенями свободы имеетвид:
f (z) =Γ(k+1
2 )√πkΓ(k2 )
1
(1 + z2/k)k+1
2
. (4)
Можно показать, что для плотности f (z) из выражения (4) имеетместо сходимость:
f (z) −−−→k→∞
1√2π
e−z2
2 .
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 21 / 41
Распределения χ2, Стьюдента, Фишера Распределение Фишера
Распределение Фишера
Определение 3
Пусть случайные величины η ∼ χ2m, ξ ∼ χ2
n независимы. Будемговорить, что случайная величина
ζ =η/m
ξ/n∼ Fm,n
подчиняется распределению Фишера со степенями свободы числителяm и знаменателя n.
Плотность распределения случайной величины ζ ∼ Fm,n имеет вид:
fζ(z) =
Γ(m+n
2 )
Γ(m2 )Γ(n2 )
mm2 n
n2 z
m2−1
(n + mz)m+n
2
, если z > 0;
0, если z 6 0.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 22 / 41
Доверительные интервалы
Доверительные интервалы
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 23 / 41
Доверительные интервалы Общая схема построения доверительных интервалов
Общая схема построения доверительных интервалов
Пусть задана генеральная совокупность ξ с функцией распределенияFξ(x , θ). Имеется выборка X[n] = (X1, . . . ,Xn) из этой генеральнойсовокупности и неизвестный параметр распределения θ ∈ Θ ⊂ R.
Определение 4
Пусть для некоторого α ∈ (0, 1) существуют статистики S−(X[n], α) иS+(X[n], α) такие, что
P{S−(X[n], α) < θ < S+(X[n], α)
}= 1− α,
тогда интервал(S−(X[n], α),S+(X[n], α)
)называется доверительным
интервалом для параметра θ с уровнем доверия (1− α).
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 24 / 41
Доверительные интервалы Общая схема построения доверительных интервалов
Укажем общий метод построения доверительных интервалов, которыйбудет использован далее.Пусть известна статистика Y (S(X[n]), θ), содержащая оцениваемыйпараметр θ и его точечную оценку S(X[n]) со следующими свойствами:
1 Функция распределения FY (x) случайной величины Y известна ине зависит от θ.
2 Функция Y (S(X[n]), θ) непрерывна и строго монотонна по θ.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 25 / 41
Доверительные интервалы Общая схема построения доверительных интервалов
Зададим уровень значимости α.Обычно доверительный интервал строят так, чтобы дополнительныеинтервалы (− inf, S−(X[n], α)), (S+(X[n], α),+ inf) накрывали θравновероятно (с вероятностью α/2).
Находим квантили yα/2 и y1−α/2 распределения случайной величиныY порядка α/2 и 1− α/2 и далее получаем
P(yα/2 < Y (S(X[n]), θ) < y1−α/2) = F (y1−α/2)− F (yα/2) = 1− α.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 26 / 41
Доверительные интервалы Общая схема построения доверительных интервалов
Пусть для опреденности, функция Y (S(X[n]), θ) строго возрастает поθ. Тогда обратная функция Y−1(y) для Y (S(X[n]), θ) также будетстрого возрастающей. Тогда неравенство
yα/2 < Y (S(X[n]), θ) < y1−α/2 (5)
эквивалентно неравенству
Y−1(yα/2) < θ < Y−1(y1−α/2). (6)
Получаем доверительный интервал для θ
P(S−(X[n], α) < θ < S+(X[n], α)) = 1− α,
где S−(X[n], α) = Y−1(yα/2), S+(X[n], α) = Y−1(y1−α/2).Для случая строгого убывания Y (S(X[n]), θ) по θ знаки неравенства в(5), (6) будут противополжного смысла.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 27 / 41
Доверительные интервалы Точные доверительные интервалы для нормальной...
Точные доверительные интервалы для нормальнойгенеральной совокупности
Теорема 2
Пусть задана выборка X[n] из генеральной совокупности ξ ∼ N(a, σ2).Справедливы следующие утверждения:
1 Статистика X̄−aσ
√n подчиняется стандартному нормальному
распределению.
2 Если s̃2 = 1n−1
n∑i=1
(Xi − X̄ )2, тогда статистика X̄−as̃
√n подчиняется
распределению Стьюдента с n − 1 степенью свободы.3 Статистика (n−1)s̃2
σ2 подчиняется распределению хи-квадрат с n − 1степенью свободы.
4 Если s2 = 1n
n∑i=1
(Xi − a)2, тогда статистика ns2
σ2 подчиняется
распределению хи-квадрат с n степенями свободы.Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 28 / 41
Доверительные интервалы Точные доверительные интервалы для нормальной...
Точные доверительные интервалы для математического ожидания aнормальной генеральной совокупности можно построить последующим правилам:
Если σ2 известно, то доверительный интервал для a будет иметьвид:
P
{X̄ − σ√
nz1− ε
2< a < X̄ +
σ√nz1− ε
2
}= 1− ε,
где z1− ε2— квантиль стандартного нормального распределения.
Если σ2 неизвестно, тогда:
P
{X̄ − s̃√
nt1− ε
2< a < X̄ +
s̃√nt1− ε
2
}= 1− ε,
где t1− ε2— квантиль распределения Стьюдента с n − 1 степенью
свободы.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 29 / 41
Доверительные интервалы Точные доверительные интервалы для нормальной...
Точные доверительные интервалы для дисперсии σ2 нормальнойгенеральной совокупности можно построить по следующим правилам:
Если a неизвестно, то:
P
{(n − 1)s̃2
u1−ε/2< σ2 <
(n − 1)s̃2
uε/2
}= 1− ε,
где u1−ε/2 — квантиль распределения хи-квадрат с n − 1 степеньюсвободы уровня 1− ε/2, uε/2 — квантиль распределенияхи-квадрат с n − 1 степенью свободы уровня ε/2,Если a известно, тогда доверительный интервал
P
{ns2
v1−ε/2< σ2 <
ns2
vε/2
}= 1− ε,
где vε/2 — квантиль распределения хи-квадрат с n степенямисвободы уровня ε/2, v1−ε/2 — квантиль распределения хи-квадратс n степенями свободы уровня.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 30 / 41
Доверительные интервалы Асимптотические доверительные интервалы
Асимптотические доверительные интервалы
Определение 5
Пусть для некоторого α ∈ (0, 1) существуют статистики S−(X[n], α) иS+(X[n], α) такие, что
limn−→∞
P{S−(X[n], α) < θ < S+(X[n], α)
}= 1− α,
тогда интервал(S−(X[n], α), S+(X[n], α)
)называется асимптотическим
(приближенным) доверительным интервалом.
Построение асимптотических доверительных интервалов основано наасимптотически нормальных оценках.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 31 / 41
Доверительные интервалы Асимптотические доверительные интервалы
Предположим, что оценка θ̂ = θ̂(X[n]) является асимптотическинормальной, т. е.
√n(θ̂ − θ)
d−−−−→n−→∞
ς ∼ N(0, σ2),
где дисперсия σ2(θ) — коэффициент асимптотического рассеивания.Предположим, что функция σ2(θ) непрерывна на Θ и отлична от нулядля любого θ ∈ Θ.
Лемма 1
Случайный вектор (√n(θ̂ − θ), θ̂)
d−−−→n→∞
(ζ, θ), где ζ подчиняется
нормальному распределению N(0, σ2(θ)).
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 32 / 41
Доверительные интервалы Асимптотические доверительные интервалы
Рассмотрим функцию от двух переменных H(x1, x2) = x1/σ(x2), онанепрерывна на R×Θ. Случайный вектор (ζ, θ)T ∈ R×Θ,следовательно, можем воспользоваться теоремой непрерывности:
Теорема 3
Пусть для последовательности случайных векторов имеет местосходимость по распределению:ηn = (η
(1)n , . . . , η
(m)n )
d−−−−→n−→∞
η = (η(1), . . . , η(m)). Пусть задана функция
H : Rm −→ Rl непрерывная на Rm, тогда H(ηn)d−−−−→
n−→∞H(η).
H(√n(θ̂n − θ), θ̂n)
d−−−→n→∞
H(ζ, θ) =ζ
σ(θ)∼ N(0, 1).
Таким образом, имеет место сходимость:√n(θ̂ − θ)
σ(θ̂)
d−−−→n→∞
η ∼ N(0, 1).
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 33 / 41
Доверительные интервалы Асимптотические доверительные интервалы
Тогда справедливо следующее соотношение:
P
{−z1−α
2<
√n(θ̂ − θ)
σ(θ̂)< z1−α
2
}−−−−→n−→∞
1− α =1√2π
z1−α2∫
−z1−α2
e−y2
2 dy ,
где z1−α2— квантиль стандартного нормального распределения уровня
1− α/2, то есть, F (z1−α2
) = 1− α/2, где F (x) — функциястандартного нормального распределения.Получаем асимптотический доверительный интервал с уровнемдоверия 1− α:
P
{θ̂ − z1−α
2
σ(θ̂)√n< θ < θ̂ + z1−α
2
σ(θ̂)√n
}≈ 1− α.
Ширина доверительного интервала характеризует точностьинтервальной оценки.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 34 / 41
Доверительные интервалы Асимптотические доверительные интервалы
Пример 1Рассмотрим схему Бернулли, в которой n испытаний. Пусть m — числоуспехов. Выборка X[n] = (a1, . . . , an) состоит из последовательностинулей и единиц, тогда функция правдоподобия имеет вид:
L(X[n], p) = pmqn−m, p ∈ Θ = (0, 1),
где m — число единиц в выборке. Логарифмическая функцияправдоподобия имеет вид:
ln L = m ln p + (n −m) ln(1− p).
Найдем оценку максимального правдоподобия:
∂ ln L
∂p=
m
p− n −m
1− p=
m −mp − np + mp
p(1− p)= 0.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 35 / 41
Доверительные интервалы Асимптотические доверительные интервалы
Следовательно, получаем оценку:
p̂ =m
n.
Убеждаемся, что p̂ максимизирует функцию правдоподобия:
∂2 ln L
∂p2= −m
p2− n −m
(1− p)2< 0.
Следовательно, p̂ = mn — точка максимума или оценка по методу
максимального правдоподобия.Нетрудно показать, что оценка p̂ асимптотически нормальна:
√n(mn− p)
=m − np√
n=
n∑i=1
ξi − np
√n
=
=
n∑i=1
(ξi − p)
√n
d−−−→n→∞
ζ ∼ N(0, pq),
где P{ξi = 1} = p, P{ξi = 0} = q = 1− p, σ2 = pq = p(1− p).Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 36 / 41
Доверительные интервалы Асимптотические доверительные интервалы
Воспользуемся доказанным утверждением:√n(θ̂ − θ)
σ(θ̂)
d−−−→n→∞
η ∼ N(0, 1).
Тогда имеет место сходимость:√n(mn − p)√mn (1− m
n )
d−−−→n→∞
η ∼ N(0, 1).
Следуя приведенным выше рассуждениям, получаем доверительныйинтервал с уровнем доверия 1− α для вероятности p:(
m
n− z1−α
2
√mn (1− m
n )√n
,m
n+ z1−α
2
√mn (1− m
n )√n
)
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 37 / 41
Доверительные интервалы Доверительное оценивание по вариационному ряду
Доверительное оценивание по вариационному ряду
Пусть задана выборка X[n] = (x1, · · · , xn) некоторой случайнойвеличины ξ. Построим вариационный ряд выборки x (1) < · · · < x (n)
Вероятность попасть в любой из (n + 1) - го интервалов значенийслучайной ведичины ξ одинакова и равна 1
n+1 . Тогда вероятность того,что случайная величина ξ приняла значение из интервала (x (k), x (l)),где l > k будет равна:
P{x ∈ (x (k), x (l))
}=
l − k
n + 1.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 38 / 41
Доверительные интервалы Доверительное оценивание по вариационному ряду
Выясним, чему должен быть равен размер выборки n, чтобывероятность попасть в интервал (min
i(xi ),max
i(xi )) составила 95%?
Подставляя значение для доверительной вероятности в формулувыше, получим:
0.95 = P{x ∈ (x (1), x (n))
}=
n − 1
n + 1,
откуда n = 39.Таким образом, при достаточном для заданной доверительнойвероятности числе измерений случайной величины ξ по набору еепорядковых статистик может быть оценен диапазон принимаемых еюзначений.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 39 / 41
Доверительные интервалы Доверительный интервал для медианы
Доверительный интервал для медианы
Пусть задана выборка X[n] = (x1, · · · , xn) некоторой случайнойвеличины ξ. Пусть x̃ — медиана генеральной совокупности.
События xi < x̃ и xi > x̃ равновероятны и P(xi < x̃) = P(xi > x̃).Порядковые статистики x (k+1) и x (n−k) являются границамидоверительного интервала для медианы с некоторой доверительнойвероятностью:
x (k+1) < x̃ < x (n−k).
Событие x̃ ≤ x (k+1) эквивалентно событию µ ≤ k , где µ — числовыборочных элементов, меньших медианы.
P(x̃ ≤ x (k+1)
)= P(µ ≤ k) =
k∑i=0
C in
1
2n
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 40 / 41
Доверительные интервалы Доверительный интервал для медианы
По симметрии P(x̃ ≤ x (k+1)
)= P
(x̃ ≥ x (n−k)
)P(x (k+1) < x̃ < x (n−k)
)= 1− 2
k∑i=0
C in
1
2n.
Выбрав уровень значимости α, определим наибольшее k (max k = m),такое что
k∑i=0
C in
1
2n≤ α/2
и получим приближенный доверительный интервал для медианы x̃
P(x (m+1) < x̃ < x (n−m)
)≥ 1− α.
Грауэр Л.В., Архипова О.А. (CSC) Лекция 3. Доверительные интервалы Санкт-Петербург, 2015 41 / 41