返回

数理统计考试总结_四面A4加密版.tex

18.1 KB · TEX · 2026-06-05 08:02
\documentclass[UTF8]{ctexart}
\usepackage[a4paper,top=5.5mm,bottom=5.5mm,left=5.5mm,right=5.5mm]{geometry}
\usepackage{amsmath,amssymb,bm}
\usepackage{array,tabularx,booktabs,multicol}
\usepackage[dvipsnames]{xcolor}
\usepackage{enumitem}
\pagestyle{empty}
\setlength{\parindent}{0pt}
\setlength{\parskip}{0.15pt}
\setlength{\tabcolsep}{1.1pt}
\renewcommand{\arraystretch}{0.86}
\setlist[itemize]{leftmargin=1.05em,nosep,topsep=0pt,itemsep=0pt}
\setlist[enumerate]{leftmargin=1.25em,nosep,topsep=0pt,itemsep=0pt}
\newcommand{\face}[1]{\clearpage{\centering\bfseries\small 数理统计半开卷加密公式笔记(#1)\par\vspace{0.45mm}}}
\newcommand{\blk}[1]{\vspace{0.22mm}{\bfseries\color{MidnightBlue}#1}\par}
\newcommand{\mini}[1]{\begin{minipage}[t]{0.491\textwidth}\raggedright\fontsize{5.65}{6.15}\selectfont #1\end{minipage}}
\newcommand{\sep}{\hfill}
\newcommand{\E}{\mathbb E}
\newcommand{\D}{\mathrm D}
\newcommand{\Var}{\operatorname{Var}}
\newcommand{\Cov}{\operatorname{Cov}}
\newcommand{\iid}{\overset{\mathrm{i.i.d.}}{\sim}}
\newcommand{\ubar}[1]{#1_{\alpha}}
\newcommand{\uhalf}[1]{#1_{\alpha/2}}
\begin{document}

\face{第1面:基本概念、抽样分布}
\mini{
\blk{1. 样本、统计量、常用量}
总体分布族 $\mathcal F=\{F_\theta:\theta\in\Theta\}$;样本 $X_1,\ldots,X_n$ 简单随机:独立同分布,联合密度/概率
$p_\theta(\bm x)=\prod_{i=1}^n p_\theta(x_i)$。统计量 $T=T(X_1,\ldots,X_n)$ 不含未知参数。
\[
\bar X=\frac1n\sum X_i,\quad
S^2=\frac1{n-1}\sum(X_i-\bar X)^2,\quad
S_n^2=\frac1n\sum(X_i-\bar X)^2.
\]
\[
nS_n^2=(n-1)S^2,\quad
\sum(X_i-c)^2=\sum(X_i-\bar X)^2+n(\bar X-c)^2.
\]
若 $\E X=\mu,\Var X=\sigma^2<\infty$:
$\E\bar X=\mu,\Var(\bar X)=\sigma^2/n,\E S^2=\sigma^2$。变换 $Y_i=aX_i+b$:
$\bar Y=a\bar X+b,\ S_Y^2=a^2S_X^2$。

\blk{样本矩与经验分布}
原点矩 $A_k=n^{-1}\sum X_i^k$;中心矩 $B_k=n^{-1}\sum(X_i-\bar X)^k$。经验分布
\[
F_n(x)=\frac1n\sum_{i=1}^n I\{X_i\le x\},\quad
\E F_n(x)=F(x),\quad \Var F_n(x)=\frac{F(x)(1-F(x))}{n}.
\]

\blk{似然与模型}
$L(\theta;\bm x)=\prod p_\theta(x_i)$,$\ell=\log L$。支持集含 $\theta$ 时,指标函数必须留在 $L$ 中。若内点可导,得分 $U(\theta)=\partial\ell/\partial\theta$。

\blk{常见分布矩/核}
\begin{tabularx}{\linewidth}{@{}lX@{}}
$b(1,p)$ & $\E X=p,\Var X=p(1-p),\ L\propto p^{\sum x_i}(1-p)^{n-\sum x_i}$\\
$B(k,p)$ & $\E X=kp,\Var X=kp(1-p)$\\
$P(\lambda)$ & $\E=\Var=\lambda,\ L\propto e^{-n\lambda}\lambda^{\sum x_i}$\\
$Exp(\lambda)$率 & $\E=1/\lambda,\Var=1/\lambda^2,\ L\propto\lambda^ne^{-\lambda\sum x_i}$\\
$\Gamma(r,\lambda)$率 & $\E=r/\lambda,\Var=r/\lambda^2,\ (r\text{已知})\ L_\lambda\propto\lambda^{nr}e^{-\lambda\sum x_i}$\\
$U(a,b)$ & $\E=(a+b)/2,\Var=(b-a)^2/12$\\
$N(\mu,\sigma^2)$ & $L\propto(\sigma^2)^{-n/2}\exp\{-\sum(x_i-\mu)^2/(2\sigma^2)\}$
\end{tabularx}

\blk{2. 三大抽样分布}
上侧分位数约定:
\[
\begin{gathered}
P(Z>z_\alpha)=\alpha,\quad P(t_\nu>t_\nu(\alpha))=\alpha,\\
P(\chi_\nu^2>\chi_\nu^2(\alpha))=\alpha,\quad
P(F_{m,n}>F_{m,n}(\alpha))=\alpha .
\end{gathered}
\]
若 $Z\sim N(0,1),V\sim\chi_\nu^2$ 独立:
$Z/\sqrt{V/\nu}\sim t_\nu$。若 $U\sim\chi_m^2,V\sim\chi_n^2$ 独立:
$(U/m)/(V/n)\sim F_{m,n}$;$F_{m,n}(\alpha)=1/F_{n,m}(1-\alpha)$。
}
\sep
\mini{
\blk{正态总体样本分布}
若 $X_i\iid N(\mu,\sigma^2)$:
\[
\bar X\sim N(\mu,\sigma^2/n),\quad
\frac{(n-1)S^2}{\sigma^2}\sim\chi_{n-1}^2,\quad
\bar X\perp S^2,
\]
\[
\frac{\bar X-\mu}{S/\sqrt n}\sim t_{n-1},\quad
\frac{X_{n+1}-\bar X}{S\sqrt{1+1/n}}\sim t_{n-1}.
\]
若用 $S_n^2$,则
\[
\frac{X_{n+1}-\bar X}{S_n}\sqrt{\frac{n-1}{n+1}}\sim t_{n-1}.
\]
分解:
$\sum(X_i-\mu)^2=\sum(X_i-\bar X)^2+n(\bar X-\mu)^2$,
且两项除以 $\sigma^2$ 后独立,分别为 $\chi^2_{n-1}$ 与 $\chi^2_1$。
若 $a_i$ 常数,则 $\sum a_iX_i\sim N(\mu\sum a_i,\sigma^2\sum a_i^2)$。

\blk{两个独立正态总体}
$X_i\iid N(\mu_1,\sigma_1^2),Y_j\iid N(\mu_2,\sigma_2^2)$:
\[
\bar X-\bar Y\sim N\!\left(\mu_1-\mu_2,\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}\right).
\]
若 $\sigma_1^2=\sigma_2^2=\sigma^2$ 未知:
\[
S_p^2=\frac{(m-1)S_X^2+(n-1)S_Y^2}{m+n-2},
\quad
\frac{\bar X-\bar Y-(\mu_1-\mu_2)}
{S_p\sqrt{1/m+1/n}}\sim t_{m+n-2}.
\]
\[
\frac{S_X^2/\sigma_1^2}{S_Y^2/\sigma_2^2}\sim F_{m-1,n-1}.
\]
配对样本用 $D_i=X_i-Y_i$,化为单正态总体。

\blk{次序统计量}
设连续总体 $F,f$,$X_{(1)}\le\cdots\le X_{(n)}$:
\[
f_{X_{(k)}}(x)=\frac{n!}{(k-1)!(n-k)!}[F(x)]^{k-1}[1-F(x)]^{n-k}f(x).
\]
\[
P(X_{(1)}>x)=[1-F(x)]^n,\quad
P(X_{(n)}\le x)=F(x)^n.
\]
\[
f_{X_{(i)},X_{(j)}}(u,v)=\frac{n![F(u)]^{i-1}[F(v)-F(u)]^{j-i-1}[1-F(v)]^{n-j}f(u)f(v)}
{(i-1)!(j-i-1)!(n-j)!}.
\]
若 $U(0,1)$,$X_{(k)}\sim \mathrm{Beta}(k,n-k+1)$;极差 $R$ 的密度
$f_R(r)=n(n-1)r^{n-2}(1-r),0<r<1$。
联合端点:
$f_{X_{(1)},X_{(n)}}(u,v)=n(n-1)[F(v)-F(u)]^{n-2}f(u)f(v),\ u<v$。

\blk{极限定理}
若 $X_i$ iid,$\E X=\mu,0<\Var X=\sigma^2<\infty$:
$\bar X\overset{a.s.}\to\mu$,
$\sqrt n(\bar X-\mu)/\sigma\Rightarrow N(0,1)$。
Slutsky:$X_n\Rightarrow X,\ Y_n\overset p\to c$,则
$X_n+Y_n\Rightarrow X+c,\ X_nY_n\Rightarrow cX$。
Delta法:$\sqrt n(T_n-\theta)\Rightarrow N(0,\tau^2)$,
$g'(\theta)\ne0\Rightarrow \sqrt n(g(T_n)-g(\theta))\Rightarrow N(0,[g'(\theta)]^2\tau^2)$。
Bernoulli/二项大样本($0<p<1$):
$(\hat p-p)/\sqrt{p(1-p)/n}\Rightarrow N(0,1)$。
}

\face{第2面:充分统计量、点估计、C-R界}
\mini{
\blk{3. 充分统计量}
定义:给定 $T(X)$ 后,样本的条件分布不含 $\theta$,则 $T$ 对 $\theta$ 充分。
因子分解定理:
\[
p_\theta(\bm x)=g_\theta(T(\bm x))h(\bm x)
\quad\Longleftrightarrow\quad T \text{ 充分}.
\]
离散型可用比值 $p_\theta(\bm x)/P_\theta(T=t)$;连续型用条件密度。指数族
\[
p_\theta(x)=c(\theta)h(x)\exp\!\left\{\sum_{j=1}^k Q_j(\theta)T_j(x)\right\}
\]
的样本充分统计量为
$\big(\sum_iT_1(X_i),\ldots,\sum_iT_k(X_i)\big)$。

\blk{常见充分统计量}
\begin{tabularx}{\linewidth}{@{}lX@{}}
Bernoulli/Binomial($k$已知) & $\sum X_i$\\
Poisson($\lambda$) & $\sum X_i$\\
几何分布($p$,取值$1,2,\ldots$) & $\sum X_i$\\
指数率 $\lambda$ & $\sum X_i$\\
$N(\mu,\sigma^2)$ 两参 & $(\sum X_i,\sum X_i^2)$\\
$N(\mu,\sigma^2)$,$\sigma^2$已知 & $\bar X$\\
$N(\mu,\sigma^2)$,$\mu$已知 & $\sum(X_i-\mu)^2$\\
$U(0,\theta)$ & $X_{(n)}$\\
$U(\theta_1,\theta_2)$ & $(X_{(1)},X_{(n)})$
\end{tabularx}
若 $T$ 一一变换为 $S$,则充分性等价;充分统计量的函数不一定充分。因子分解中所有含 $\theta$ 的限制也要写进 $g_\theta(T)$,如 $I\{X_{(n)}\le\theta\}$。

\blk{4. 点估计优良性}
估计 $g(\theta)$。偏差 $b(\theta)=\E_\theta T-g(\theta)$;
\[
\operatorname{MSE}_\theta(T)=\E_\theta(T-g(\theta))^2=\Var_\theta(T)+b^2(\theta).
\]
无偏:$b=0$。弱相合:$T_n\overset p\to g(\theta)$;充分条件:
$\operatorname{MSE}_\theta(T_n)\to0$。渐近无偏:
$\lim_{n\to\infty}\E_\theta T_n=g(\theta)$。若 $T_1,T_2$ 无偏估计同一目标且不相关,
$cT_1+(1-c)T_2$ 最小方差权重
$c=\Var(T_2)/(\Var(T_1)+\Var(T_2))$。
若 $T$ 无偏估计 $\theta$,则 $T^2$ 一般不是 $\theta^2$ 的无偏估计;
$\E S_n^2=(n-1)\sigma^2/n$,故 $S_n^2$ 有偏、$S^2$ 无偏。
切比雪夫判据:$\E T_n\to\theta,\Var(T_n)\to0\Rightarrow T_n\overset p\to\theta$。

\blk{矩估计}
总体原点矩 $\mu_k(\theta)=\E_\theta X^k$,样本原点矩 $A_k=n^{-1}\sum X_i^k$,方程 $\mu_k(\theta)=A_k$。函数参数用代入。常用矩:
\[
U(0,\theta):\E X=\theta/2;\quad
U(\theta,\theta+1):\E X=\theta+1/2;\quad
U(\theta,2\theta),\theta>0:\E X=3\theta/2.
\]
\[
\Gamma(r,\lambda)\text{(率)}:\E X=r/\lambda,\Var X=r/\lambda^2;\quad
\log N(a,\sigma^2):\E X=e^{a+\sigma^2/2}.
\]
二项 $B(k,p)$ 两参矩估计:令 $\hat\mu=A_1,\hat v=B_2=A_2-A_1^2$,
$\hat p=1-\hat v/\hat\mu,\ \hat k=\hat\mu/\hat p=\hat\mu^2/(\hat\mu-\hat v)$($k$ 需取正整数时另作约束)。
正态两参矩:$\hat\mu=A_1,\hat\sigma^2=B_2$;Poisson:$\hat\lambda=A_1$;指数率:$\hat\lambda=1/A_1$。
}
\sep
\mini{
\blk{最大似然估计}
\[
\hat\theta\in\arg\max_{\theta\in\Theta}L(\theta;\bm x),\qquad
\ell(\theta)=\sum_i\log p_\theta(x_i).
\]
内点可导:$U(\theta)=0$;端点、非唯一、支持集含参时按定义比较。MLE 不变性:
$\widehat{g(\theta)}_{\rm MLE}=g(\hat\theta_{\rm MLE})$。
二阶判别只在内点可导时有用;若 $L$ 单调,MLE 多在参数空间端点。样本观测不满足支持约束时 $L=0$。

\blk{常用MLE/估计量}
\begin{tabularx}{\linewidth}{@{}lX@{}}
Bernoulli($p$) & $\hat p=\bar X$\\
Binomial($k,p$),$k$已知 & $\hat p=\bar X/k$\\
Poisson($\lambda$) & $\hat\lambda=\bar X$\\
几何($p$,取值$1,2,\ldots$) & $\hat p=1/\bar X$\\
指数率 $\lambda$ & $\hat\lambda=1/\bar X$\\
$N(\mu,\sigma^2)$ & $\hat\mu=\bar X,\ \hat\sigma^2_{\rm MLE}=S_n^2$\\
$N(0,\sigma^2)$ & $\hat\sigma^2=n^{-1}\sum X_i^2$\\
$U(0,\theta)$ & $\hat\theta=X_{(n)}$\\
$U(\theta,\theta+1)$ & $\hat\theta\in[X_{(n)}-1,X_{(1)}]$\\
$U(\theta,2\theta),\theta>0$ & 可行域 $[X_{(n)}/2,X_{(1)}]$,$\hat\theta=X_{(n)}/2$\\
$f(x;\theta)=\theta x^{\theta-1},0<x<1$ & $\hat\theta=-n/\sum\log X_i$
\end{tabularx}
$U(0,\theta)$:$\E X_{(n)}=n\theta/(n+1)$,$\frac{n+1}{n}X_{(n)}$ 无偏估计 $\theta$;$\E\bar X=\theta/2$,$2\bar X$ 也无偏估计 $\theta$。

\blk{Cramer--Rao 下界}
单参数正则族,Fisher信息
\[
I(\theta)=\E_\theta\!\left[\left(\frac{\partial}{\partial\theta}\log f(X;\theta)\right)^2\right]
=-\E_\theta\frac{\partial^2}{\partial\theta^2}\log f(X;\theta).
\]
样本信息 $nI(\theta)$。若 $T$ 无偏估计 $g(\theta)$:
\[
\Var_\theta(T)\ge\frac{[g'(\theta)]^2}{nI(\theta)}.
\]
估计 $\theta$ 时下界 $1/(nI(\theta))$。等号条件:
\[
T-g(\theta)=a(\theta)\frac{\partial}{\partial\theta}\log L(\theta;X).
\]
正则条件下,达到 C-R 下界的无偏估计必为 UMVU;效率
$e(T)=\{[g'(\theta)]^2/(nI(\theta))\}/\Var(T)\le1$。正则性重点:支持不依赖 $\theta$、可交换微分积分、$0<I(\theta)<\infty$。

\blk{常见 Fisher 信息}
\begin{tabularx}{\linewidth}{@{}lX@{}}
Bernoulli($p$) & $I(p)=1/[p(1-p)]$\\
Poisson($\lambda$) & $I(\lambda)=1/\lambda$\\
指数率 $\lambda$ & $I(\lambda)=1/\lambda^2$\\
$N(\mu,\sigma^2)$,估 $\mu$ & $I(\mu)=1/\sigma^2$\\
$N(\mu,\sigma^2)$,估 $\sigma^2$ & $I(\sigma^2)=1/(2\sigma^4)$\\
$f=\theta x^{\theta-1}$ & $I(\theta)=1/\theta^2$
\end{tabularx}

\blk{Rao--Blackwell/UMVU}
若 $T$ 充分,$\delta$ 无偏,则 $\delta^*(T)=\E(\delta\mid T)$ 仍无偏且
$\Var(\delta^*)\le\Var(\delta)$。若 $T$ 完全充分,且 $h(T)$ 无偏估计目标参数,则 $h(T)$ 为唯一 UMVU。
}

\face{第3面:区间估计}
\mini{
\blk{5. 置信区间与枢轴变量}
$[L(X),U(X)]$ 是 $g(\theta)$ 的 $1-\alpha$ 置信区间:
$P_\theta(L\le g(\theta)\le U)\ge1-\alpha$。枢轴变量:含 $\theta$ 与样本,但分布不含未知参数。

\blk{单正态总体精确区间}
$X_i\iid N(\mu,\sigma^2)$,置信系数 $1-\alpha$:
\[
\mu,\ \sigma^2\text{已知}:\quad
\bar X\pm z_{\alpha/2}\frac{\sigma}{\sqrt n}.
\]
\[
\mu,\ \sigma^2\text{未知}:\quad
\bar X\pm t_{n-1}(\alpha/2)\frac{S}{\sqrt n}.
\]
\[
\sigma^2,\ \mu\text{未知}:\quad
\left[\frac{(n-1)S^2}{\chi_{n-1}^2(\alpha/2)},
\frac{(n-1)S^2}{\chi_{n-1}^2(1-\alpha/2)}\right].
\]
\[
\sigma^2,\ \mu\text{已知}:\quad
\left[\frac{\sum(X_i-\mu)^2}{\chi_n^2(\alpha/2)},
\frac{\sum(X_i-\mu)^2}{\chi_n^2(1-\alpha/2)}\right].
\]
$\sigma$ 的区间为上述端点开平方。单侧上限/下限把 $\alpha/2$ 改为 $\alpha$。
常用单侧:$\mu$ 下限 $\bar X-q_\alpha SE$,上限 $\bar X+q_\alpha SE$;
$\sigma^2$ 下限 $A/\chi_\nu^2(\alpha)$,上限 $A/\chi_\nu^2(1-\alpha)$,
$A=(n-1)S^2$ 或 $\sum(X_i-\mu)^2$。

\blk{两个正态总体}
记 $\delta=\mu_1-\mu_2$。
\[
\delta,\ \sigma_1^2,\sigma_2^2\text{已知}:\quad
\bar X-\bar Y\pm z_{\alpha/2}\sqrt{\sigma_1^2/m+\sigma_2^2/n}.
\]
等方差未知:
\[
\bar X-\bar Y\pm t_{m+n-2}(\alpha/2)S_p\sqrt{1/m+1/n}.
\]
配对:$D_i=X_i-Y_i$,
$\bar D\pm t_{n-1}(\alpha/2)S_D/\sqrt n$。
方差比:
\[
\frac{\sigma_1^2}{\sigma_2^2}\in
\left[
\frac{S_X^2/S_Y^2}{F_{m-1,n-1}(\alpha/2)},
\frac{S_X^2/S_Y^2}{F_{m-1,n-1}(1-\alpha/2)}
\right].
\]
若不假定等方差,可用 Welch 近似:
$T=(\bar X-\bar Y-\delta)/\sqrt{S_X^2/m+S_Y^2/n}$,
近似 $t_\nu$,$\nu\approx (a+b)^2\{a^2/(m-1)+b^2/(n-1)\}^{-1}$,$a=S_X^2/m,b=S_Y^2/n$。
}
\sep
\mini{
\blk{非正态/大样本区间}
一般均值 $\mu$:
\[
\bar X\pm z_{\alpha/2}\frac{S}{\sqrt n}.
\]
Poisson($\lambda$) 近似:
\[
\hat\lambda=\bar X,\qquad
\lambda\in\bar X\pm z_{\alpha/2}\sqrt{\bar X/n}.
\]
Poisson 精确($Y=\sum X_i$):
$\lambda\in[\chi^2_{2Y}(1-\alpha/2)/(2n),\ \chi^2_{2Y+2}(\alpha/2)/(2n)]$($Y=0$ 时下限取0)。
指数率 $\lambda$ 精确:
\[
2\lambda\sum X_i\sim\chi^2_{2n},\quad
\lambda\in\left[
\frac{\chi^2_{2n}(1-\alpha/2)}{2\sum X_i},
\frac{\chi^2_{2n}(\alpha/2)}{2\sum X_i}
\right].
\]
指数均值 $1/\lambda$ 用端点取倒数并调换顺序。
一般分位数法:若 $P_\theta(a<T(\theta,X)<b)=1-\alpha$,代数解出 $\theta$ 即得区间。

\blk{比例 $p$}
$X\sim B(n,p)$,$\hat p=X/n$。Wald:
\[
\hat p\pm z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}n}.
\]
Wilson/score,$z=z_{\alpha/2}$:
\[
\frac{\hat p+z^2/(2n)}{1+z^2/n}
\pm
\frac{z}{1+z^2/n}
\sqrt{\frac{\hat p(1-\hat p)}n+\frac{z^2}{4n^2}}.
\]
半长不超过 $d$ 的保守样本量:
$n\ge z_{\alpha/2}^2/(4d^2)$;若有预估 $p_0$,用
$n\ge z_{\alpha/2}^2p_0(1-p_0)/d^2$。
两比例差大样本:
$(\hat p_1-\hat p_2)\pm z_{\alpha/2}\sqrt{\hat p_1(1-\hat p_1)/n_1+\hat p_2(1-\hat p_2)/n_2}$。

\blk{均匀分布区间}
$U(0,\theta)$,$T=X_{(n)}$,$T/\theta$ 的分布函数 $u^n(0<u<1)$。
一般形式:取 $0<a<b<1$,$b^n-a^n=1-\alpha$,
\[
\theta\in[T/b,\ T/a].
\]
常用单侧型:$[T,\ T/\alpha^{1/n}]$。若 $U(\theta_1,\theta_2)$,端点信息集中于 $(X_{(1)},X_{(n)})$。
单侧 $U(0,\theta)$ 下限也可取 $T$(覆盖概率1);上限由 $P(T/\theta\ge\alpha^{1/n})=1-\alpha$。

\blk{区间与检验}
同一枢轴/统计量构造时,双侧水平 $\alpha$ 检验与 $1-\alpha$ 置信区间对应:点假设值不在区间内 $\Leftrightarrow$ 拒绝该点假设。单侧检验对应单侧置信限。

\blk{计算用恒等式}
\[
\chi_\nu^2(1-\alpha)=\text{左侧}\ \alpha\text{分位};\quad
t_\nu(1-\alpha)=-t_\nu(\alpha).
\]
正态样本预测:
$X_{n+1}\mid X_1,\ldots,X_n$ 的枢轴为
$(X_{n+1}-\bar X)/(S\sqrt{1+1/n})$。
}

\face{第4面:假设检验}
\mini{
\blk{6. 基本概念}
检验问题 $H_0:\theta\in\Theta_0$ vs $H_1:\theta\in\Theta_1$。拒绝域 $D$,检验函数 $\varphi=I_D$。水平:
\[
\sup_{\theta\in\Theta_0}P_\theta(X\in D)\le\alpha.
\]
第一类错误:$H_0$ 真而拒绝;第二类错误:$H_1$ 真而未拒绝。功效函数
$\beta_\varphi(\theta)=P_\theta(X\in D)$;在 $\Theta_1$ 上越大越好。
控制原则:先令第一类错误概率不超过 $\alpha$,再尽量降低第二类错误。简单假设下
$\alpha=P_{\theta_0}(D)$,$\beta_{\rm II}=P_{\theta_1}(D^c)$。

\blk{通用拒绝域}
若 $K$ 在 $H_0$ 下分布已知,且采用上侧分位数:
\[
H_1:>\quad K>K_\alpha;\qquad
H_1:<\quad K<K_{1-\alpha};
\]
\[
H_1:\ne\quad K<K_{1-\alpha/2}\ \text{或}\ K>K_{\alpha/2}.
\]
对 $Z,t$ 的双侧写作 $|K|>K_{\alpha/2}$。
右尾/左尾/双尾分别对应“越大越支持/越小越支持/偏离越支持”。

\blk{单正态总体均值}
$H_0:\mu=\mu_0$ 或单侧复合原假设。
\[
Z=\frac{\bar X-\mu_0}{\sigma/\sqrt n}\sim N(0,1)\quad(\sigma^2\text{已知}),
\]
\[
T=\frac{\bar X-\mu_0}{S/\sqrt n}\sim t_{n-1}\quad(\sigma^2\text{未知}).
\]
令 $K=Z$ 或 $T$。拒绝域:$H_1:\mu>\mu_0$ 用 $K>q_\alpha$;
$H_1:\mu<\mu_0$ 用 $K<-q_\alpha$;
$H_1:\mu\ne\mu_0$ 用 $|K|>q_{\alpha/2}$。
已知 $\sigma$ 右尾功效:
$P_\mu(Z>z_\alpha)=1-\Phi(z_\alpha-\sqrt n(\mu-\mu_0)/\sigma)$。

\blk{单正态总体方差}
$H_0:\sigma^2=\sigma_0^2$。
\[
Q=\frac{(n-1)S^2}{\sigma_0^2}\sim\chi^2_{n-1}\quad(\mu\text{未知}),
\]
\[
Q=\frac{\sum(X_i-\mu)^2}{\sigma_0^2}\sim\chi_n^2\quad(\mu\text{已知}).
\]
$H_1:\sigma^2>\sigma_0^2$:$Q>\chi^2_\nu(\alpha)$;
$H_1:\sigma^2<\sigma_0^2$:$Q<\chi^2_\nu(1-\alpha)$;
双侧取两尾 $\alpha/2$。
方差检验依赖正态假设;$\chi^2$ 双侧临界点不对称。
}
\sep
\mini{
\blk{两个正态总体均值差}
$H_0:\mu_1-\mu_2=\delta_0$。
\[
Z=\frac{\bar X-\bar Y-\delta_0}{\sqrt{\sigma_1^2/m+\sigma_2^2/n}}
\quad(\sigma_1^2,\sigma_2^2\text{已知}),
\]
\[
T=\frac{\bar X-\bar Y-\delta_0}{S_p\sqrt{1/m+1/n}}
\sim t_{m+n-2}\quad(\sigma_1^2=\sigma_2^2\text{未知}).
\]
配对:$T=(\bar D-\delta_0)/(S_D/\sqrt n)\sim t_{n-1}$。方向与单均值同。
两独立大样本均值差:
$Z=[\bar X-\bar Y-\delta_0]/\sqrt{S_X^2/m+S_Y^2/n}\approx N(0,1)$。

\blk{两个正态总体方差比}
$H_0:\sigma_1^2/\sigma_2^2=\rho_0$:
\[
F=\frac{S_X^2/S_Y^2}{\rho_0}\sim F_{m-1,n-1}.
\]
$H_1:\rho>\rho_0$:$F>F_{m-1,n-1}(\alpha)$;
$H_1:\rho<\rho_0$:$F<F_{m-1,n-1}(1-\alpha)$;
双侧取两尾。

\blk{大样本检验}
一般均值:
$Z=(\bar X-\mu_0)/(S/\sqrt n)\approx N(0,1)$。
单比例:
\[
Z=\frac{\hat p-p_0}{\sqrt{p_0(1-p_0)/n}}\approx N(0,1).
\]
两比例 $H_0:p_1=p_2$:
\[
\hat p=\frac{x_1+x_2}{n_1+n_2},\quad
Z=\frac{\hat p_1-\hat p_2}{\sqrt{\hat p(1-\hat p)(1/n_1+1/n_2)}}.
\]
近似 $N(0,1)$。
Poisson($\lambda$):
$Z=(\bar X-\lambda_0)/\sqrt{\lambda_0/n}\approx N(0,1)$。
检验用的标准误通常在 $H_0$ 下代入;置信区间通常用估计值代入。

\blk{似然比检验}
\[
\Lambda(\bm x)=\frac{\sup_{\theta\in\Theta_0}L(\theta;\bm x)}
{\sup_{\theta\in\Theta}L(\theta;\bm x)},\quad 0\le\Lambda\le1,
\]
拒绝域为 $\Lambda\le c$。正则且 $H_0$ 为内点约束时,大样本:
$-2\log\Lambda\Rightarrow\chi_r^2$,$r=\dim\Theta-\dim\Theta_0$。
复合假设先求受限/非受限 MLE;简单对简单常用 $LR=L(\theta_0)/L(\theta_1)$ 作 Neyman--Pearson 检验。

\blk{p值}
p值是在 $H_0$ 下“至少同样极端”的概率;$p\le\alpha$ 等价于水平 $\alpha$ 下拒绝。双侧 $Z/t$ 常用 $2P_{H_0}(K\ge |k_{\rm obs}|)$。
右尾 $p=P(K\ge k_{\rm obs})$,左尾 $p=P(K\le k_{\rm obs})$;$\chi^2,F$ 双侧不能按对称性简化。

\blk{容易混淆}
矩估计/相合不保证无偏;MLE 可不唯一;$S^2$ 与 $S_n^2$ 分母不同;$\chi^2,F$ 表用上侧分位数;等方差两样本才用 $S_p^2$。
}

\end{document}