假设检验

  1. 给出零假设和备择假设:

    零假设和备择假设是参数空间的真子集,且不能相交。

    常把没有把握不能轻易肯定的命题作为备择假设H1H_1,而把没有充分理由不能轻易否定的命题作为零假设H0H_0。或者说我们将希望通过实验结果推翻的假设记为零假设H0H_0

  2. 根据备择假设确定检验方向:

    备择假设含≠则为双尾;含<或>则为单尾,含<为左尾,含>为右尾。

  3. 判断抽样分布类型:

    主要判断抽样分布是否近似正态分布

  4. 确定检验类型及检验统计量:在判断用什么检验的时候,首要考虑的条件是样本量,其次是总体服从的分布

    • 样本容量大时(统计学上一般认为n≥30),总体的均值和标准差未知,不要求总体近似服从正态分布。根据中心极限定理,样本容量大,则样本均值的抽样分布服从正态分布,总体标准差可以用样本标准差来估计,可用Z检验;

    • 当样本容量小于30,且满足总体近似服从正态分布时,如果总体标准差已知,可用Z检验;

    • 当样本容量小于30,且满足总体近似服从正态分布时,如果总体标准差未知,可以用样本标准差去估计总体标准差,由此可用T检验;(z=t=Xˉμ0S/nz = t=\frac{\bar X-\mu_0}{S/\sqrt n}

    • 当样本容量小于30,且不满足总体近似服从正态分布,不能用Z检验和T检验。

    简单地说其实就是,总体标准差怎么估计的问题。检验类型确定了,检验统计量也就确定了。

    除此以外,还可以使用χ2\chi^2检验,检验观测频次与假设频次是否一致χ2=i=1k(OiEi)2Ei\chi^2 = \sum^k_{i=1}\frac{(O_i-E_i)^2}{E_i}

  5. 确定显著性水平α\alpha,一般取5%

两类错误

两类显著性错误分别是弃真错误和纳伪错误,含义很简单,顾名思义即可,他们分别用α\alphaβ\beta表示。

这个α\alpha其实也就是上面提到的显著性水平,我们设定了原假设H0H_0,目前有α\alpha的概率发生我们错误的把正确的原假设H0H_0拒绝的情况,当α\alpha足够小,这个事件就几乎不可能发生,但是我们计算出的结果确实发生了这样的情况,那就说明原假设是错误的,那么相反的备择假设就是正确的了。这就是假设检验的原理。