什么是 T test

t检验又叫 Student’s t-test, 一般而言, 是为了确定从样本(sample)统计结果推论至总体时所犯错的概率, 以下是 T test 的前提条件:

  • 用于小样本(样本容量小于30)的检验方法
  • 总体标准差σ未知
  • 适用条件:符合正态分布的样本

对于不同的情况有若干类型的 t 检验,但它们在原假设下都使用服从 t 分布的检验统计量:

  • 单样本 T 检验(One-sample location test )
  • 双样本 t 检验
  • 配对 t 检验
  • 回归输出中的 t 检验

单样本 T 检验(One-sample t-test)

当不知道总体的标准差时,使用单样本 t 检验估计总体均值,并将其与目标值或参考值进行比较.

  • 确定某一组的均值是否与指定值不同
  • 计算可能包含总体均值的值的范围

适用的案例:

  • 女大学生的平均身高是否大于 5.5 英尺?
  • 一家披萨公司的经理随机收集了披萨送货时间的样本。这位经理使用单样本 t 检验,确定平均送货时间是否显著少于竞争对手宣称的 30 分钟的送货时间

该检验计算您的样本均值和与样本变异性相关的假设均值之间的差值。通常情况下,差值越大,样本中的变异性就越小,总体均值与假设均值存在显著差异的可能性就越大。

对于单样本 t,假设条件为:

原假设(null hypothesis 又叫做零假设): 零假设的内容一般是希望证明其错误的假设.

H0: μ = µ0 总体均值 (μ) 等于假设均值 (μ0)

备择假设(alternative hypothesis 与零假设相对的是备择假设(对立假设),即不希望看到的另一种可能或者为可以相信为真实或有望证明为真实的内容。), 选择以下选项之一:

  • H1: μ ≠ µ0 总体均值 (μ) 与假设均值 (μ0) 不同
  • H1: μ > µ0 总体均值 (μ) 大于假设均值 (μ0)
  • H1: μ < µ0 总体均值 (μ) 小于假设均值 (μ0)

单样本 t 检验还非常适用于违反正态性假设的情况,但仅当基本分布为对称、单峰和连续时。如果值的偏斜非常大,则可能更适合使用非参数过程,例如单样本符号检验。

使用 R 做单样本 T 检验

假设一组数据 U1, 原假设是 U =100.

1
2
3
4
5
6
7
8
9
10
11
12
13
> library(MASS)
> t.test(UScrime["U1"],U1=100)
One Sample t-test
data: UScrime["U1"]
t = 36.303, df = 46, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
90.17464 100.76153
sample estimates:
mean of x
95.46809

结果解析:

t = 36.303

df = 46

自由度: 当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,称为该统计量的自由度.

p-value < 2.2e-16

p值是将观察结果认为有效即具有总体代表性的犯错概率, 0.05的p值通常被认为是可接受错误的边界水平. p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标.

  • 如果P<0.01,说明是较强的判定结果,拒绝假定的参数取值。
  • 如果0.01<P值<0.05,说明较弱的判定结果,拒接假定的参数取值。
  • 如果P值>0.05,说明结果更倾向于接受假定的参数取值。

拓展: http://cos.name/2016/03/asa-statement-on-p-value/

95 percent confidence interval: 置信区间包含真值的概率是 95%.显著性水平为 0.05 的检验的决策可以基于 95% 置信区间:

  • 如果在 H0 中指定的参考值位于区间之外(即小于下限或大于上限),则可否定 H0
  • 如果在 H0 中指定的参考值位于区间之内(即不小于下限或大于上限),则无法否定 H0

mean of x 平均值

综上, 根据 P 值, 我们可以否定原假设, U1 不等于 100.

双样本 T 检验(Two-Sample t-Test)

当标准差未知并且样本彼此不同(独立样本)时,双样本 t 可对两个总体均值之间的差值计算置信区间并执行假设检验

  • 确定两个独立组的均值是否存在差异
  • 计算两个总体均值之间的差值的范围

要执行双样本 t 检验,两个总体必须彼此独立. 也就是说,第一个样本的观测值与第二个样本的观测值之间不能存在任何依赖关系。

适用的案例:

  • 确定两个谷物分配器分配的谷物数量是否相同
  • 独立的两组学生的考试成绩是否相同
  • 考察一台设备改造前后生产的产品有没有差别

原假设

H0: μ1- μ2 = δ0 两个总体均值之间的差值 (μ1- μ2) 等于假设差值 (δ0)

备择假设

选择以下选项之一:

  • H1: μ1- μ2≠ δ0 两个总体均值之间的差值(μ1- μ2) 不等于假设差值 (δ0)
  • H1: μ1- μ2> δ0 两个总体均值之间的差值 (μ1- μ2) 大于假设差值 (δ0)
  • H1: μ1- μ2< δ0 两个总体均值之间的差值 (μ1- μ2) 小于假设差值 (δ0)

使用 R 做双样本 T 检验

1
2
3
4
5
6
7
8
9
10
11
12
13
> library(MASS)
> t.test(UScrime["U1"],UScrime["U2"])
Welch Two Sample t-test
data: UScrime["U1"] and UScrime["U2"]
t = 21.174, df = 65.261, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
55.69010 67.28862
sample estimates:
mean of x mean of y
95.46809 33.97872

结果解析:

根据 P 值可以得出结果: U1 和 U2 的平均值不相等.

成对 t 检验(Paired t-test)

Pair-t一般用于同一研究对象分别给于两种不同处理的效果比较或同一研究对象处理前后的效果比较。

用此分析:

  • 确定两个配对样本之差的均值不等于 0(或目标值)
  • 计算可能包含差异总体均值的值的范围

成对t检验Paired Test是对来自同一总体的样本,在不同条件影响下获取的2组样本进行分析,以评价不同条件是否对其有显著影响。

适用的案例:

  • 假设健身中心的管理人员想要确定他们的减肥计划是否有效
  • 考察一组产品在长时间存放之后有没有变化

使用 R 做成对 t 检验

1
2
3
4
5
6
7
8
9
10
11
12
> t.test(cc,cd,paired = TRUE)
Paired t-test
data: cc and cd
t = -3.5822, df = 9, p-value = 0.005911
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-13.378314 -3.021686
sample estimates:
mean of the differences
-8.2

结论:

同样, P 值太小, 否定原假设.