# 3.8 方差分析

如果我们不是要对两个组做 A/B 测试,而是要对比多个包含数值型数据的组(比如 A、B、 C、D) 这时可以使用方差分析(ANOVA,analysis of variance)。

方差分析是一种检验多个组之间统计显著性差异的统计学方法。

  • 主要术语

两两对比
对于有多个组的情况,在两个组之间做假设检验(比如对均值)。
多项检验(omnibus test)
一种可以测定多个组均值间方差的单一假设检验。
方差分解
从整体统计量中(例如,从整体均值、处理均值以及残差中),分离出单个值的贡献情况。
F 统计量 一种归一化统计量,用于衡量多个组均值间的差异是否会超过随机模型的预期。
SS
sum of square(平方和)的简写,指与某一均值的偏差。

# 3.8.1 F统计量

在比较两组的均值时,我们可以使用 t 检验替代置换检验。
类似地,对于方差分析而言,存在一种基于 F 统计量的统计检验。

F 统计量基于各组均值间的方差(即处理效果)与由于残差所导致的方差间的比率。比率越高,结果就越统计显著。
如果数据遵循正态分布,那么根据统计学理论,统计量也应符合某种分布。由此,p 值也是可以计算的。

在 R 语言中,可以使用 aov 函数计算 ANOVA 表。

> summary(aov(Time ~ Page, data=four_sessions)) Df Sum Sq Mean Sq F value Pr(>F)
Page 3 831.4 277.1 2.74 0.0776 .
Residuals 16 1618.4 101.2
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

在输出结果中,
Df 表示自由度,
Sum Sq 表示平方和,
Mean Sq 是“均方偏差”(mean- squared deviations 的简写),
F Value 是 F 统计量。

总平均的平方和 等于 总平均(与 0 的差值)平方后再乘以观测数 20。 (P104)

# 3.8.2 双向方差分析

上一节介绍的 A/B/C/D 测试是一种“单向”方差分析,其中只有一个变化因子(组)。
我们可以加入第二个因子,例如“周末与工作日”,并在每对组合上收集数据(周末 A 组、 工作日 A 组、周末 B 组等)。
这就构成一个双向方差分析。

我们可以使用类似于单向方差 分析的实现方法,通过识别“交互效应”实现双向方差分析。

在确定了总平均效果和处理 效果后,我们将各组中的周末和工作日观测结果分成子集,并找出各个子集的均值与处理 均值之间的差异。

我们可以看到,方差分析(包括双向方差分析)是迈向完全统计模型(例如回归和逻辑回 归)的第一步。
完全统计模型可以对多个因子及因子的影响情况建模(参见第 4 章)。

# 本节要点

  1. 方差分析是一种用于分析多组处理结果的统计过程。
  2. 方差分析是对 A/B 测试中类似过程的一种扩展,用于评估各组之间的整体方差是否落在随机变异范围内。
  3. 方差分析的一个有用结果是识别出与组处理、交互效果和误差相关的方差成分。

# 拓展阅读

  1. 在 Peter Bruce 的 Introductory Statistics and Analytics: A Resampling Perspective 一 书 中, 专门有一章介绍了方差分析。
  2. George Cobb 撰写的 Introduction to Design and Analysis of Experiments 一书全面介绍了方 差分析,适合阅读。