六西格玛或者统计学中的方差分析(Analysis of Variance, ANOVA)是一种用于分析多个变量之间差异性的统计方法,方差分析的基本思想是将总体方差分解为不同来源的方差,以确定这些来源是否对总方差产生显著的影响。
其中一個較常用的是比较多个组的均值差异,ANOVA可以通过比较多个组之间的均值来确定它们是否存在显著的差异,从而评估不同组之间的影响因素。
举一个制造业的例子:A,B,C三条生产线的所得出的某件零件的平均值是否相同?我们就可以透过方差分析来验证,就像以下优思学院六西格玛课程所描述的情况一样。
在方差分析时,数据应符合正态分布以及方差相似性(equal variance)。如果数据不符合这些预设,需要进行数据转换或使用非参数检验方法。
如何利用EXCEL進行方差分析?
优思学院认为,大部分的六西格玛和统计工具都可以透过Excel完成,而不必要一定使用Minitab。以下,我将会介绍一下如何利用EXCEL进行方差分析。
首先,单击顶部 Excel 菜单中的数据,然后在分析部分查找数据分析(Data Analysis)。
如果您没有看到 Data Analysis,就需要另外安装它。
从技术上讲,您可以使用单向方差分析来比较两组。但是,如果您只有两组数据,您通常会使用双样本 t 检验。
方差分析的标准假设如下:
- 原假设(H0):所有组均值相等。
- 备选假设(H1):并非所有组均值都相等。
如果p 值小于您的显着性水平(通常为 0.05),则拒绝原假设。您的样本数据支持以下假设:至少一个总体的均值不同于另一个总体的均值。同样,假设检验使用样本数据得出有关总体的结论。
我们在这里会比较三个生产线所生产出来的香水量(毫升)。我们从每个生产线处随机抽取4个单位的材料样本,并测量所有单位的香水量。现在,我们要确定来自三个生产线的平均香水量是否有显着的不同。
要在 Excel 中执行方差分析,请按列排列数据,如下所示。对于我们的示例,每一列代表来自一个生产线的香水量结果。
在 Excel 中,执行以下步骤:
1)单击数据选项卡上的数据分析。
2)从数据分析弹出窗口中,选择方差分析:单一因子(ANOVA:Single Factor)。
3)在Input下,选择所有数据列的范围。
4)在分组方式(Grouped by)中,选择列(Column)。
5)如果第 1 行中有有意义的变量标签(例如A,B,C),请选中标签复选框(Labels in the first row)。此选项有助于使输出更易于解释。确保在步骤 #3 中包含标签行。
5)Excel 使用默认的 Alpha 值 0.05,这通常最常的值。Alpha 是显着性水平。
6)单击OK。
在 Excel 创建输出后,我自动调整列 A 列的宽度以显示其中的所有文字。
在以上的方差分析表中,p 值为 0.1225438。因为该值小于我们的显着性水平 0.05,所以我们不能推翻原假设。意思就是我们的样本数据未能提供足够有力的证据来得出三个总体均值不相等的结论。