在《数据分析简易教程(上)》中,作者介绍了三种常用的参数检验方法。下面,作者将介绍几种常用的非参数检验方法,并给出选择合适数据统计分析方法的流程图。
2. 非参数检验
非参数检验较为简单,不需要大数据量,也只有很少的假设。它们在检测组间细微差别上不太灵敏,但是在大多数情况下都够用了。非参数检验都假设观察值是独立的,先前观察值不影响随后的观察值。
A. 单样本卡方检验
单样本卡方检验适用于离散数据,用来检测观察频数是否不同于期望频数。以下公式可计算卡方值:
O是观察频数,E是期望频数,k是类别数,自由度是k-1。查表可知某自由度、某p值对应的卡方临界值,计算值大于等于临界值时拒绝无效假设。
B. 两样本卡方检验
当观察值可以根据不同特性被分为两组时使用。公式、列表与单样本相同,唯一不同的地方是计算期望频数的方式。假如我们抓住了森林中的全部蜥蜴,并根据种和栖息地分类,列表如下:
栖息地 |
种1 |
种2 |
总计 |
木桩 |
50 |
5 |
55 |
落叶 |
20 |
100 |
120 |
总计 |
70 |
105 |
175 |
我们想知道种和栖息地间有没有关联(无效假设为不同种选择的栖息地没有差别)。为计算每格的期望频数,要把行总计和列总计相乘,再除以总数,比如木桩上的第一种蜥蜴期望频数为70*55/175=22。计算出期望值如下:
栖息地 |
种1 |
种2 |
总计 |
木桩 |
22 |
33 |
55 |
落叶 |
48 |
72 |
120 |
总计 |
70 |
105 |
175 |
自由度df=(列数-1)*(行数-1),此例中的自由度=1。查表,将计算得到的卡方值与临界值比较,如计算值大于等于临界值则拒绝无效假设。
C. 其它非参数检验
Wilcoxin秩和检验和Mann-Whitney U检验可以检验两组之间的差异(即非参数的t检验)。Kruskall-Wallis检验两个以上组之间的差异(即非参数的ANOVA)。Spearman相关性检验是非参数相关性分析。当数据不呈正态分布时,就可以用这些检验方式。它们不要求原始数据连续分布,但是大部分还需要符合方差同性。一般来说,在样本量较小时(10或20以内),应该用非参数检验替代参数检验。
在进行实验之前就要确定如何进行数据分析。利用下方的流程图,选择正确的数据分析方式。
扫描下方二维码,关注【埃米编辑】公众号,获取更多SCI论文写作资料。
编译/石珺怡
参考资料:http://abacus.bates.edu/~ganderso/biology/resources/statistics.html