P<0.05或0.01,是研究者们独有的快乐源泉。不过,在得到满意的结果后,还得正确报告P值,不然可能会被审稿人“找茬”哦~
我们整理了Guidelines for Reporting of Statistics for Clinical Research inUrology 一文里“Inference and p values”一节的内容,来看看P值的报告准则吧~
1 不接受零假设
在统计检验中,如果p值为0.05或更高,研究人员应避免得出“药物无效”、“不同组之间没有差别”或“应答率未受影响”等结论。
正确的表述是:“我们没有看到药物效应的证据”、“我们无法证明不同组之间的差异”,或是采用“在应答率方面没有统计上的显著差异”之类的表述。
2 P值略高于0.05并不是一种“趋势”
避免说像0.07这样的p值显示了一种“趋势”或“接近统计意义”,因为p值并不会变化,也不会移动到0.05,这是没有意义的。
合适的表述应该是:“尽管我们看到一些证据表明接受新手术的患者的应答率有所提高,但两组之间的差异没有达到统计学意义上的一般水平。
3 P值和95%的置信区间不能量化假设的概率
比方说,p值为0.03并不意味着这些发现有3%的概率是偶然的。
此外,95%的置信区间(Confidence Intervals ,CI)不应解释为95%的确定性,或认为真实参数值在95%CI的范围内。
P值的正确解释是:
当零假设为真时,得出研究中观察到的或更极端结果的概率;
如果使用不同的样本多次重复研究,得出的CI有95%的概率会包含真实参数值。
4 不要使用置信区间来检验假设
研究人员通常根据假设来解释置信区间。
例如,研究人员可能声称两组之间存在统计学上的显著差异,因为OR值(odds ratio )的95%CI不包括1。此类声明是有问题的:置信区间与估计值有关,与推理无关。
此外,计算置信区间的数学方法可能不同于用于计算p值的数学方法。即使p值<0.05,反之亦然,完全有可能获得不包含组间差异的95%CI。
例如,在一项100名患者的研究中,两组事件发生率分别为70%和50%,Fisher精确检验的p值为0.066,但OR值的95%CI为1.03-5.26。
5 合理解读多个P值的结果
如果对同一假设分别进行检验,经常会发生这样的错误:干预效果在一个亚组中有统计学意义,而在另一亚组中没有意义。一种更合适的方法是在统计模型中使用交互项。
例如,要确定某个药物在女性中的疼痛减轻程度是否比男性高,该模型可以这样建立:
6 避免依赖统计检验确定分析类型
有许多统计检验可以用来确定如何进行假设检验。但这种益处往往值得怀疑的,统计学家们也未达成一致。
研究人员可能会:
对正态性进行Shapiro-Wilk检验,以确定是否使用t检验或Mann-Whitney检验;
使用Cochran的Q检验,以决定是否在meta分析中使用固定效应或随机效应方法;
或者对协变量中的组间差异进行t检验,以确定该协变量是否应包括在多变量模型中。
这类方法的问题在于,它们经常检验的是已知为假的零假设。例如,没有数据集完全服从正态分布。
研究者应该遵循预先指定的分析计划,只有在数据明确指出有更好的替代方案时才能改变分析。
7 在报告p值时,确保假设是合理的
在结果部分报告p值时,请说明你要检验的假设(除非这一点是完全清楚的)。
举个例子: “第一组疼痛得分较高,第二组和第三组相似(p=0.02)。”
P值等于0.02到底是测试第一组还是第二组和第三组的总和,还是假设所有三组的疼痛评分相同?
在报告P值时,一定要清楚假设是什么,确保它是合理的。
扫描下方二维码,关注【埃米编辑】公众号,获取更多的SCI论文写作资料。
编译/婷婷
参考资料:
[1] Assel M, Sjoberg D, Elders A, et al.Guidelines for Reporting of Statistics for Clinical Research in Urology. EurUrol. 2019;75(3):358-367. doi:10.1016/j.eururo.2018.12.014