源于美国 University of Wisconsin – Madison
SCI论文英语润色专家,SCI润色,论文润色
周一至周五
inquiry@aimieditor.com 9:00-18:00

学术资源

埃米主编
30+主流期刊审稿人:这些统计和研究问题已成为普遍现象
审稿人,统计问题,研究设计,论文润色,英语润色,埃米编辑

以下内容首发于【埃米编辑】微信公众号。关注埃米编辑,科研不迷路~

投稿时最怕审稿专家提啥意见?

统计/研究设计问题肯定有一席之地。这类意见往往意味着我们要执行额外实验、重新处理数据、重新建构讨论……问题严重的话,会直接导致拒稿。

有研究者访谈了39本高影响力期刊的编辑和审稿人(精神病学领域),总结了专家经常发现的稿件中的统计/研究设计问题。

我们整理了此次调查的主要结论,相信大家看完后会很有收获哦~

1 不符合统计模型假设

作者经常在不了解基本假设的情况下使用统计模型。

常见问题:

1) 标准大样本统计方法经常用于小样本或明显违反模型假设的情况下。当对大样本统计有疑虑时,可以考虑非参数和无分布(distribution free)方法(例如, Bootstrap resampling methods)。

2) 数据中的依赖关系(例如对个人的重复测量)不要用强独立假设模型进行分析,例如多层线性模型(HLM)或广义估计方程(GEE)。

3) 使用潜变量模型(如结构方程模型)时没有明确的假设,也未检查是否满足这些假设。

2 临床试验相关问题

临床试验的有效性通常取决于对重要方法学问题的坚持性和敏感性。

常见问题:

1) 没有事先计算统计功效(Statistical power),样本量不足以检验预估的主要临床结果。

回顾性功效分析(即统计检验后确定其功效)的复杂性和方法也没有得到重视。

2) 在一个两组的前-后设计中,如果一个组在配对t检验中出现显著变化(p<0.05),而另一个组没有(例如p=0.15),就不能断定组与组之间存在明显的差异。

检验各组是否随时间变化而不同,需要进行2-way ANOVA(时间与条件),用交互作用项评估各组在不同项目上是否有显著差异,这类错误案例很多。

3) 许多有经验的研究人员并不了解等效检验和差异检验之间的区别。

在小型检验中,无法拒绝“两个治疗方法是等效的”这一无效假设并不能确定治疗方法的等效性。除非研究者专门设计了一个有足够功效的等效性或非劣效性试验,否则对零结果的正确解释是: "我们没有发现差异,但这并不意味着差异不存在。"

4) 意向性分析(Intent to treat analysis)应该是主要分析。所谓的 "完成者分析 "(completers analysis)往往会产生偏差估计和误导性结果。

一个简单的例子:假设有一个安慰剂对照设计,在治疗组中只有应答者(占总数的50%)被保留下来进行干预后评估。对完成者的分析所得出的治疗效果估计值将远远大于意向性治疗的分析,因为意向性治疗会包括退出者的数据。

纳入所有意向治疗样本数据的最佳方式因研究设计而异,但这基本上是一个缺失数据的问题,应以有原则的、统计学上合理的方式来处理(如多重归因和其他基于似然估计的方法、贝叶斯缺失数据方法等),而不是通过临时的或较低级的方法,如均值替换(Mean imputation)或末次观测值结转法(Last observation carried forward)。

3 准实验研究

准实验研究在没有随机化的情况下估计治疗效果,所以准实验研究需要收集所有可能会混淆因素的数据,并用强有力的统计方法控制它们。

建议:

1) 较好的准实验策略包括贝叶斯偏差模型(Bayesian bias models)和蒙特卡罗敏感度分析(Monte Carlo sensitivity analyses),倾向性评分加权的混合效应回归模型(propensity score weightedmixed-effect regression models)。

2) 工具变量分析(Instrumental variable analysis)是经济学和其他领域中一种流行的准实验方法,是学科交叉的一个例子,可以为更好的分析实践提供信息。

3) 作者在讨论准实验研究的结果时,不应将因果关系归因于感兴趣的暴露变量,而应考虑对结果的其他解释,如自我选择或混淆偏倚。

4 心理测量学

常见问题:

1) 对测量工具的心理测量特性的描述往往是不完整的,而且不包括有关其开发或验证的人群的信息。

被认为“良好”或“足够”的典型Kappa值可能会在关联估计中引入较大偏差(通常是向下偏差)。选择或开发更可靠的工具,或从几个指标构建潜在变量,可以大大提高研究的力量和有效性。

2) 旨在开发新量表和子量表的因子分析往往是在样本太小而无法产生可靠结果的情况下进行的。

3) 对于新提出的工具,Cronbach's alpha有时被误解为信度指数。这可能会给人一种错误的印象,即作者已经评估了信度(例如,重测信度、评分者信度等),但他们经常没有这样做。

参与此次调查的编辑和审稿人认为,上述统计和研究设计问题很普遍,严重影响了稿件质量。

因此,希望以上内容能帮助大家提前发现可能出现的问题,有针对性地改进研究和手稿。如果还有其他问题,也欢迎关注埃米编辑公众号留言分享哦~

 

扫描下方二维码,关注【埃米编辑】微信公众号,获取更多SCI论文写作资料。

编译/婷婷

参考资料:

[1] Harris, A. H., Reeder, R., & Hyun, J. K. (2009). Common statistical and research design problems in manuscripts submitted to high-impact psychiatry journals: what editors and reviewers want authors to know. Journal of psychiatric research, 43(15), 1231–1234.

阅读(1334) 2022年02月17日
© 2018 — 2024 武汉埃米文化传播有限公司版权所有