020-38324329
020-38324614
在线投稿
医学论文常见的统计学错误分析
发表时间:2018-10-16     来源:网络
卫生统计在医学期刊中占有非常重要的地位。任何科研设计、实验研究都离不开统计方法,而统计方法的正确与否直接影响到论文的质量。我们在编审稿件过程中,经常遇到统计学方法使用不当等问题。本文就当前医学期刊来稿中常见的卫生统计学错误分析如下。

1 统计结论的描述不确切

数理统计的基础是概率论,对统计分析的资料下结论的依据是小概率事件在一次试验中是不可能发生的。一般统计上习惯把概率P≤0.05或P≤0.01认为是小概率事件。当通过假设检验(显著性检验)获得P>0.05时,认为是大概率事件,说明在这一次试验中很可能发生,因此接受假设,认为差异无显著意义(差异不显著)。反之,若P≤0.05,则认为差异有显著意义,P≤0.01差异有非常显著意义,也就是说P越小,医学全在线www.med126.com就越有理由认为被比较的均数或率之间有差异。至于两者差异有多大,这要由它们之间实际相差有多大再结合专业知识来确定。不是由P≤0.05,还是P≤0.01来决定。一般统计上说的“差异显著”(P≤0.05),“差异非常显著”( P≤0.01)是统计学的术语,它不同于一般意义上的“显著”概念。为了不至于混淆这两者的概念,现在统计学上主张用差异无显著意义或无统计意义、差异有显著意义或有统计意义、差异有非常显著意义或高度统计意义来代替以前常用的“差异不显著”、“差异显著”和“差异非常显著”。再有通过统计分析被比较的均数或率是否被认为有差别,决定于被研究事物有无本质差异和抽样误差的大小(又决定于个体差异的程度和样本例数的多少),以及选用检验水准α的高低,而检验水准的高低是根据分析要求确定的,但在实际应用中有一定的灵活性。即使取同一检验水准,其样本差异虽无显著意义,当增加样本例数,由于减少了抽样误差,可能差异有显著意义。因此,P接近显著水准α时,下结论要慎重。 下结论时,不仅根据统计学的结论,还要根据专业知识来判断。有的人只凭少量的统计资料就作出“有差异”、“无差异”的判断,并对所调查的数据下结论,是不科学的。而“有差异”、“无差异”这样的说法也是不对的。例如调查吸烟者与不吸烟者的慢性气管炎的患病情况(P<0.01),只能说明吸烟者与不吸烟者患慢性气管炎差异有非常显著性意义,即吸烟者更容易患慢性气管炎,至于两者患病率相差是否显著,要结合专业知识来判断,而不能说非常显著。这种统计结论的描述性错误很常见,编辑在修改稿件中必须注意。

2 统计指标的误用

在来稿中,经常遇到统计指标的误用,常出现率与构成比,发病率与患病率,死亡率与病死率等的混淆。

2.1 把构成比当率 构成比是说明事物或现象内部各构成部分的比重,率为表示某种现象发生的频率或强度。它们都是相对数指标,用百分数表示。有一篇题为“某年某地5类传染病疫情分析”,该文作者认为,5类传染病的发病率依次为痢疾48.62%(3685/7579)、肝炎27.85%(2111/7579)、乙脑11.22%(850/7579)、流脑6.89%(522/7579)、麻疹5.42%(411/7579)。该资料是构成比,不是发病率,故犯了“以比代率”的错误。

2.2 发病率与患病率 发病率是指观察期内(年、季、月等)新发生某病的例数与同期平均人口数之比,强调在观察期内的新发病例数。而患病率则指观察时点的某病的现患病例数与该时点人口数之比,强调的是该观察时点上某病的现患(新、旧病例)情况。有人调查男性7674人,沙眼患者6235人,发病率为81.25%;女性调查2896人,沙眼患者2225人,发病率为76.83%。这显然是错误的,应该是患病率。发病率是指平均每1000人口中新发生的病例数。其计算公式为:某病发病率等于某年(期)内所发生的新病例数除以同年(期)平均人口数乘1000‰。例如某地某年年平均人口数为2500人,白喉发病28人,该地白喉年发病率为11.20‰。

2.3 死亡率与病死率 这也是两个容易混淆的指标。某病死亡率是观察人群中某病的死亡频率,一般以10万分率表示;某病病死率是某病患者中因该病而死亡的频率,一般以百分率表示。前者反映人群因该病而死亡的频率,后者反映疾病的预后。部分作者常将某病住院病死率误为某病死亡率。有人在“35例多器官衰竭患者的监护”一文中报道,累及器官数与死亡率:2个器官20例,死亡8例,死亡率为40%;3个器官10例,死亡9例,死亡率为90%;4个器官5例,死亡5例,死亡率为100%。很明显,作者在这里是将住院病死率误作死亡率来讨论。

3 对照设计不合理

“有比较才能有鉴别”,设立对照组是为了科学地鉴别。医学科学研究设立对照尤为重要。一些科研论文科学性不强的主要原因是对照不合理,甚至有的根本不设对照组。临床上不少疾病,都有一定的自愈率,病情自行缓解的现象更为普遍,影响疾病过程的因素就更为复杂,除治疗因素外,精神、环境、休息、营养、气候等都对疾病发生影响。如果不通过严格对照试验,很难作出正确判断。有人为了试验普通感冒疫苗的预防效果,将一批大学生随机分成疫苗注射组和对照组(注射生理盐水)。实验结果表明,疫苗组感冒的发病率减少了73%,而对照组也减少了63%,两组效果相差无几。该试验,如不设对照组,将会得出错误的结论。有的虽有对照组,但缺乏可比性。有人试验一种预防晕船的药,以乘客为对照组,船员为服药组,结论是:“有100%的预防效果”。因为船员中原先就没有人晕船,会晕船的人早已调离工作,所以这两组是不可比的。这样的试验既不能肯定药效,又不能否定药效。如果将乘客分为两组,采取志愿服药的办法,不愿服药的作为对照,也是不可比的,因为会晕船的人愿服药的较多,从来不晕船的人则很少自愿服药,所以采取自愿分组的办法是有偏性的,它会掩盖预防药的效果。另外,两组例数悬殊太大,其误差率也会增大。有的论文样本例数仅几例,很难说明问题。有的实验组上百例,而对照组仅几例,显然是不合理的,应该两组例数相等或相近。一般说来,计数指标每组样本不得少于20~30例,计量指标不得少于5~10例。

4 样本选择不当

样本的选择要符合随机化的原则,这样才能使样本客观地反映总体。在来稿中我们发现不少作者对随机化分组的意义和方法不够了解,有的交待了随机抽样,而没有交待抽样和分配的具体方法;有的虽知道随机化分组的原则,但因怕麻烦,而没有认真执行;有的甚至为了提高论文的刊用率,而冠以随机化的字眼。为解决上述问题,编辑部在审稿时要求作者补充研究对象随机化抽样和分配的具体方法。前者如单纯随机抽样、系统抽样、分层抽样、整群抽样等;后者如完全随机化设计、配对设计、配伍设计、拉丁方设计、序贯设计、正交试验设计等。

5 随机分组不均衡

对照组与试验组必须遵循均衡化的原则,也就是说对照组除了缺少实验处理因素外,其它条件应与实验组基本一致,从而排除非处理因素对结果的影响。如果分组时未注意到对照组与实验组的均衡关系,那么对照组与实验组就会出现差异,使实验的可比性减少,统计学意义下降。有一篇文章研究某药预防流感的效果,在体育学院的200名学生中做为实验组,而将医学院的200名学生做为对照组。这样两组的条件就不均衡。因为两校学生的体质、生活环境、锻炼条件等都不同,所出现的结果就不好判断,难以说明问题。

6 非参数不能用参数统计方法

对计量资料的统计数据经常用t检验或F检验,但也经常出现把非参数计量资料的数据用参数统计方法进行处理。如微量元素(血铅、血锌、尿汞)等数据经常出现偏态分布[3]。当数据呈偏态分布时小样本(n<50)不能用参数统计方法(t检验或F检验),而应该用非参数统计方法(参比差值法或秩和检验)或进行数据转换(倒数或对数)后用参数统计方法[4]。

7 统计表图不规范

在疾病防治中,我们使用大量的统计表图,以阐说疾病发生发展的客观规律,评价防治措施的效果。正确的统计表应该是简单、明了,能够说明各统计量之间关系和差异的三线式统计表。不宜过繁、过多,不能把几种不同性质的统计量罗列到同一表格内。在来稿中,统计表常见的问题是标题过于简略或繁琐,且时间、地点和内容交待不清;或标目过多,文字欠简明,层次不清;线条过多,填写阿拉伯数字没有对位,保留小数的位数不一致等。现在论文中常见的统计图有直条图、构成图、普通线图、半对数线图和直方图等,各种统计图有各自的绘制方法。统计图常见的问题是选择不合适,如有的纵、横座标比例不当,有的标题本应放在图下,而放在图的上方或侧面等。

8 统计方法的选择与使用不正确

选用统计方法之前应首先确定是计数资料还是计量资料。计数资料是先将观察单位按性质或类别进行分组,然后清点各观察单位的个数所得的资料,如根据治疗结果计算出的治愈率、有效率、病死率、阳性率等。计量资料是对每个观察单位用定量方法测定某项指标数值大小所得的资料,如身高、体重、脉搏、血压、浓度、白细胞总数等。计数资料最常用的统计方法为χ2检验或U检验,计量资料最常用的统计方法为t检验(或F检验),但在来稿中时有发生相互混淆。另外,应用t检验的条件是:①当样本含量较小时,要求样本符合或近似正态分布;②当两样本均数比较时,两样本方差相等;医学 全在.线提供③当样本不符合正态分布时,应采用t’检验代替t检验;④当两样本方差不等时,应采用秩和检验或t’检验。有的作者在使用t检验时未考虑到上述因素而盲目使用。对于等级资料(如治愈、显效、好转、无效)要比较疗效只能用非参数检验。
声明:本网所有文章(包括图片和音视频资料)系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(sdtsci@sdtsci.com),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。