医学统计中的常见误区有哪些

时间:2020-11-03 11:59:19 统计师 我要投稿

医学统计中的常见误区有哪些

  医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。下面是yjbys小编为大家带来的关于医学统计中的常见误区的知识,欢迎阅读。

  一,真正差异和统计学差异

  常常有人和我说: P值越小,试验结果的差异就越大!而且还有依据 [P < 0.05 是有显著性差异; P < 0.01 是有极显著性差异]。

  其实,这些人忽略了 n 这个样本数的作用,n 的大小会影响 P 值。但更应该澄清一下的是: P 值代表的是统计学差异,并不是真正的差异!真正的差异只能靠平均值或者频度的比较才能得到。

  二,卡方检验的局限性

  我们知道各组之间的计数资料的比较,要用卡方检验,但有些情况是不行的!!!

  1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

  2,当组与组之间有不同的背景,而这些背景因子还可能会影响到组与组之间结果差异,这是就必须要用 Mantel-Haenszel 检验!

  这第2条可能大家不要理解,那我就举两个例子:

  1) 关于男性和女性对于不同颜色的喜好的统计学分析

  但这里应该注意到年龄可能会对这个分析造成影响,这就要用Mantel-Haenszel 检验了。

  ***红色 蓝色 黄色

  男性 5 7 8

  女性 15 10 6

  可以按大人和小孩(比如我们以15岁为分界)分层,在SPSS中要把这个因素放到[行] [列]下边的[层化]一栏里,并在统计指标选项里,选 Cochran和Mantel-Haenszel的统计量选项,这样出来的结果就可靠了!

  2)两种治疗(A和B)效果的评价分析:

  *****A法 B法

  生存 41 54

  死亡 47 31

  用卡方检验 X2=4.35; P < 0.05

  但是,病人的临床分期将影响着分析结果:

  ********生存**************死亡

  ——————————***——————————

  ————A****B————————A*****B———

  1期-----18-----21--------------------0--------0-------

  2期-----23-----33-------------------13------- 8-------

  3期------0------0--------------------34-------23-------

  再用Mantel-Haenszel检验: X2=3.65; P > 0.05

  说明实际上A法和B法两组的统计学差异,是这个不同的分期造成的!!!

  1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

  讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。

  当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。

  三,t 检验的局限性

  1,我们经常用 t 检验来判别两组病人血清中某种标记物水平上的差异,但这里要注意,有一些血清标记物的水平是不能用 t 检验的!

  比如: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

  这时应该用 非参数性检验---即 Mann-Whitney U test (Wilcoxon U test)。

  2,关于用不用配对t 检验,我个人认为当同一组样本在不同时点,不同处理方式的比较上,应该用配对t 检验。

  四,ANOVA 检验的局限性

  1,在2组以上计量资料样本比较时,ANOVA 检验非常常用。但这个检验只是说明了一个趋势的比较结果,并不能说明真正的统计学差异,真正的`差异还要通过每两个点的直接比较,也就是说应该在ANOVA 检验后,还必须做两两比较或多重比较,这样才能从全貌上反映出统计的全部结果。

  2,既然方差分析得到差别有显著性意义的结论后,还需进行两两比较,有人认为还不如一开始就进行多次t检验更方便,其实,这种认识是不妥当的。t检验用于ANOVA的两两比较将增大第一类错误,产生假阳性,因此要采用特定的方法,在SPSS的one-way ANOVA或General linear models中操作时,Post Hoc(多重比较)对话框内有多种方法可供选择,象两两比较一般用SNK法,而多个试验组和一个对照组的比较则多用dunnett检验。

  3,我们经常用 ANOVA 检验来判别几组病人血清中某种标记物水平上的差异,但这里要注意,与 t 检验一样,有一些血清标记物的水平是不能用 ANOVA 检验的!

  如上所说的: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

  这时应该用 非参数性检验---即 Kruskal-Wallis rank test 。

  五,单元线性相关分析

  有时我们常常只注意到了 P 值大小,可最重要的是 r 值!

  样本数 n 对 P 值 结果的影响很大,容易让我们产生错觉,其实,相关的存在与否的评价是与 r 值最直接相关的,如下:

  当 P 值小于0.05时: r 值

  0.00--0.20 几乎没有相关关系

  0.20--0.40 弱的相关关系

  0.40--0.70 有相关关系

  0.70--0.90 强相关关系

  0.90--1.00 极强相关关系

  P 值只是证明这个相关在统计学上是否成立!!!

  1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

  讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。

  当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。

  不是说样本小于5

  而是说:在R×C表中

  理论频数不应该小于1,并且1≤T≤5的格子数不应该超过总格子数的1/5,若出现上述情况可以通过以下方法:

  a.增加样本含量,使理论频数增大;

  b.根据专业知识,删除理论频数太小的行和列;或者将理论频数太小的行或列与性质相近的邻行和邻近列合并。

  c.改用双向无序的R×C表的fishher确切概率法。

  还有一点

  四格表卡方检验的适应指标:(T为理论频数)

  1。n≥40,且T≥5时用卡方检验基本公式。但是当p≈α应该用fisher确切概率法

  2。n≥40,但是1≤T≤5时,用四格表校正公式

  3。n<40,或者T<1时,用fisher四格表确切概率法

  4。四格表卡方检验的连续性校正仅仅用于自由度为1的四格表尤其是n较小时。

  补充几点:

  1. 关于P值:P值的大小并不是各组差异的大小,而是统计学差异显著性的大小。P值越小,说明得出各组没有差异的概率越小,越有理由说明各组存在差异(可以说,P值的大小反映了做出统计结论的“理由”的大小,而不是被比较的各组的实际差异的大小,得出有意义的结论后,其差异的大小可直接通过各组的均数或率进行比较)。

  2. 关于t检验和方差分析:katalyster兄上面提到的t检验及方差分析在某些时候不适用,实际上就是每种方法都有其应用条件,不服从正态分布当然不能用。对这样的资料首先可考虑变量变换(如抗体滴度等资料,为指数或幂次的关系,可用对数转换),如变换后,服从正态分布,可用上述方法;若还不符合,则考虑非参数检验。

  3. 关于相关分析:两个变量间是否存在相关关系,要看P值,而不是r值,r值用来说明相关关系的大小。当P<0.05,才能讲两变量间存在相关关系,再看r值,r值越大,相关关系越强,反之越小;否则,P>0.05,不能讲两变量间存在相关关系,r值毫无意义。

  感谢kushuya, xiaoxiongzjh两位专家的补充和指正!之所以开这个专题,是真心想让初学者从这些<误区>中走出来!

  六,Logistic regression 分析

  在判断某因子对疾病的危险度时常用的方法。

  1,假设要判断某因子对疾病的危险度(OR),要了解这个OR是一个相对危险度,即是有某因子存在和没有某因子存在之间比较的OR值。

  2,OR 和 RR 不一样,OR是在Logistic regression model中使用,RR是在Cox proportional hazard model中使用。

  3,假设要判断某因子对疾病的危险度,要在多变量Logistic regression model中校正一些混扰因素,如常见的年龄,性别,吸烟等等,并最后得出这个 Adjusted OR。但并不是说有了这些校正,我们就可以在实验设计上就不考虑这些混扰因素,相反,必须在实验设计上就把这些混扰因素在实验组和对照组配平,光靠在多变量Logistic regression model中校正是不可靠的。

  其它方法---生存分析 (Kaplan-Meier法+ Logrank法):

  我们有时在临床研究只注意到了用这种方法分析与生存相关的研究,其实,在疾病复发上也常用这种方法!前者是以生---死为判别,后者则以复发---不复发为判别。

【医学统计中的常见误区有哪些】相关文章:

1.常见的统计误区有哪些

2.喝咖啡的常见误区有哪些

3.瑜伽练习的常见误区有哪些

4.学习街舞的常见误区有哪些?

5.SAT写作常见误区有哪些

6.初学声乐常见误区有哪些

7.常见中药进补误区有哪些

8.去西班牙留学常见的误区有哪些