南医大公共卫生学院陈峰,魏永越
生物医学研究中假阳性过高,不是P的过错。
对于阳性结果无法被重现这一问题,医学研究者们并不陌生。Begley和Ellis发表于Nature的评论(comment)中提及:对2001-2011年间发表于权威期刊上的53篇肿瘤生物学领域具有里程碑意义的研究结果进行验证,只有6篇研究的结论能够被重现!由此,部分学者认为0.05“过于宽松”,是导致可重复性低下的主要原由之一。事实上,90年前P值诞生以来,就曾经被比作为“讨厌的蚊子”、“皇帝的新衣”,甚至“不育的风流才子”!这是对假设检验P值和检验水准α彻头彻尾的误解。
通俗来说,统计学告诉大家的任何结论都有可能是错的。在正常情况下,统计学检验得到阳性结果时,犯假阳性的可能性不超过原先设定的水准(如5%)。而真实世界的生物学等医学研究中,假阳性的比例远远超出期望的5%!问题可能是研究设计不够科学,实验执行不够规范,数据质量不可靠,分析方法不合适,等。本文通过Letter表达了作者的两个观点:1)仅通过降低检验水准α,不但改变不了现状,反而会造成更为严重的后果;2)要从规范实验设计、严格流程监管、开展验证试验,创新统计方法等源头上解决这一问题。
时间:2018年9月
刊物:JAMA
标题:Lowering the P Value Threshold.pdf