小編前幾天閱讀了一篇發(fā)表于今年11月份的文章,名為"Rewriting results sections in the language of evidence",此文章建議摒棄在常規(guī)的零假設(shè)顯著性檢驗(yàn)中武斷地將P值進(jìn)行二分類(p < 0.05)的做法,而是支持將P值分成多個(gè)類別,從而反應(yīng)不同的證據(jù)強(qiáng)弱。
P值從被提出至今,約有百年歷史,一直爭(zhēng)議不斷。在實(shí)踐中,科學(xué)論文是否可以被發(fā)表很大一部分取決于P值是否小于0.05!由于所壓的賭注實(shí)在太大,隨之而來(lái)的則是撒網(wǎng)式分析、選擇性報(bào)道,基于P值選擇模型,以及先得到結(jié)果后產(chǎn)生“假說(shuō)”等行為,從而造成井噴式的假陽(yáng)性研究結(jié)果和可重復(fù)性危機(jī)。基于2021年1月份8個(gè)生態(tài)學(xué)和進(jìn)化領(lǐng)域研究期刊中的論文,原文作者做了一項(xiàng)綜述調(diào)查,發(fā)現(xiàn)共有92%的論文采用基于P值的二分類法,97.3%的研究使用了“顯著性”語(yǔ)句匯報(bào)研究結(jié)果。而其他領(lǐng)域,比如醫(yī)學(xué),情況應(yīng)該也類似。
顯然,如今的現(xiàn)狀是:雜志社以及研究人員都有意無(wú)意地將P值是否小于0.05作為衡量某一個(gè)科學(xué)發(fā)現(xiàn)是否存在,或者說(shuō)是否有“統(tǒng)計(jì)學(xué)顯著性”的標(biāo)準(zhǔn)。而當(dāng)下的這種風(fēng)氣遭到傳統(tǒng)統(tǒng)計(jì)理論家們的強(qiáng)烈抨擊!認(rèn)為如今的狀況是絕對(duì)不可接受的,完全將P值的真實(shí)含義搞錯(cuò)了!感慨“禮崩樂(lè)壞”,一代不如一代!
但原文作者認(rèn)為,既然現(xiàn)狀如此,只能“兩害相權(quán)取其輕”,將P值從二分類轉(zhuǎn)換成多分類是比較符合實(shí)際的做法!論文中作者的建議如下所示:
來(lái)源:文獻(xiàn)[1]的Figure 1上述的做法雖違背了P值本身的含義,但是作者辯護(hù)道:一些直接可以評(píng)估證據(jù)的指標(biāo),比如貝葉斯因子,與P值存在強(qiáng)相關(guān)性!
作者也給出了一些例子,關(guān)于如何將傳統(tǒng)的統(tǒng)計(jì)學(xué)結(jié)果修改成新推薦的方法,如下表所示:
來(lái)源:文獻(xiàn)[1]的Table 1
來(lái)源:文獻(xiàn)[1]的Table 2既然過(guò)去幾十年由“激進(jìn)的”完美主義者發(fā)動(dòng)的革命并沒(méi)有獲得勝利的果實(shí)(比如,取締P值),那就讓“保守的”務(wù)實(shí)主義者從現(xiàn)實(shí)出發(fā)試一試也未嘗不可!這篇論文注定會(huì)產(chǎn)生爭(zhēng)議,讓子彈飛一會(huì),剩下的交給時(shí)間。
[1]. Stefanie Muff et al. Rewriting results sections in the language of evidence, Trends in Ecology & Evolution, 2021.11