小編前幾天閱讀了一篇發(fā)表于今年11月份的文章,名為"Rewriting results sections in the language of evidence",此文章建議摒棄在常規(guī)的零假設(shè)顯著性檢驗中武斷地將P值進(jìn)行二分類(p < 0.05)的做法,而是支持將P值分成多個類別,從而反應(yīng)不同的證據(jù)強(qiáng)弱。
在實踐中,科學(xué)論文是否可以被發(fā)表很大一部分取決于P值是否小于0.05!由于所壓的賭注實在太大,隨之而來的則是撒網(wǎng)式分析、選擇性報道,基于P值選擇模型,以及先得到結(jié)果后產(chǎn)生“假說”等行為,從而造成井噴式的假陽性研究結(jié)果和可重復(fù)性危機(jī)。基于2021年1月份8個生態(tài)學(xué)和進(jìn)化領(lǐng)域研究期刊中的論文,原文作者做了一項綜述調(diào)查,發(fā)現(xiàn)共有92%的論文采用基于P值的二分類法,97.3%的研究使用了“顯著性”語句匯報研究結(jié)果。而其他領(lǐng)域,比如醫(yī)學(xué),情況應(yīng)該也類似。
顯然,如今的現(xiàn)狀是:雜志社以及研究人員都有意無意地將P值是否小于0.05作為衡量某一個科學(xué)發(fā)現(xiàn)是否存在,或者說是否有“統(tǒng)計學(xué)顯著性”的標(biāo)準(zhǔn)。而當(dāng)下的這種風(fēng)氣遭到傳統(tǒng)統(tǒng)計理論家們的強(qiáng)烈抨擊!認(rèn)為如今的狀況是絕對不可接受的,完全將P值的真實含義搞錯了!感慨“禮崩樂壞”,一代不如一代!
但原文作者認(rèn)為,既然現(xiàn)狀如此,只能“兩害相權(quán)取其輕”,將P值從二分類轉(zhuǎn)換成多分類是比較符合實際的做法!論文中作者的建議如下所示:
上述的做法雖違背了P值本身的含義,但是作者辯護(hù)道:一些直接可以評估證據(jù)的指標(biāo),比如貝葉斯因子,與P值存在強(qiáng)相關(guān)性!
作者也給出了一些例子,關(guān)于如何將傳統(tǒng)的統(tǒng)計學(xué)結(jié)果修改成新推薦的方法,如下表所示:
既然過去幾十年由“激進(jìn)的”完美主義者發(fā)動的革命并沒有獲得勝利的果實(比如,取締P值),那就讓“保守的”務(wù)實主義者從現(xiàn)實出發(fā)試一試也未嘗不可!這篇論文注定會產(chǎn)生爭議,讓子彈飛一會,剩下的交給時間。
[1]. Stefanie Muff et al. Rewriting results sections in the language of evidence, Trends in Ecology & Evolution, 2021.11