「倖存者偏差(Survivorship bias)」是一種邏輯陷阱,先介紹一個小有名的故事:
 
二戰期間,對於「戰機應該如何加強防護,才能降低被炮火擊落的機率」的問題美軍開起了調查,一種很簡單的想法:戰機上哪裡彈痕多就表示被擊中的機率大,應該加強防護,而資料裡機翼的彈孔多於機尾的。但統計學家沃德力指出更應該注意彈痕少的部位,因為那些部位被擊中的戰機,樣本只有來自返航的---機尾的彈孔少不是因為不容易中彈,而是中了彈的就回不來了,應該加強機尾。
 
忽略了那些不容易看到的情況進行推論,就容易犯下「倖存者偏差」。

另一個有名的例子是1987年美國獸醫學會發表「貓從六樓以上摔下來反而存活率更高」的論文,開啟了「貓落地」的研究,然後有了假說:「高樓層讓貓有機會調整姿勢」。後來有人指出:「活著的貓才會被送到獸醫院,低樓層沒受傷的也不會送到醫院」。再更多的研究後有了結論----還是要提醒貓奴們不要給主子墜樓的機會!
 
其他比較有名的例子:在火車上調查有沒有買到車票(搞笑?)、成功的人都很努力所以只要努力就能成功(缺少失敗的人的訊息)、老建築都很有風格 (好的才被保留下?)、某某某產品很有用(比較少人會主動去提覺得沒用的產品?)。多留心的話,生活中帶有這種偏差存的例子不勝枚舉。 (也歡迎大家提供生活中倖存者偏差的例子給我。)
 
在統計裡這是抽樣偏差。我們要處理資料一定會先了解資料怎麼來的,或是想怎樣收集資料較好,就是在思考樣本有沒有偏、能不能對想研究的問題做推論。
在現在這樣取得資料太容易的時代,偏差更嚴重,雖然較容易收集到大量的資料,但是這種資料反而容易漏掉某群「不易觀察的個體」,而這些群體其實具備了某種共通點,有偏的樣本在分析下結論時會產生一些限制。有時利用較嚴謹的抽樣方法可以避開偏差,(雖然抽的樣本數較少、但會多花些時間人力金錢去觀察不容易得到的個體);有時這種偏差是不得已的,這時候對於推論的範圍要特別謹慎。

最後,當我們不斷轉述二戰的故事時,警惕倖存者偏差時,又犯了一個錯誤。
 
了解倖存者偏差可以避開錯誤的結論,但無法直接用它找到正確的結論。再回到二戰的故事,它本身也是邏輯上有問題的故事。這個故事顯然是為了介紹倖存者偏差的觀念編寫,而簡化了一個最重要的環節----如果沃德只依靠倖存戰機的彈痕和幸存者偏差的觀念,就得到機尾才應該加強防護的結論,這叫「瞎猜」。除了戰機上彈痕的分布,沃德肯定還有別的研究資料或背景知識加入(例如向飛行員們調查他們害怕哪裡中彈),才能得到這樣的結論。科學上的結論,絕對不是一組數據或是眼見為憑這麼簡單的,但個人很容易放大自己看見的東西來下結論,我們只能時時警剔避開「倖存者偏差」以及「濫用倖存者偏差去下結論」。
 
PS 像這樣的邏輯問題在科學研究裡不分文組理組都超重要,回想在國中高中的階段,沒有特別重視邏輯這一塊,或是網路新聞媒體太多邏輯不嚴謹說法,讓我們思考越來越缺乏邏輯性,希望未來這塊的訓練能被重視。重點是,當你"相信或不相信"一些訊息前,能先去關心背景由來,留心這樣的結論過程是不是在邏輯上有多少瑕疵;另外,很多時候人們只是在抒發一種情懷,不用較真。
 
小結:重要的重複三次:
認識倖存者偏差能避開錯誤的推論,但無法直接用它去下正確的結論。
認識倖存者偏差能避開錯誤的推論,但無法直接用它去下正確的結論。
認識倖存者偏差能避開錯誤的推論,但無法直接用它去下正確的結論。
arrow
arrow
    文章標籤
    統計 邏輯
    全站熱搜
    創作者介紹
    創作者 霹靂貓 的頭像
    霹靂貓

    生活統計二三事

    霹靂貓 發表在 痞客邦 留言(0) 人氣()