第一章 內(nèi)在有偏的樣本
有一個裝著紅、白兩色豆子的桶,如果你想要準(zhǔn)確知道這個桶中兩種豆子的數(shù)量,你惟一能做的只有一顆一顆地數(shù)豆子。
用一種更簡單的方法也可以揣測紅豆的數(shù)量:抓一把豆子,假定手中紅豆的比例與桶中紅豆的比例相同,只要數(shù)一數(shù)手中的豆子即可。如果你的樣本足夠大,并且選擇方法正確,在大多數(shù)情況下它能夠很好地代表整體。但是,如果以上兩個條件不滿足,這樣的樣本比一個臆想好不到哪兒去,除了能夠營造科學(xué)精確的假象之外,其他則根本不值一提。不幸的是,我們所看到的,或者我們自以為了解的許多事物,往往都是根據(jù)類似樣本所得出的結(jié)論,這種樣本可能變得有偏,由于選擇方式的不合理或者容量過小,抑或兩種情況同時存在。
通過一個極端的例子可以馬上看到如何形成有偏的樣本。假設(shè)你向同胞發(fā)放問卷,問卷中包含這樣一個問題:"你樂意回答調(diào)查問卷嗎?"整理所有的答案,你很有可能得到下面的結(jié)論:"一個選自總體、典型的橫截面"中,壓倒多數(shù)的人選擇了"樂意"。為了具有說服力,你還可以詳細(xì)列出這個比例,直至最后一位小數(shù)。事實上,大多數(shù)持否定意見的人,已經(jīng)隨手將你的問卷丟進(jìn)最近的紙簍中,從樣本中自動除名了。哪怕最初的樣本中,10個里面有9個會當(dāng)這種"投手",在宣布你的結(jié)果時,你仍然會遵從慣例,忽略他們。
現(xiàn)實生活中,樣本會按照上述方式變得有偏嗎?相信我,一定會。
不久前,報紙和新聞雜志上報道:近10年來美國大約有400萬名天主教徒變成了基督教徒。資料來源于由丹尼爾·A. 波林(Daniel A. Poling)牧師主導(dǎo)的調(diào)查,丹尼爾·A·波林是教派組織《基督教先驅(qū)報》(Christian Herald)的編輯。《時代》(Time)雜志描述了整個故事的梗概:
"通過對全美基督教牧師的橫截面展開調(diào)查,《先驅(qū)報》得到了調(diào)查結(jié)果。調(diào)查共發(fā)出25000份問卷,其中2219名牧師反饋回了問卷,回收的問卷顯示:在過去10年里共有51361名原羅馬天主教徒變成了基督教徒。根據(jù)樣本推算,波林得到了全國范圍的估計:近10年來全美共有4144366名天主教徒改變信仰,變成了基督教徒。主教威爾·奧斯勒(Will Oursler)寫道:'即便考慮到誤差,全美范圍內(nèi)這一數(shù)據(jù)也不可能少于200萬或者300萬,而且很有可能接近500萬。'"
雖然《時代》沒能指出真相的關(guān)鍵之處,但是它卻使我們了解到被調(diào)查的牧師中超過90%的人沒有回答,這已經(jīng)值得我們向它鞠躬表示敬意了。為了徹底破壞調(diào)查結(jié)果的可信度,我們只需要指出:這個"500萬"是不可靠的,因為調(diào)查中有高達(dá)90%的牧師沒有發(fā)表看法,或許他們中大多數(shù)都早已將調(diào)查問卷投進(jìn)了紙簍。
根據(jù)以上判斷,我們利用管轄范圍內(nèi)所有牧師人數(shù),即181000人--該數(shù)據(jù)就是波林博士計算時所采用的數(shù)據(jù)--進(jìn)行自己的推算。由于從181000名牧師中抽取了25000人接受調(diào)查,得到了改變信仰的教徒為51361人,如果調(diào)查全部牧師,轉(zhuǎn)變信仰的總?cè)藬?shù)應(yīng)該約為370000人。