正文

第7節(jié):內(nèi)在有偏的樣本(5)

統(tǒng)計(jì)數(shù)字會(huì)撒謊 作者:(美)達(dá)萊爾·哈夫


我們知道,除非在某處安裝了泵站,否則一條河流永遠(yuǎn)不可能高于它的源頭。同樣的,根據(jù)樣本得到的結(jié)論不會(huì)比樣本更精確。當(dāng)數(shù)據(jù)經(jīng)過層層統(tǒng)計(jì)處理,最后簡(jiǎn)化為一個(gè)帶小數(shù)點(diǎn)的平均數(shù)時(shí),結(jié)論似乎閃耀著精確的光芒,但只要再仔細(xì)留心整個(gè)抽樣過程,這個(gè)光芒就會(huì)消逝。

為了確保結(jié)論有價(jià)值,根據(jù)抽樣得出的結(jié)論一定要采用具有代表性的樣本,這種樣本才能排除各種誤差。這就是耶魯?shù)氖杖霐?shù)據(jù)失真的原因,它也是你在報(bào)紙和雜志中讀到的許多資料根本不值一提的原因。

一位心理醫(yī)生曾經(jīng)寫道:實(shí)際上每個(gè)人都有點(diǎn)神經(jīng)質(zhì)。暫且不去管這種提法是否破壞了"神經(jīng)質(zhì)"一詞的含義,我們來看看這個(gè)醫(yī)生的樣本,也就是說,他觀察了哪些人才得到了上述結(jié)論?事實(shí)上,他是在對(duì)他的病人進(jìn)行研究后才得到了這個(gè)發(fā)人深省的結(jié)論,這和代表全體人的樣本可差的是十萬八千里。想想看,如果一個(gè)人心理健全,他是永遠(yuǎn)都不會(huì)接受心理醫(yī)生的治療的。

對(duì)你所讀到的東西多思考一下,你將避免接受許多似是而非的結(jié)論。

記住下面這點(diǎn)是有益的:無形的誤差與有形的誤差一樣容易破壞樣本的可信度。也就是說,即使你找不到任何破壞性的誤差來源,但只要有產(chǎn)生誤差的可能性,你就有必要對(duì)結(jié)果保留一定的懷疑。事實(shí)上誤差總是存在,如果你仍舊半信半疑,想想1948年和1952年的美國(guó)總統(tǒng)大選,它們已足夠證明這一點(diǎn)。(1948年美國(guó)選舉時(shí),所有民調(diào)都顯示民主黨的杜威會(huì)獲勝,結(jié)果卻是杜威敗給了共和黨人杜魯門,這是美國(guó)歷史上至今最大的"選舉驚奇"。1952年美國(guó)大選,新聞傳媒普遍看好民主黨競(jìng)選人史蒂文森,最終共和黨候選人艾森豪威爾以絕對(duì)優(yōu)勢(shì)贏得這場(chǎng)選舉。)

更遠(yuǎn)的例子可以追溯到著名的《文學(xué)文摘》(Literary Digest)的慘敗,這件事發(fā)生在1936年。曾經(jīng)準(zhǔn)確預(yù)測(cè)了1932年美國(guó)大選的1000萬個(gè)電話用戶和《文學(xué)文摘》訂戶,他們又對(duì)1936年的大選結(jié)果進(jìn)行了預(yù)測(cè),他們向那個(gè)倒霉的雜志編輯信誓旦旦地保證:蘭登(Landon)將在競(jìng)選中脫穎而出,并且與羅斯福(Roosevelt)的所得票數(shù)之比為370∶161。這樣一個(gè)久經(jīng)考驗(yàn)的調(diào)查群體怎么可能產(chǎn)生誤差呢?但的確有誤差,正如后來許多大學(xué)論文和其他史學(xué)分析人員所發(fā)現(xiàn)的,1936年就有能力購(gòu)買電話和訂閱雜志的人并不能代表所有的選民,至少在經(jīng)濟(jì)上,他們是一個(gè)極特殊的群體,是有偏的,后來證實(shí)他們中的許多人是共和黨的選民。該樣本選擇了蘭登,而全國(guó)選民卻心系羅斯福。


上一章目錄下一章

Copyright ? 讀書網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)