最基本的樣本是隨機(jī)樣本,它是指完全遵循隨機(jī)原則從總體中選出的樣本??傮w即形成樣本的母體。把索引卡片文件夾中每隔10個(gè)的名字抽出來(lái),從許多紙張中任意抽出50張,在皮卡迪利大街譯者注:皮卡迪利大街是英國(guó)倫敦市一條繁華的街道。每遇見(jiàn)的第20個(gè)人作為訪問(wèn)對(duì)象。(但需要注意的是,在最后一個(gè)例子中,總體并不是全世界的人,也不是全體英國(guó)人或者所有舊金山人,而只是當(dāng)時(shí)在皮卡迪利大街上的人。一個(gè)進(jìn)行民意調(diào)查的訪問(wèn)員宣稱(chēng),她選擇在火車(chē)站進(jìn)行調(diào)查的原因是"在那里能遇到所有類(lèi)型的人。"不過(guò),不得不向她指出的是,某些人比如嬰兒母親的代表性并不足。)
隨機(jī)樣本的檢驗(yàn)方法是:總體中的每個(gè)名字或每個(gè)事物是否具有相同的幾率被選進(jìn)樣本?純隨機(jī)樣本是惟一有足夠把握經(jīng)受統(tǒng)計(jì)理論審查的樣本。但它也有不足之處,在很多情況下,獲得這種樣本的難度很大并且十分昂貴,以至于單純考慮成本就會(huì)排除它。分層隨機(jī)抽樣是一個(gè)更經(jīng)濟(jì)的替代品,目前在民意調(diào)查和市場(chǎng)研究等領(lǐng)域中得到了廣泛的應(yīng)用。
為了獲得分層抽樣下的隨機(jī)樣本,你需要將總體按照事先已知的優(yōu)勢(shì)比例劃分出不同的組。這時(shí)你就可能遇上麻煩:關(guān)于分組比例的信息可能并不正確。你對(duì)訪問(wèn)員進(jìn)行指導(dǎo),以確保他們調(diào)查到一定數(shù)量的黑人,按照這樣或那樣的比例調(diào)查屬于不同收入階層的人,調(diào)查一定數(shù)量的農(nóng)民,等等。同時(shí),每一組人中40歲以下和40歲以上的人數(shù)相同。
這聽(tīng)上去很不錯(cuò),但實(shí)際上會(huì)怎樣呢?在黑人還是白人的問(wèn)題上,大部分時(shí)候訪問(wèn)員能夠準(zhǔn)確判斷。但在收入分組時(shí),他會(huì)出很多錯(cuò)。至于農(nóng)民,你如何劃分一個(gè)在城鎮(zhèn)上班又有部分時(shí)間種地的人?即便是歲數(shù)的問(wèn)題也會(huì)引起差錯(cuò),為了確保準(zhǔn)確性,訪問(wèn)員會(huì)挑選那些看上去明顯小于40歲或明顯大于40歲的人進(jìn)行調(diào)查。在這種情況下,由于缺少40歲左右的人而導(dǎo)致樣本有偏。你不可能獲得可靠的結(jié)果!