第1節(jié) 抽樣設(shè)計(jì)與追蹤情況
本調(diào)查的被訪樣本是通過(guò)分層多階段的抽樣方式,從首都高校學(xué)籍?dāng)?shù)據(jù)庫(kù)隨機(jī)取得的,直接抽取到學(xué)生個(gè)人(具體的抽樣方法見《中國(guó)大學(xué)生成長(zhǎng)報(bào)告2012》)。首輪的調(diào)查中,項(xiàng)目組直接派調(diào)查員到各個(gè)學(xué)校,由學(xué)生工作部門協(xié)作通知被抽中學(xué)生到指定場(chǎng)所,集中現(xiàn)場(chǎng)填寫問(wèn)卷。這在同類調(diào)查研究中是非常難得的。當(dāng)前關(guān)于大學(xué)生的調(diào)查并不少,有的調(diào)查樣本規(guī)模甚至達(dá)到數(shù)十萬(wàn)級(jí)別,但多數(shù)調(diào)查都難以保證樣本的隨機(jī)性,將抽樣名單明確到學(xué)生個(gè)人。一些調(diào)查通過(guò)學(xué)校行政系統(tǒng)或者學(xué)生網(wǎng)絡(luò)系統(tǒng)發(fā)放,對(duì)具體填答對(duì)象和填答過(guò)程缺乏控制。一些調(diào)查限于各方面的原因,采用了設(shè)計(jì)效應(yīng)更大的整群抽樣,表面上看樣本規(guī)模很大,實(shí)際有效的樣本規(guī)模并不大。還有一些調(diào)查直接將問(wèn)卷放到互聯(lián)網(wǎng)上供人自由填寫。這些研究設(shè)計(jì)都相對(duì)缺乏對(duì)于抽樣過(guò)程的實(shí)際控制,既難以明確實(shí)際的抽樣總體,也難以評(píng)估樣本的平均代表性。在這一點(diǎn)上,本調(diào)查有相對(duì)最為完備的抽樣框和詳細(xì)的學(xué)生名單,保證了抽樣過(guò)程的可控性和隨機(jī)性,從而能夠較好地排除各種人為因素和潛在選擇性因素帶來(lái)的偏差。
本調(diào)查采用追蹤調(diào)查(longitudinal survey)設(shè)計(jì),凡初次參與了調(diào)查的學(xué)生都被邀請(qǐng)參與后續(xù)年份的調(diào)查。這種調(diào)查設(shè)計(jì),有利于記錄學(xué)生大學(xué)期間以及畢業(yè)之后的變化,從而在一定程度上超越截面調(diào)查(cross-sectional survey)在因果推論方面的不足。本調(diào)查具體涵蓋的學(xué)校以及各個(gè)學(xué)校的抽樣數(shù)、初訪成功樣本數(shù)、此后歷年的追蹤樣本數(shù)和追訪率情況見表1—1到表1—3。
表1—1 首都大學(xué)生成長(zhǎng)追蹤調(diào)查涵蓋學(xué)校及各年追訪情況(全體樣本)

說(shuō)明:各輪追訪率都是相對(duì)于基期成功調(diào)查樣本的。表1—2、1—3相同。
表1—2 首都大學(xué)生成長(zhǎng)追蹤調(diào)查涵蓋學(xué)校及各年追訪情況(2006級(jí)樣本)


表1—3 首都大學(xué)生成長(zhǎng)追蹤調(diào)查涵蓋學(xué)校及各年追訪情況(2008級(jí)樣本)

本調(diào)查以2009年為基準(zhǔn)年,包括當(dāng)時(shí)的大一(2008級(jí))及大三(2006級(jí))兩個(gè)年級(jí)的代表性樣本,其后在2010年、2011年和2012年進(jìn)行了3次追蹤調(diào)查。對(duì)于2008級(jí)而言,這四年反映的是他們整個(gè)大學(xué)時(shí)代的成長(zhǎng)經(jīng)歷;對(duì)于2006級(jí)而言,四年經(jīng)歷反映了他們從大學(xué)走向社會(huì)的過(guò)程。
可以看到,無(wú)論是基期調(diào)查還是后續(xù)追蹤調(diào)查,本調(diào)查都保證了很高的成功率。這在同類調(diào)查中是非常難得的。當(dāng)然本調(diào)查也存在樣本丟失的情況,在2006級(jí)更為嚴(yán)重(見圖1—1)。因?yàn)樗妮喺{(diào)查都在學(xué)校,2008級(jí)的樣本丟失相對(duì)較少,預(yù)計(jì)因?yàn)楫厴I(yè)后聯(lián)系方式的變化,在2013年第五輪調(diào)查中會(huì)有較大變化。

圖1—1 首都大學(xué)生成長(zhǎng)追蹤調(diào)查歷年追訪率
數(shù)據(jù)分析發(fā)現(xiàn),樣本的丟失(如果第四輪調(diào)查仍被調(diào)查到則不為丟失,即便中間有個(gè)別輪次丟失)存在一定的選擇性。從基本屬性上看,來(lái)自城市,特別是地級(jí)市和直轄市的學(xué)生更有可能退出調(diào)查。對(duì)于2006級(jí)而言,不同性別、民族、專業(yè)、學(xué)校(除郵電大學(xué)外)的學(xué)生丟失的差異不明顯。從包含更多家庭背景及個(gè)人特征變量的探索模型3可以看到,在其他情況相同的情況下,家庭條件較好、在校期間得過(guò)獎(jiǎng)勵(lì)的學(xué)生更有可能保留在樣本中(見表1—4)。樣本的丟失具有一定的“選擇性”。2008級(jí)學(xué)生截止到2012年的丟失比例相對(duì)較小。但是,男生、人文學(xué)科以及中央民族大學(xué)的學(xué)生更有可能缺席后來(lái)的調(diào)查。第一輪調(diào)查收集的家庭背景變量及個(gè)人特征變量對(duì)預(yù)測(cè)該年級(jí)學(xué)生是否會(huì)退出本調(diào)查沒(méi)有明顯的意義。當(dāng)我們將這些家庭背景和個(gè)人屬性更換為2011年也就是他們大三時(shí)的信息時(shí)(模型5)。可以看到,是否退出本追蹤調(diào)查與個(gè)體政治面貌、是否獲得獎(jiǎng)勵(lì)、價(jià)值觀及社團(tuán)活動(dòng)時(shí)間有一定的關(guān)系。參照2006級(jí)的情況,其中有些變量的影響可能是合理的,另一些變量的影響可能是上述信息替換造成的。總體而言,樣本丟失有一定的選擇性,但各模型的偽確定系數(shù)都很?。ㄒ姳?—4),表明各變量對(duì)丟失事件的解釋效果較差,選擇性在上述各個(gè)方面并不特別明顯。
表1—4 首都大學(xué)生成長(zhǎng)追蹤調(diào)查樣本追訪失敗Logistic模型


注:* p<0.05,** p<0.01,*** p<0.001。
說(shuō)明:限于篇幅,截距省略了。模型5中的個(gè)人政治面貌及以下的變量取值為第三輪調(diào)查時(shí)的取值,如果第三輪調(diào)查時(shí)樣本已經(jīng)丟失,則為最后一次調(diào)查時(shí)的回答取值。所謂大學(xué)特殊入學(xué)渠道,指大學(xué)入學(xué)時(shí)享受過(guò)保送、加分、降分或者增投志愿等特殊待遇。
樣本丟失最主要的直接原因是無(wú)法聯(lián)系到受訪者。因?yàn)榇髮W(xué)生的追蹤調(diào)查不同于居民戶的調(diào)查。前者沒(méi)有固定的生活場(chǎng)所,尤其受畢業(yè)事件的影響,我們只有通過(guò)手機(jī)、電話、郵件等方式來(lái)聯(lián)系受訪者。2011年對(duì)2008級(jí)學(xué)生的調(diào)查中,截至當(dāng)年7月18日有162名受訪者未填寫問(wèn)卷,其中61人為無(wú)法聯(lián)系上。同年針對(duì)2006級(jí)的追訪中,截至當(dāng)年10月22日尚未填答問(wèn)卷的408名受訪者中,聯(lián)系不上的有299人,聯(lián)系上但因?yàn)楦鞣N原因未填的92人,明確表示拒絕的只有17人。
聯(lián)系方式的改變是造成這種問(wèn)題的主要原因,尤其是畢業(yè)前后,聯(lián)系方式的變化更普遍。畢業(yè)后一年內(nèi)能夠聯(lián)系上的2006級(jí)學(xué)生手機(jī)聯(lián)系方式發(fā)生變化的比例將近1/3。那些未聯(lián)系上因而缺席當(dāng)年調(diào)查的受訪者,他們中多數(shù)電話無(wú)法接通。2008級(jí)學(xué)生在校期間,每年更換手機(jī)聯(lián)系方式的比例也超過(guò)10%。郵件聯(lián)系方式的改變更為頻繁,2010—2011年有超過(guò)30%的學(xué)生更改主要郵箱聯(lián)系方式。網(wǎng)易163和126、騰訊QQ、新浪和Gmail是使用率排在前五位的郵箱,其中網(wǎng)易郵箱相對(duì)更為穩(wěn)定,在大學(xué)生中的市場(chǎng)占有率也比較穩(wěn)定。
除了聯(lián)系方式的改變會(huì)影響到與受訪者的聯(lián)系外,短信和郵件的到達(dá)率也是影響追蹤聯(lián)系的重要原因。隨著反垃圾郵件和垃圾短信力度的加大,追蹤調(diào)查中的集中郵件通知和短信通知很容易被當(dāng)作垃圾信息遭到屏蔽。這在最近輪次的調(diào)查中表現(xiàn)得特別明顯。
表1—5 首都大學(xué)生成長(zhǎng)追蹤調(diào)查受訪者手機(jī)聯(lián)系方式變更比例

在抽樣與追蹤介紹部分的最后,需要就一個(gè)問(wèn)題做一些說(shuō)明:僅僅使用北京地區(qū)的資料能夠代表中國(guó)大學(xué)畢業(yè)生的普遍狀況嗎?關(guān)于這個(gè)問(wèn)題,第一,我們認(rèn)為利用北京市大學(xué)生樣本洞悉大學(xué)生的發(fā)展?fàn)顩r是有意義的。第二,我們也在努力將中國(guó)教育追蹤調(diào)查擴(kuò)展到全國(guó)及各個(gè)教育階段。而這已經(jīng)不完全是一個(gè)研究設(shè)計(jì)問(wèn)題。在科研資源有限以及當(dāng)前高等教育投資與招生制度背景下,使用任一局部地區(qū)(甚至多個(gè)具有代表性的局部地區(qū))的大學(xué)生樣本討論大學(xué)生問(wèn)題,都面臨著學(xué)生來(lái)源的選擇性問(wèn)題。高等教育資源的地區(qū)差異越大,就業(yè)制度的地區(qū)差異越大,地區(qū)發(fā)展越不均衡,一個(gè)地區(qū)的大學(xué)生的在校成長(zhǎng)與畢業(yè)后的發(fā)展就越具有特殊意義。通過(guò)抽樣調(diào)查概括出全國(guó)平均面貌,要么容易流于膚淺,要么需要海量的投入。我們相信,基于不同區(qū)域的比較同樣能夠?yàn)檎J(rèn)識(shí)全國(guó)的面貌提供豐富的支持。這里我們至少呈現(xiàn)了一個(gè)地區(qū)的面貌。我們的能力是有限的,但抱負(fù)是遠(yuǎn)大的。
而且,對(duì)于北京這樣一個(gè)特殊的教育空間的研究,即便完全不能將結(jié)論推論到其他地區(qū),也因?yàn)槠湔紊系拿舾行砸约霸诟叩冉逃械奶厥獾匚欢哂谐浞值难芯績(jī)r(jià)值。北京作為中國(guó)的首都,集政治、經(jīng)濟(jì)、文化中心為一體,是我國(guó)高等教育資源最為集中的地區(qū)。這里集中了全國(guó)39所985高校中的8所,112所211高校中的26所,占到全國(guó)同類高??倲?shù)的20%以上。這里每年的研究生招生人數(shù)占全國(guó)招生人數(shù)的14.8%。每年畢業(yè)的高校學(xué)生達(dá)到將近16萬(wàn),且其中2/3為外地生源,而畢業(yè)找工作的學(xué)生中有80%首選在北京找工作。我們承認(rèn)在北京上大學(xué)的學(xué)生都是選擇的結(jié)果,而北京的學(xué)生畢業(yè)后的出路也必然具有獨(dú)特性。但這種情況在哪里不是一樣呢?我國(guó)高校集中的大城市(如上海、西安、武漢等等)普遍面臨類似的境況,只不過(guò)程度不同罷了。在這個(gè)意義上講,利用北京高校學(xué)生的數(shù)據(jù)來(lái)研究大學(xué)生不僅具有典型性,也具有代表性。而且北京不僅有中國(guó)最好的高校,也有相對(duì)差的學(xué)校,學(xué)校之間的層次是非常明顯的,這對(duì)于研究不同高校及其他不同類別的學(xué)生的發(fā)展都具有重要意義。