第3節(jié) 調(diào)查執(zhí)行與數(shù)據(jù)清理情況
這一節(jié)主要介紹2011年和2012年追訪調(diào)查的執(zhí)行情況,包括具體的執(zhí)行方式、執(zhí)行過程,以及禮品激勵(lì)的設(shè)置、訪問員報(bào)酬的安排、垃圾信息治理政策變化對于聯(lián)系通知的影響等等。
2011年和2012年本調(diào)查采用網(wǎng)絡(luò)填答的方式完成。之所以采用這種調(diào)查方式,原因在于:第一,隨著2006級本科生的畢業(yè),要在世界范圍內(nèi)追訪這些學(xué)生,成本陡然增加。實(shí)現(xiàn)全面的實(shí)地追訪已經(jīng)不可能。第二,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,當(dāng)前我國大學(xué)生的網(wǎng)絡(luò)可及性非常高。2010年的調(diào)查顯示,95%的受訪者有自己的個(gè)人電腦。在2011年的調(diào)查中,如果受訪者表示上網(wǎng)不方便,項(xiàng)目組可付其10元上網(wǎng)費(fèi),請其到附近上網(wǎng)點(diǎn)上網(wǎng)。最終只有1位本科生表示在老家上網(wǎng)不方便,項(xiàng)目組額外給付了10元上網(wǎng)費(fèi)。第三,相對于項(xiàng)目組派人登門進(jìn)行面對面的問卷填寫,說服受訪者到近便的上網(wǎng)點(diǎn)進(jìn)行填答更為方便,而且只要不存在代答的情況,由于網(wǎng)絡(luò)問卷自動(dòng)化的邏輯檢查與必選設(shè)置,數(shù)據(jù)質(zhì)量甚至有更好的保障。因此保證被訪者自己填寫問卷,并且能夠與以往收集的數(shù)據(jù)鏈接起來非常重要。在調(diào)查邀請中,我們通過短信或郵件告知受訪者一個(gè)唯一的6位或7位字符串密碼,憑借該密碼登錄網(wǎng)頁并完成問卷,問卷一旦完成密碼失效。當(dāng)然,具體填答過程中,受訪者會(huì)不會(huì)告訴他人密碼代為填答很難控制,就像實(shí)地填答過程中,一一核對受訪者身份的成本也是很高的。后期的數(shù)據(jù)檢驗(yàn)發(fā)現(xiàn),個(gè)別案例的回答確實(shí)存在前后兩輪相差較大,可被懷疑存在代答的情況。但總體而言,數(shù)據(jù)的一致性還是非常高的。
具體而言,調(diào)查過程可以分為“邀訪”和“勸訪”兩個(gè)階段。第一個(gè)階段是邀訪,即通過電子郵件或手機(jī)短信等方式,一般性地集中通知和邀請被訪者憑借對應(yīng)密碼上網(wǎng)填答問卷,被訪者自愿填答。第二階段,對邀訪不成功的被訪者,由訪問員針對性地通過電話、短信、郵件聯(lián)系,說服其上網(wǎng)填答,是為“勸訪”。
以2011年2008級學(xué)生的訪問情況為例:2011年5月27日—6月10日為集中邀訪階段。在被訪者主動(dòng)自愿的情況下,共完成應(yīng)訪案例的67%。經(jīng)過前兩次調(diào)查的培養(yǎng),被訪者對CEPS的認(rèn)同度是比較高的。6月10日—7月18日為勸訪階段。項(xiàng)目組將尚未完成問卷的受訪者名單分配給6位訪問員,由他們分頭與受訪者聯(lián)系,進(jìn)行勸訪,共完成應(yīng)訪案例的26%。整個(gè)調(diào)查從5月27日至7月30日,歷時(shí)65天,共有2311人完整地填答問卷,另有31人部分地填答問卷。按填答完整者計(jì)算,當(dāng)年針對在校本科生的追訪完成2009年初訪名單的93.4%;2010年追訪成功的案例中有95.1%被再次追訪成功,2010年追訪未成功的案例中,重新找回59%(69個(gè))。
2011年和2012年的調(diào)查中,受訪者接到通知后,可以自己選擇填答問卷的時(shí)間,時(shí)間的安排更為自由。因此,在訪問時(shí)長上,這兩輪調(diào)查更長。2011年一半學(xué)生用時(shí)短于30分鐘,除去用時(shí)超過300分鐘的案例,平均用時(shí)為38分鐘左右。之所以出現(xiàn)10%的案例用時(shí)超過5個(gè)小時(shí),是因?yàn)樘畲鹫呖梢噪S時(shí)中斷填寫,并在未來接著填寫,系統(tǒng)將記錄最開始填寫的時(shí)間與提交問卷的時(shí)間。這些案例的實(shí)際填寫時(shí)長并不是真這么長。2012年因?yàn)樵黾拥膯栴}相對較多,調(diào)查時(shí)長明顯增加了,并且分多次完成問卷的學(xué)生更多了(從開始到提交歷時(shí)5小時(shí)以上的案例達(dá)到了15%)(見圖1—2)。

圖1—2 四輪調(diào)查問卷填答用時(shí)分布情況
四輪調(diào)查中受訪者提交問卷的日期如圖1—3所示。各輪調(diào)查開始的時(shí)間有一定的差異。第一輪調(diào)查在5月底開始,7月份學(xué)校放暑假之前結(jié)束。第二輪調(diào)查同樣在暑假開始前結(jié)束,依據(jù)第一輪調(diào)查經(jīng)驗(yàn),開始時(shí)間略早。第三輪調(diào)查,針對2008級學(xué)生的主要在當(dāng)年的6月份完成,而2006級學(xué)生因?yàn)橐呀?jīng)畢業(yè),主要在8、9月份完成,10月份有個(gè)別收尾案例。2012年的調(diào)查同樣分為兩部分,針對在校生,為了避免因?yàn)楫厴I(yè)聯(lián)系方式改變聯(lián)系不上,主要在6、7月份完成,時(shí)間較第一輪和第二輪有所延長。而針對已經(jīng)工作的學(xué)生,主要在10月底、12月完成。

圖1—3 四輪調(diào)查問卷提交日期分布情況
受訪者一天中提交問卷的時(shí)點(diǎn)如圖1—4所示。在頭兩輪中,調(diào)查基本是在中午開始的,因?yàn)榇髮W(xué)生受訪者中午空閑時(shí)間相對較多。2011年和2012年,受訪者主要在上午10點(diǎn)以后開始提交問卷,中午有一個(gè)小高峰,下午相對比較均勻,晚上8點(diǎn)以后到深夜提交問卷的人較多。這與相當(dāng)一部分的通知選擇在下午6點(diǎn)左右發(fā)出有關(guān),在校生有熬夜的習(xí)慣則是更為重要的原因。

圖1—4 四輪調(diào)查問卷提交時(shí)點(diǎn)分布情況
如果以提交日期為周幾來考察的話,第一輪和第二輪調(diào)查的高峰點(diǎn)在周三到周五,周一到周二相對較少(見圖1—5)。采用網(wǎng)絡(luò)問卷之后,每周各天的完成量比較均勻,周五相對最少,而周六相對更多。這除了與通知發(fā)送時(shí)間相關(guān)外,可能與周五通常是學(xué)生和工作人交友活動(dòng)的日子,空閑時(shí)間較少,周六準(zhǔn)備休息放松的人較多有一定的關(guān)系。

圖1—5 四輪調(diào)查中一周各天提交問卷人數(shù)占比
在數(shù)據(jù)收集過程中我們給受訪者提供了必要的激勵(lì)。第一、二輪的調(diào)查中我們在調(diào)查現(xiàn)場給予受訪者20元的現(xiàn)金補(bǔ)貼。而在第三、四輪調(diào)查中我們通過空中充值方式給受訪者的手機(jī)或其提供的親友手機(jī)號碼充值,充值金額為30元到100元不等,對于畢業(yè)參加工作的學(xué)生的補(bǔ)助更高,少數(shù)較晚仍未提交問卷的受訪者我們給予了更高的激勵(lì)?;ヂ?lián)網(wǎng)的發(fā)展和支付方式的多樣化為本項(xiàng)目的推進(jìn)提供了極大的方便。在第三輪調(diào)查結(jié)束之后,2011年末項(xiàng)目組進(jìn)行了一次樣本維護(hù),給愿意接受的學(xué)生郵寄了中心定制的實(shí)物紀(jì)念品。而2012年調(diào)查結(jié)束后,我們對參加調(diào)查的2008級被訪者進(jìn)行了抽獎(jiǎng),共有30位學(xué)生獲得500元或1000元不等的現(xiàn)金獎(jiǎng)勵(lì)。相對于現(xiàn)金激勵(lì),實(shí)物激勵(lì)的影響更為分化,一件禮物,有的人非常喜歡,而在另一些人那里則可能帶來負(fù)面的影響??傮w而言,紀(jì)念品的質(zhì)量非常關(guān)鍵,一定要慎重選擇。已經(jīng)畢業(yè)學(xué)生對補(bǔ)貼的重視程度也更為分化,有部分學(xué)生主動(dòng)放棄補(bǔ)助,并愿意將補(bǔ)助捐獻(xiàn)給其他機(jī)構(gòu)和組織。總體上看,隨著物價(jià)水平的提高,大家對于補(bǔ)助水平的期望也有所提高。
數(shù)據(jù)收集的過程也是首都大學(xué)生成長追蹤調(diào)查逐步發(fā)展和完善調(diào)查管理系統(tǒng)的過程。通過網(wǎng)絡(luò)來收集信息,需要有問卷系統(tǒng)、通知系統(tǒng)、催訪記錄系統(tǒng)、報(bào)酬發(fā)放系統(tǒng)、進(jìn)度控制系統(tǒng)等多個(gè)系統(tǒng)和平臺的配套和合作。在Limesurvey(http://www.limesurvey.org)基礎(chǔ)上,我們發(fā)展出催訪過程記錄系統(tǒng),對訪問員與受訪者溝通聯(lián)系的過程進(jìn)行記錄,從而更好地進(jìn)行進(jìn)度和質(zhì)量的控制。此外,通知平臺也與問卷調(diào)查系統(tǒng)日益整合。這些都需要信息及網(wǎng)絡(luò)技術(shù)人才的支持。在互聯(lián)網(wǎng)經(jīng)濟(jì)快速發(fā)展,市場薪資日漸高漲的情況下,高校如何加大投入,并進(jìn)行科研體制調(diào)整,通過何種形式購買此類專業(yè)技術(shù)支持或引進(jìn)相關(guān)人才并發(fā)揮其長處是值得研究的問題。社會(huì)科學(xué)研究數(shù)據(jù)收集的專業(yè)化和現(xiàn)代化是近年來中國高校社科發(fā)展的重要潮流。相關(guān)高校和研究院所都成立了專業(yè)的調(diào)查機(jī)構(gòu)與數(shù)據(jù)中心。如何立足于實(shí)際情況,找準(zhǔn)各自的定位和最優(yōu)發(fā)展路徑,并與兄弟單位協(xié)作多贏是需要多方共同努力的事情。調(diào)查技術(shù)的信息化就是合作的重要方面。
數(shù)據(jù)收集好之外,數(shù)據(jù)的清理工作可以極大地提高數(shù)據(jù)的可用性。在第一、二輪數(shù)據(jù)收集錄入后,我們通過各種信息進(jìn)行了案例的匹配。自動(dòng)匹配不成功的案例通過查驗(yàn)掃描版問卷的方式進(jìn)行確定。后兩輪調(diào)查數(shù)據(jù)則通過事先生成的密碼數(shù)據(jù)表進(jìn)行自動(dòng)匹配。數(shù)據(jù)的清理使用Stata軟件進(jìn)行,并做了詳細(xì)的文檔說明。目前已經(jīng)形成了四輪調(diào)查的長數(shù)據(jù)(long data)格式(見表1—6):
表1—6 首都大學(xué)生成長追蹤調(diào)查數(shù)據(jù)集形式

所有在多輪調(diào)查中收集的變量統(tǒng)一了變量名,并在變量標(biāo)簽中標(biāo)示了出現(xiàn)的輪次。提供給研究者使用的數(shù)據(jù)中,我們刪除了所有涉及個(gè)人隱私或可能定位個(gè)人的信息,如工作單位名稱、海外大學(xué)名稱、過高的家庭收入,當(dāng)然更包括個(gè)人的聯(lián)系方式、家庭住址、具體的學(xué)生干部職位等等。數(shù)據(jù)清理的具體規(guī)則和過程,我們會(huì)在適當(dāng)?shù)臅r(shí)候公布相關(guān)的文檔。有關(guān)首都大學(xué)生成長追蹤調(diào)查項(xiàng)目的更多信息,可以瀏覽http://www.chinaeps.org。