關(guān)于數(shù)據(jù)資源
本書的故事情節(jié)及案例都是基于Hitwise 競爭情報服務(wù)公司(Hitwise Competitive Intelligence Service )的數(shù)據(jù)資源撰寫而成。如果沒有特別說明,書中的分析、推理都是基于美國樣本而展開的(其他數(shù)據(jù)來源還包括英國、中國香港、新加坡、澳大利亞和新西蘭)。這一樣本由1 000 萬余名美國網(wǎng)民及其日常網(wǎng)絡(luò)行為構(gòu)成,樣本的采集方法有兩種。其中主要的方法是基于與全美國互聯(lián)網(wǎng)服務(wù)提供商所達成的協(xié)議,對7 500 多萬的網(wǎng)絡(luò)用戶進行匿名處理,
并整合統(tǒng)計其使用數(shù)據(jù)。數(shù)據(jù)來源于眾多區(qū)域互聯(lián)網(wǎng)服務(wù)提供商?;ヂ?lián)網(wǎng)服務(wù)提供商的樣本包括多個選擇性使用的專門小組,或者接受調(diào)查并提供人口統(tǒng)計信息的網(wǎng)絡(luò)用戶群體。這一信息使得我們可以對訪問各種網(wǎng)站或網(wǎng)站類別的用戶進行人口統(tǒng)計和心理描繪的報告?;ヂ?lián)網(wǎng)服務(wù)提供商和選擇性使用的數(shù)據(jù)每天更新,提供以往的使用資料;搜索詞條數(shù)據(jù)每周更新;人口統(tǒng)計和心理描繪數(shù)據(jù)以連續(xù)4 周的平均使用率為基礎(chǔ)。
關(guān)于隱私權(quán)
當我向新聞界或商界的朋友首次談起我們的數(shù)據(jù)資源時,最常碰到的問題就是這樣搜集數(shù)據(jù)是否侵犯了終端用戶的隱私權(quán)?在這里我首先要指出的是,保護終端用戶的隱私權(quán)是企業(yè)實現(xiàn)自身利益最大化的重要前提。通常,我們會通過兩個機制來實現(xiàn)對用戶隱私權(quán)的保護。第一,數(shù)據(jù)收集部門會對原始數(shù)據(jù)進行匿名整合處理。這樣一來,前向及后向部門都無法再將數(shù)據(jù)資源和具體用戶對應(yīng)起來。實際上,企業(yè)所進行的一切活動都是圍繞著整合資源、發(fā)掘規(guī)律而展開,絕對不會去打探用戶的個人隱私;第二,對于搜索關(guān)鍵詞等方面的數(shù)據(jù),我們也會進行相應(yīng)的保密處理,刪掉與身份識別相關(guān)的一切信息,如電話號碼、信用卡號碼、社??ㄌ柕?。所以說,我們的樣本絕不會侵犯終端用戶的隱私權(quán)。
本書簡介
本書內(nèi)容我們主要從兩方面展開。首先,我們對近年來積累的、與數(shù)據(jù)資源相關(guān)的觀點、事例作了詳盡的分析和說明,你可以與我們一起分享。從人們喜好訪問互聯(lián)網(wǎng)的“陰暗面”——熱衷于黃、賭、毒,到現(xiàn)代社會人們對名人的頂禮膜拜……通過對所有上述事例的分析,讀者將會了解到應(yīng)該怎樣通過網(wǎng)絡(luò)數(shù)據(jù)資源來具體剖析人們的特定行為。我們還將討論人們在搜索引擎中輸入的查詢,這些問題又如何揭示我們的內(nèi)心,例如搜索我們的恐懼,我們想要了解的事情,或者像“天空為什么是藍色的”這樣的普通問題。我們還討論了互聯(lián)網(wǎng)交流中的最新變革是如何改變?nèi)伺c人之間的互動方式。其次,我們將會進一步學(xué)習網(wǎng)絡(luò)數(shù)據(jù)資源的理論及實踐運用,包括互聯(lián)網(wǎng)競爭情報行業(yè)的各種策略及應(yīng)用,如何運用數(shù)據(jù)資源預(yù)測當前趨勢和潮流,我們甚至能用網(wǎng)絡(luò)流量數(shù)據(jù)來預(yù)測美國下一個搖滾巨星是誰。
要開始我們的網(wǎng)絡(luò)行為探索之旅,從網(wǎng)絡(luò)自身的弱點說起再合適不過。在網(wǎng)絡(luò)營銷界中,PPC 代表的是點擊付費廣告(pay per click),即廣告投放商根據(jù)用戶的點擊量來支付相應(yīng)的廣告費用。但在本書中,PPC 有著完全不同的含義。在本書第1 章中,PPC 代表著色情(porn)、藥物(pills )和賭場(casinos)。這些關(guān)于人類惡習的網(wǎng)絡(luò)數(shù)據(jù)向我們揭示了競爭情報數(shù)據(jù)是何等強大。網(wǎng)站訪問量的上升與下降,網(wǎng)站訪問的細分群體,以及用戶群的訪問意圖等,都是我們所要研究的內(nèi)容。