然而不管怎么說,谷歌的“登月”計劃與美國太空總署的月球旅行還是有很大差別的:沒有一個競爭對手愿意與它在圖書搜索計劃上展開競爭。在20世紀60年代,空間探索成為冷戰(zhàn)的延伸,美國和前蘇聯(lián)在很多科技領(lǐng)域里勢均力敵。然而,在2002年和2003年,在谷歌神不知鬼不覺地開始其圖書搜索計劃的時候,沒有其他的公司愿意同它進行一對一的較量――完成這項計劃所需要的大量資金足以使其他公司望而卻步。
谷歌在這一計劃上占盡先機不單是因為它擁有雄厚的財力,更是緣于那些曾經(jīng)試圖將書籍數(shù)字化的公司在這條路上沒有走得很遠。最早承擔這個艱巨任務的是由邁克爾?哈特(Michael Hart)在1971年開始的“古登堡計劃”(Project Gutenberg)。那時掃描儀和個人電腦還沒有出現(xiàn),所謂的數(shù)字化只是將鍵盤連接到擺在伊利諾伊大學的材料研究實驗室里的大型電腦主機上進行數(shù)據(jù)存取。哈特向一些接觸過電腦而且有空余時間的志愿者尋求幫助,他們愿意將公共領(lǐng)域內(nèi)的重要文學作品的全文錄入電腦(他們用不停地打字的手指詮釋著“數(shù)字”對于“數(shù)字化”的意義)。隨后,個人電腦的出現(xiàn)使這些志愿者的工作速度得以大幅度提高。
“古登堡計劃”一直回避所謂的“權(quán)威版本”,認為“在一般讀者眼中達到%的準確度的收錄文章才是最受歡迎的”。這個計劃沒有辦法很好地涵蓋全世界的文學作品:到2002年,該項目僅僅完成了約6300本文學作品的數(shù)字化工程,而且所有這些都是完全以純文字的形式錄入,無法體現(xiàn)原書圖片所闡釋的意義?!肮诺潜び媱潯钡哪繕耸鞘辜堎|(zhì)文學作品能夠更廣泛地被接觸,其初衷無疑是很崇高的;但該計劃固有的局限性之一就是:它被接受的前提必須是讀者既不需要也不想要除了純文本之外的任何東西,同樣能給讀者帶來閱讀體驗的一些細節(jié),比如字體的變化、書名和標題,以及圖書在設計上的微妙特點等,統(tǒng)統(tǒng)被剝奪了。
在傳統(tǒng)的出版界眼中最適合完成這項大規(guī)模的行動――將所有的圖書數(shù)字化的機構(gòu)非美國國會圖書館莫屬。到1990年,掃描技術(shù)的不斷發(fā)展帶來了數(shù)字化成本的大幅度下降,于是國會圖書館開始了他們的數(shù)字化計劃,幾乎將除了紙質(zhì)書籍之外所有類型的傳媒產(chǎn)品都進行了數(shù)字化,包括文件、動畫、錄音、照片。其目的是要建立一個數(shù)字化的、記載“美國記憶”的歷史資料庫。
最雄心勃勃的圖書數(shù)字化項目始于2001年。當卡內(nèi)基?梅隆大學收到了美國國家科學基金會(National Science Foundation)為“百萬圖書項目”提供的50萬美元基金時,這項計劃正式啟動了。為了能夠?qū)⒈M可能多的圖書進行數(shù)字化,本著“少花錢、多辦事”的原則,他們不惜大費周章地將圖書運到印度和中國進行掃描。然而,當他們向美國的圖書館提出,要他們提供其館藏圖書并允許將這些圖書打包進集裝箱,再通過風險很大的海上運往國外進行掃描時,遭到了圖書館的拒絕。遭拒的原因不言自明。布魯斯特·卡爾(Brewster Kahle),這個在1996年建立了互聯(lián)網(wǎng)絡檔案館(Internet Archive)的互聯(lián)網(wǎng)創(chuàng)業(yè)者――就像他自己說的那樣――“跨出了歷史性的一步”,因為他將花費了50000美元從堪薩斯市公共圖書館(Kansas City Public Library)購買的15萬冊藏書無償捐贈給了“百萬圖書項目”。