正文

“登月”計劃(1)

星球Google 作者:(美)蘭德爾·斯特羅斯


然而,網(wǎng)頁的出現(xiàn)僅僅是個開始。就在谷歌剛滿三歲的2001年,在洛杉磯舉行的一次業(yè)界集會上,其創(chuàng)始人拉里·佩奇和謝爾蓋·布林進行了一場公開的演講。兩位創(chuàng)始人在這次講話中解釋說,盡管Google索引看起來足夠龐大,其網(wǎng)頁數(shù)量甚至達到了13億之多,但除了網(wǎng)頁自身附帶的小部分信息外,這些數(shù)量驚人的網(wǎng)頁并沒有提供更多有價值的信息。佩奇說:“目前,人們?nèi)耘f只能存取互聯(lián)網(wǎng)上業(yè)已存在的資料和信息。人們無法對圖書館里收藏的書籍資料進行存取,無法對雜志內(nèi)容進行存取,無法對報紙內(nèi)容進行存取,即使是過期的報紙也做不到。同樣地,人們對于已經(jīng)播放的電視節(jié)目也無法存取。但是這一切都將被改變。”

早在佩奇還是斯坦福大學(xué)的一名研究生時,他就參與過作為該大學(xué)數(shù)字化圖書館項目一部分的某些實驗項目,而將傳統(tǒng)的紙質(zhì)媒體數(shù)字化的設(shè)想也正是開始于那段科研經(jīng)歷。但是直到2001年,谷歌對于是否應(yīng)該做點什么具體工作來加速傳統(tǒng)媒體的數(shù)字化仍舊沒有明確的表態(tài)。圖書館、出版社以及電視臺這類機構(gòu)似乎有能力完成數(shù)字化的日常零碎工作并且能夠?qū)⑽募?wù)器上向公眾開放的信息進行整理,而谷歌的“爬行器”則像它之前將大量網(wǎng)頁進行編錄索引那樣,負責(zé)將這些傳統(tǒng)傳媒機構(gòu)整理出來的信息編入索引。

然而,一年后的2002年,佩奇和布林以及他們的團隊決定不再猶豫,要憑借自己的力量開始對最完整記錄人類對世界的理解的信息類型――紙質(zhì)書籍進行數(shù)字化的可行性進行審查。眾所周知,Google算法在網(wǎng)頁之間的優(yōu)選認(rèn)定上比較擅長,但是它不能夠?qū)⒕W(wǎng)頁上出現(xiàn)的最有價值信息像傳統(tǒng)的紙質(zhì)書籍那樣向其用戶提供高質(zhì)量的選擇建議。

很顯然,與谷歌工程師熟悉的將網(wǎng)頁編入索引和對網(wǎng)頁進行排名運算的工作不同,書籍?dāng)?shù)字化絕對是一個全新的挑戰(zhàn)性課題。將書本中的文字轉(zhuǎn)換成由0和1組成字節(jié)的數(shù)字模式所需要的不只是強悍的計算機知識,是否具備其他領(lǐng)域的專業(yè)知識似乎顯得更為重要。比如用于設(shè)計圖像設(shè)備的機械工程學(xué)知識,用來游說擁有大量圖書資源的大學(xué)圖書館參與合作的公關(guān)學(xué)知識,以及怎樣將要掃描的書籍毫發(fā)無損地來回運送的后勤保障知識,甚至還包括要確保項目進行中不會觸犯版權(quán)法的法律知識。此外,要完成這項工作還要有一個必不可少的條件,那就是強大的資金保證。因為Google決定從事的書籍?dāng)?shù)字化工程不只是針對某家大型圖書館的藏書,也不只是針對那些有價值的學(xué)術(shù)性書籍、那些普通的大眾書籍甚至是那些飽受爭議的書籍等,而是要將上述的所有書籍――迄今為止在全球書目數(shù)據(jù)庫(WorldCat)里列出并被收藏在全球25000家圖書館內(nèi)的3200萬本書籍――中的每一冊都進行數(shù)字化。

瑪麗莎?梅耶爾(Marissa Mayer)曾經(jīng)把谷歌的圖書搜索項目(Google Book Search)稱之為“我們的登月”計劃。這種比喻至少在某些方面看來是恰當(dāng)?shù)?。紙質(zhì)書籍的數(shù)字化一直以來就是很多人的夢想。但這個夢想往往被認(rèn)為過于雄心勃勃而在短期內(nèi)很難實現(xiàn)。從1961年約翰·肯尼迪總統(tǒng)宣布著名的“登月”計劃開始,到1969年人類安全地在月球上著陸,美國用了10年時間完成自己的這一夢想。與此相似的是,谷歌也打算用10年的時間來完成它的“登月”――Google 圖書搜索。(2007年9月,谷歌又為它的另一項“登月”計劃撥款,那就是投資3000萬美元開發(fā)Google Lunar X Prize。)


上一章目錄下一章

Copyright ? 讀書網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號