
可以說PageRank成就了Google,與之類似的算法體系也成就了全球最出色的幾個搜索引擎。但是任何事物都會有其生命周期,PageRank也不例外。而且作為搜索巨頭的谷歌,它自己也在不斷反思研究,也許未來PageRank依然存在,但其實內(nèi)涵將徹底變化。
不是我危言聳聽,說“PageRank過時”或者“不科學”,早就有相關的言論和分析了。具體大家可以參考一下題為“PageRank行將過時搜索引擎遭遇范式轉(zhuǎn)移”的文章,其中從技術的角度闡述了PageRank的種種局限。
在過去10多年,可以說PageRank成就了Google,與之類似的算法體系也成就了全球最出色的幾個搜索引擎。但是任何事物都會有其生命周期,PageRank也不例外。而且作為搜索巨頭的谷歌,它自己也在不斷反思研究,也許未來PageRank依然存在,但其實內(nèi)涵將徹底變化。
為什么PageRank將越來越過時?
我們來看一下,PageRank算法的基本規(guī)則是:某個網(wǎng)頁被鏈接得越多,則該網(wǎng)頁的等級和重要性越大,從而在相關性排序中也就越靠前。當然,傳統(tǒng)搜索還有很多排序規(guī)則來輔助PageRank,讓其精準性得到進一步提高。
我曾請教過搜狗的CEO王小川,他提到,為什么Google要做Chrome?拋開云計算、操作系統(tǒng)等戰(zhàn)略考慮,其中一個很重要的原因在于,利用瀏覽器可以分析用戶對網(wǎng)站的訪問行為,從而對PageRank規(guī)則形成補充。因為PageRank只管網(wǎng)頁鏈接的情況,卻不關心用戶的真正點擊行為。
這個小例子可以證明PageRank的過時,或者說起碼它不完善。但這并不是PageRank的致命傷,它的真正問題在于——它只考慮了網(wǎng)站自身的權重,而不關心關鍵詞提交者的意圖和所處的狀況。
我舉個簡單的例子:同樣檢索“非誠勿擾”,PageRank會根據(jù)自己的算法給出網(wǎng)頁權威度的一個排序結果。但實際上網(wǎng)友的需求可能是檢索“費城(非誠)勿擾”相親節(jié)目,也可能是電影??赡苡腥艘f,這應該是語義分析應該做的事,PageRank只是根據(jù)鏈接關系進行排序,但兩者很難徹底割裂看來,更合適是的是根據(jù)不同主題給出不同的重要度排序,現(xiàn)在也有這方面的改進和嘗試。隨著人類對信息獲取需求的提高,搜索會越來越聰明,需要考慮更多越來越多的因素。
情境搜索的興起
最近Google第一次提到了“情境”這個詞,具體技術是“情境發(fā)現(xiàn)”(contextual discovery),據(jù)說2011年會有應用上線。 “情境發(fā)現(xiàn)”從本質(zhì)上,就是在搜索中,加入更多“人”的因素——用戶的瀏覽習慣、所處的地理位置等,搜索方式也會有新的變革,比如主動推送。顯然,Google已意識到這個問題。
Facebook興起后,被視為Google的顛覆者。顛覆Google,不是因為Facebook流量已實現(xiàn)超越,而是Facebook對人的了解將遠遠超過Google。這對Google未來的搜索戰(zhàn)略是極大的障礙。所以Google十分重視社交網(wǎng)絡,在我看來,這并非Google覬覦社交網(wǎng)站,而更多是出于一種自衛(wèi)。
而中國的Facebook騰訊從2009年就提出了“情境搜索”概念,和Google的“情境發(fā)現(xiàn)”頗有異曲同工之妙。到目前,基于這一概念的應用已經(jīng)上線了一些應用,比如針對QQ表情的“表情搜索”,再比如你在和好友聊“非誠勿擾2”,觸發(fā)搜索后即是電影介紹、預告片、影評、播放影院等,甚至還將包括在線預訂、購買等后續(xù)服務。
這顯然和PageRank體系的核心有很大區(qū)別。決定搜索結果及排序的規(guī)則,多出了很多維度,比如上下文關聯(lián)、瀏覽習慣、搜索者所處