一、搜索?
我們先說(shuō)搜索。Google、百度代表一種模式,可以說(shuō)是全網(wǎng)的基礎(chǔ)搜索模式;而qihoo和daqi代表另一種全網(wǎng)模式。這里我想詳細(xì)說(shuō)說(shuō):從表面看,qihoo和daqi目前都是對(duì)BBS內(nèi)容進(jìn)行聚合,似乎是“垂直搜索(聚合)”,但其實(shí)他們也是基于全網(wǎng)的廣域搜索和聚合――即基本上針對(duì)所有中文bbs;所以我并不把他們看作是“垂直”的。而第三種搜索模式,就是酷訊網(wǎng)為代表的,真正的“垂直搜索”――他們不用索引海量的網(wǎng)站,直接索引相關(guān)信息的宿主網(wǎng)站就可以了。而根據(jù)酷訊的業(yè)務(wù)范圍,我分析,比如租房這塊,他們索引主要的百來(lái)個(gè)租房網(wǎng)站即可。
而一個(gè)真正的搜索網(wǎng)站,主要需要三個(gè)功能:1,爬蟲系統(tǒng)分析海量未知網(wǎng)站的網(wǎng)頁(yè);2,索引經(jīng)過(guò)爬蟲抓取回來(lái)的網(wǎng)站網(wǎng)頁(yè);3,對(duì)用戶搜索請(qǐng)求的分析和響應(yīng)。在上一段中,我之所以試圖澄清目前三種不同類型的“搜索”網(wǎng)站,是因?yàn)檫@三種不同搜索模式,在搜索的三個(gè)功能上,技術(shù)含量是完全不同的。Google,baidu的技術(shù)含量要求最高;而酷訊模式的技術(shù)含量最低。
因?yàn)榈谝?,酷訊根本不需要用爬蟲分析未知網(wǎng)站,只需要人工對(duì)有限的分類信息宿主網(wǎng)站進(jìn)行分析,然后爬蟲定向抓取即可;(酷訊是否采用機(jī)器分析另說(shuō),我只是說(shuō)明人工分析在此點(diǎn)上能達(dá)到同樣效果);第二,索引這些宿主網(wǎng)站也不需要特別的策略,因?yàn)閹讉€(gè)分類確定了,信息就很容易格式化,比如,租房無(wú)非就地點(diǎn),房租,聯(lián)系方式等等信息;最有趣的是第三――其實(shí)真正的搜索網(wǎng)站,對(duì)用戶搜索請(qǐng)求的語(yǔ)義理解,技術(shù)含量非常高;但酷訊采取了兩個(gè)“取巧”的方式,降低了這方面的技術(shù)難度:(1)“限定”用戶的查詢請(qǐng)求,以降低系統(tǒng)對(duì)用戶語(yǔ)義解釋的難度。以租房為例,提示用戶輸入名詞的“地名”,這樣系統(tǒng)對(duì)用戶語(yǔ)義的解釋就很容易了――但即使如此,酷訊做的也不好,比如,搜索“北三環(huán)”有1033條信息;而搜索同義的“北三環(huán)附近”只有143條信息;“北三環(huán)一帶”只有7條信息;(2)網(wǎng)站列出了主要查詢條件,類似分類,用來(lái)降低用戶個(gè)性化查詢請(qǐng)求的可能性,因此降低了系統(tǒng)語(yǔ)義解釋的難度。同樣以租房為例,酷訊通過(guò)幾個(gè)最常用的分類推薦,實(shí)際上用戶完全可能不用再搜索,只點(diǎn)選這幾個(gè)“分類”即可,系統(tǒng)也就不用去理解用戶的語(yǔ)義
通過(guò)如上分析可知,理論上,其實(shí)不太需要搜索技術(shù),酷訊網(wǎng)站就可以被做出來(lái)。所以說(shuō)酷訊是一個(gè)搜索概念的網(wǎng)站,看起來(lái)有點(diǎn)勉為其難,比較恰當(dāng)?shù)亩ㄎ粦?yīng)是一個(gè)分類網(wǎng)站“mashup的輕量級(jí)應(yīng)用”。
值得一提的是,酷訊比較引以為豪的一些“技術(shù)”,其實(shí)也恰恰是mashup的應(yīng)用。比如,“拉框搜索”,即是分類和mapbar的地圖服務(wù)的mashup;又比如,“世界上第一個(gè)會(huì)‘冒泡’的搜索引擎”,其實(shí)就是爬蟲爬得勤快點(diǎn),再加上頁(yè)面的ajax就能解決――這些“世界第一”的技術(shù),看起來(lái)“酷”,其實(shí)如上所述,真正從技術(shù)上看也都是輕量級(jí)的“花活兒”。
二、脆弱的產(chǎn)業(yè)鏈
也就是說(shuō),酷訊其實(shí)就是分類信息的用戶入口網(wǎng)站,即用戶如果要找相關(guān)分類信息,首先去酷訊,這個(gè)是目前酷訊的真實(shí)定位。這種垂直portal的定位,其實(shí)和新浪的新聞門戶定位是一樣的,只是新浪在產(chǎn)業(yè)鏈中的“宿主”是傳統(tǒng)報(bào)紙,而酷訊在產(chǎn)業(yè)鏈中的宿主是:分類網(wǎng)站。
那么酷訊在分類信息產(chǎn)業(yè)鏈中,這樣的定位合適嗎?
要回答這個(gè)問(wèn)題,我們先看看國(guó)外分類信息第一網(wǎng)站craigslist的遇到的兩個(gè)案例:當(dāng)craigslist成為最大的分類信息網(wǎng)站之后(請(qǐng)大家務(wù)必注意行業(yè)老大這個(gè)背景),craigslist允許housingmaps.com引用他們的數(shù)據(jù),但是拒絕了另外一家Oodle。
對(duì)此,非常湊巧,我寫此博客,搜索資料的時(shí)候發(fā)現(xiàn),酷訊網(wǎng)站方就有一篇文章談?wù)摯藛?wèn)題,摘抄如下:
。。。。。。一直有朋友關(guān)心,酷訊這種分類信息搜索與分類信息發(fā)布網(wǎng)站是否存在必然的對(duì)立和競(jìng)爭(zhēng)關(guān)系,分類信息發(fā)布網(wǎng)站是否會(huì)因?yàn)槔鏇_突而拒絕分類信息搜索網(wǎng)站進(jìn)入其網(wǎng)站獲取數(shù)據(jù)呢?
粗看起來(lái),這兩類網(wǎng)站好象存在一定的競(jìng)爭(zhēng)關(guān)系,而且朋友們一般都舉美國(guó)垂直搜索網(wǎng)站Oodle 被craigslist 警告“希望不要再使用”來(lái)自其列表的信息的例子,來(lái)證明這種說(shuō)法非常有根據(jù)。
但是,仔細(xì)分析后,就會(huì)發(fā)現(xiàn)這是一個(gè)偽命題。先說(shuō)oodle與craigslist的故事。為什么craigslist并不屏蔽整合其信息的其他搜索引擎,而獨(dú)獨(dú)對(duì)oodle進(jìn)行警告呢?只要看看oodle網(wǎng)站就知道了,——它把來(lái)自多個(gè)分類列表的信息匯聚在一個(gè)頁(yè)面下,看起來(lái)簡(jiǎn)直就是第二個(gè)craigslist。這就好比google如果抓取雅虎的新聞,而表現(xiàn)形式又和雅虎新聞?lì)l道毫無(wú)區(qū)別,必然會(huì)被雅虎警告。這也只能說(shuō)明,如果搜索引擎的業(yè)務(wù)模式與原信息提供者過(guò)度重疊,而不是另辟蹊徑或有技術(shù)上的創(chuàng)新,那么勢(shì)必會(huì)與原信息提供者形成沖突。
從craigslist 并不拒絕其他垂直搜索引擎(如housingmaps )整合其內(nèi)容也可以看出,craigslist 在美國(guó)分類信息發(fā)布社區(qū)中雖然享有“一哥”的地位,卻也無(wú)法抵擋互聯(lián)網(wǎng)整合和共享的大趨勢(shì)。從酷訊的用戶行為分析調(diào)查也發(fā)現(xiàn),用戶并不是只停留在酷訊網(wǎng)站上面,幾乎每位用戶對(duì)于感興趣的信息,都會(huì)點(diǎn)擊進(jìn)去看原數(shù)據(jù)網(wǎng)頁(yè)。酷訊作為分類信息搜索門戶給眾多分類信息發(fā)布社區(qū)帶去了活躍的用戶。