百度搜索引擎在中文領(lǐng)域市場占有率第一的地位,嚴(yán)格來說是他有了一套非常好的分詞技術(shù)。當(dāng)然高深的分詞技術(shù)我們是無法探知的。但我們可以從一些表面的一些“管”來窺其里面的“豹”。今天杭州SEO就為大家談一談關(guān)于百度分詞的一點(diǎn)點(diǎn)基本的猜測。
首先我們要了解百度分詞的條件,并不是所有的詞都會有分詞產(chǎn)生,例如我們搜索“大學(xué)生”,返回的結(jié)果,我們會看到精準(zhǔn)匹配,那么百度就對這個詞沒有進(jìn)行了分詞處理,看下圖:
而我們搜索“電影下載”,百度就會將這些詞拆分為“電影”、“下載”和“電影下載”,如下圖:
于是有朋友猜測會不會百度以三個中文字為限,開始實(shí)施分詞呢?大家可以多次測試一下,這種說法是相當(dāng)有市場的,但是后面我又搜索關(guān)鍵詞的時候發(fā)現(xiàn)一個問題,如果一個詞已經(jīng)被百度詞庫收為一個單獨(dú)的詞,那么不管他多么長,百度也會先推薦精準(zhǔn)匹配網(wǎng)頁,然后推薦分詞匹配網(wǎng)頁。
例如大家搜索“不管你們信不信”,一般來說這樣的句子肯定是要被分詞處理的,但是因?yàn)槿ツ陝榆囀录@個句子已經(jīng)成為大家常用的詞語,百度也已經(jīng)對這個詞比較認(rèn)可了,將他收入詞庫中,那么它就可以實(shí)現(xiàn)精準(zhǔn)匹配。如下圖,網(wǎng)頁標(biāo)題中都是精準(zhǔn)匹配,未見分詞匹配:
結(jié)論猜測:用戶搜索某個關(guān)鍵詞,百度會根據(jù)自己詞庫先進(jìn)行精準(zhǔn)匹配,如果這個詞是很常用的詞,在自己詞庫中已經(jīng)建立詞條的詞,那么百度就會調(diào)用相關(guān)的網(wǎng)頁結(jié)果,如果詞庫中不存在就進(jìn)行分詞處理,得出的搜索結(jié)果也會產(chǎn)生一些分詞處理情況,至于結(jié)果排名影響因素比較多,比如網(wǎng)站的權(quán)重會影響到搜索的結(jié)果排名,具體的需要深入分析,這里就不班門弄斧了。
本文由杭州SEO(http://www.soxunseo.com)網(wǎng)編發(fā)表,歡迎大家轉(zhuǎn)載,轉(zhuǎn)載時請保留此鏈接,謝謝合作!