廣州SEO陳永繼續(xù)為大家講解搜索引擎判斷網(wǎng)站如何判斷網(wǎng)站是否作弊的原理,上節(jié)講解完TrustRank算法,這一節(jié)將詳細(xì)講解BadRank算法。
BadRank據(jù)傳是Google采用的反鏈接作弊算法。它是一種典型的不信任傳播模型,即首先構(gòu)建作弊網(wǎng)頁集合,之后利用鏈接關(guān)系來講這種不信任分值傳遞到其他網(wǎng)頁。
BadRank包含的基本假設(shè)是:如果一個(gè)網(wǎng)頁將其鏈接指向作弊頁面,則這個(gè)網(wǎng)頁也很可能是作弊網(wǎng)頁:而如果一個(gè)網(wǎng)頁被作弊網(wǎng)頁指向,則不能說明這個(gè)網(wǎng)頁是有問題的,因?yàn)樽鞅拙W(wǎng)頁也經(jīng)常將其鏈接指向一些知名網(wǎng)站,所以BadRank的基本思路:找到那些有鏈接關(guān)系指向已知作弊網(wǎng)頁的頁面,這些頁面很可能也是作弊網(wǎng)頁。
BadRank首先收集一批已經(jīng)確認(rèn)的作弊網(wǎng)頁形成的作弊網(wǎng)頁集合(黑名單),黑名單內(nèi)網(wǎng)頁賦予較高的不信任分值,而不被信任分值是通過網(wǎng)頁的鏈接關(guān)系來進(jìn)行傳播的,其計(jì)算過程與PR基本相同,與PR不同的是,PR是根據(jù)網(wǎng)頁的出鏈來進(jìn)行權(quán)值傳播的,而BadRank是按照入鏈來進(jìn)行權(quán)值傳播的,所以將BadRank理解為首先將網(wǎng)頁之間的鏈接關(guān)系反轉(zhuǎn),假設(shè)頁面A有鏈接指向頁面B,則將鏈接反轉(zhuǎn)為由B指向A,之后按照PR的計(jì)算方法進(jìn)行計(jì)算。
PR的計(jì)算思路是非常有代表性的,后續(xù)提出的ParentPank及Anti-Trust PageRank的整體思路上與BadRank是一致的,基本上都是不信任傳播模型的具體實(shí)現(xiàn)實(shí)例。
BadRank的計(jì)算思路很明顯和TrustRank是互補(bǔ)的,一個(gè)方法是從黑名單出發(fā)傳播不信任關(guān)系,另外一個(gè)是從白名單出發(fā)傳播信任關(guān)系,所以兩者有天然互補(bǔ)性。
BadRank算法講解完了,搜索引擎判斷網(wǎng)站是否作弊的原理分析(四)將詳細(xì)講解SpamRank算法,有興趣的朋友可以到我的博客進(jìn)行交流。
文章原創(chuàng)于http://www.30ly.com/?p=249
轉(zhuǎn)載請(qǐng)留下轉(zhuǎn)載地址
搜索引擎判斷網(wǎng)站是否作弊的原理分析(二)