【SEO优化】带你了解网页出现作弊技术的解决方法

2020-11-25 05:50:53 编辑:黑马网络 来源:本站原创

  关于搜索引擎优化,大家应该都比拟清楚,它关系到了一些什么排名要素,我们晓得排名不是说说就能做上去的,还需求破费工夫破费精神去完成,但也有一些想坐享其成,悄悄松松就想排名做上去的人,它们就会想着采取一些不迷信手腕来提升,这就是一种作弊行为,那我们应该怎样去处置呢?就让小编带你理解网页呈现作弊技术的处理办法。


  一、网页反作弊呈现背景


  出于商业利益的驱使,很多网站站长会针对搜索引擎排名停止剖析,并采取一些手腕来提升排名。这种行为自身无可厚非,很多优化行为都是契合搜索引擎排序规则的,但与此同时也存在很多歹意的优化行为。所以网页反作弊,也是目前一切商业搜索引擎需求处理的重要难点。


  二、网页作弊类型内容作弊:


  从大的分类来说,次要的作弊办法包括:内容作弊、链接作弊、隐藏作弊及近几年衰亡的web2.0作弊办法。笔者以为,内容作弊与现阶段业务毫不相关,因而会在本文着重讲下此类型及相关的反作弊思绪。


  内容作弊的目的是经过精心更改或许调控网页内容,使得网页在搜索引擎排名中取得与其网页不相称的高排名。罕见的作弊方式包括:关键词反复、有关查询词作弊、图片alt标签文本作弊、网页标题作弊、网页重要标签作弊及网页元信息作弊。经过这几种罕见的作弊手腕,作弊者的作弊意图不外乎以下几种:


  1、添加目的作弊词词频来影响排名;


  2、添加主题有关内容或许抢手查询吸引流量;


  3、关键地位拔出目的作弊词影响排名。


  Google在2011年2月高调宣布针对低质量网页内容调整排序算法,据报道此算法影响了大约11.8%的网页排名,而这项调整措施是专门针对以Demand Media(创立于2006年5月,雇员500人,它的业务比拟庞杂,包括域名注册、内容广告买卖等。它的一个次要业务是,它有包括65个社会化媒体组成的网站群。)网站为代表的内容农场作弊手法的。


  内容农场的运营者廉价雇佣少量自在职业者,支持他们付费写作,但内容普遍质量低下,很多文章都是经过复制黏贴完成。但重点是,他们会研讨搜索引擎的抢手搜索词等,并无机的将这些词汇添加到写作内容当中去。这样,普通搜索引擎用户在搜索时,会被吸引进内容农场网站,经过少量低质量内容吸引流量,内容农场可以赚取广告费用。


  与传统的作弊办法相比,内容农场不采用机器拼接内容等机械方式,而是经过雇仆人员写作,这种作弊方式搜索引擎往往难以给出能否作弊的明白界定,但又严重影响搜索后果质量,所以是一种很难处置的作弊手法。

【SEO优化】带你了解网页出现作弊技术的解决方法

  三、网页反作弊技术的全体思绪:


  目前搜索引擎作弊手腕五花八门且层出不穷,作为应对方的搜索引擎,也相应调整技术思绪,所以假如整理一下反作弊思绪,则会发现技术办法很多,理清思绪着实不易。虽然如此,假如对大少数反作弊思绪深化剖析,会发现全体思绪上还是有规律可循。从根本思绪角度看,可以将反作弊手腕大致划分为以下3种:信任传达模型、不信任传达模型和异常发现模型。


  1、信任传达模型:在海量的网页数据中,经过一定的技术手腕或人工半人工手腕,从中挑选出局部完全值得信任的页面(可以了解为我们日常所说的白名单),算法以这些白名单内的页面作为动身点,赋予白名单内页面节点较高的信任度分值,其他页面能否作弊,要依据其与白名单内节点链接关系来确定。白名单内节点经过链接关系将信任度分值向外分散传达,假如某个节点最初失掉的信任度分值高于一定的值,则以为没有成绩,假如低于这个值则会被判为作弊。


  2、不信任传达模型:从大的技术框架来讲,与信任传达模型极端类似。最大的区别在于:初始页面本人不是值得信任的页面节点,而是确认存在作弊行为的页面集合(即我们日常所说的黑名单)。赋予黑名单内页面节点不信任分值,经过链接将这种不信任关系传达出去,假如最初页面节点的不信任分值大于设定的那个值,则被判为作弊。


  3、而异常发现模型:复杂的譬如剖析网页内容来发现词频、链接等的异常,复杂点的像剖析网站用户行为异常等。异常发现模型往往和信任传达模型和不信任传达模型停止组合处置。


  现实上,地道技术手腕目前是无法彻底处理作弊的成绩,因而如今普通都是用户在阅读搜索后果甚至是上网阅读时告发作弊网页,搜索引擎公司外部会有专门的团队来审核与自动发现可疑页面,经过审核确认的网页则可以放入黑名单或许白名单当中。综上所述,必需将人工手腕与技术手腕互相结合,才干获得较好的反作弊效果。


  四、通用链接反作弊办法:


  1、TrustRank 算法  (属于信任传达模型)


  2、BadRank 算法    (属于不信任传达模型,据传是Google采用的反链接作弊算法。 留意:不要链接给作弊页面)


  3、SpamRank  (属于异常发现模型)


  SpamRank 的根本假定是:


  3.1、关于正常页面来说,其支持者页面的 PangRank 值应该满足 Power-Law 散布,即 PR值有大有小。


  3.2、作弊网页不同,普通具有如下3个特点:


  Ⅰ、支持者页面数量十分宏大


  Ⅱ、支持者页面的 PangRank 值得分都较低


  Ⅲ、支持者页面的 PangRank 值都落在一个较小浮动范围内


  五、公用链接反作弊技术:


  1、辨认链接农场:


  、网页出链的统计散布规则,作弊网页出链不契合 Power-Law 散布


  Ⅱ、网页入链的统计散布规则,作弊网页入链不契合 Power-Law 散布


  Ⅲ、URL称号统计特征,作弊网页的网址较长,包括更多的点画线和数字等


  Ⅳ、很多作弊网页的URL地址虽然不同,但是对应同一个IP地址


  Ⅴ、网页特征会随工夫变化,比方入链的增长率、出链的增长率等


  Ⅵ、链接农场的构造特征,农场内的网页之间链接关系十分亲密


  2、辨认 Google 轰炸:


  判别锚文字能否和被指向页面有语义关系


  六、辨认内容作弊:


  1、反复呈现关键词,判别文本内一定大小的窗口中能否延续呈现同一个关键词


  2、标题关键词作弊


  3、统计正常页面中句子长度的规律、停用词的散布规律、词性的散布规律等


  七、反隐藏作弊:


  罕见的隐藏作弊方式包括页面隐藏和网页重定向。


  1、辨认页面隐藏


  对网页做2次抓取,第1次数正常的搜索引擎爬虫抓取,第2次模仿人工拜访网页的方式抓取。这种办法本钱十分高。


  2、辨认网页重定向


  Strider 零碎给出了依据网页重定向来辨认究竟哪些是作弊网页的处理方案。


  以上就是小编帮你们整理的一些材料,关于搜索引擎优化,我们应该打压那些采用不迷信办法上去的人,要做到公道性,不让辛劳都白费,尊重搜索的用户,污染互联网的生态环境!

本站文章均为黑马网站建设摘自权威资料,书籍,或网络原创文章,如有版权纠纷或者违规问题,请即刻联系我们删除,我们欢迎您分享,引用和转载,我们谢绝直接复制和抄袭!感谢...
我们猜你喜欢