6月22日和6月28日的百度反作弊大新新对于相当一部分站长来说是一个噩梦,许多网站都被K掉,从官方数据来看,说是5%的流量已经被调整,我想这个数字只多不少,我举我自身的一个例子。本人的友情链接有33个,当初挑选时都是一些排名很好,pr为3或4的企业网站,经过28日之后,我再检查自己的友情链接,已经有7个网站被K掉了。所幸的我比较懒,每天只新新一篇文章,而且这篇文章完全由我自己原创,所以在这次百度地震中,我的排名没有太大影响。
昨天,大连网站建设公司看到百度站长平台针对22号28号大量网站惩罚做出了说明,其中有两句话特别引人注目,第一句是百度新新了部分反作弊策略和特征,这些策略在6月21日逐渐生效。第二句话是对低质量文章的定义:低质量站点是指无原创, 或者伪原创(很少原创内容, 大量采集的内容)。从这两句话可以悲观的看出,这只是一个开始,而且被K的网站也很难会被恢复了,以后只靠转载文章也很难养活网站了。
那么百度是如何判断文章是不是伪原创呢
百度蜘蛛在抓取文章之后,经过一定处理将一些多余没有多大意义的字去掉,例如“因为”“的”“了”等等,把整个文章变成众多关键字的集合。然后计算各个关键词的密度,再和他数据库里的其他文章进行对比,如果这些文章关键词数量一样,密度也一样的话。那么百度就为认为这是一篇伪原创。当这些关键词的数量和密度有百分之五十以上不一样时,百度才会认为这篇文章是原创文章。
这个原理也是从搜索原理书上看到的,大连网站建公司设想这个规则同样适合百度作弊大新新之后的策略,不会发生太大变化。那么以后众多个人站长如何去进行高质量的原创和伪原创呢?
首先是用户体验,最基本的就是用户能读通顺这篇文章,有些工具伪原创的文章根本不能看,完全是为了百度制造。其次文章尽量用手打上去,减少复制加黏贴,对于发帖时间百度也能统计到,那些一分钟发好几篇文章很定有问题,只是百度以前没有过多关注,这次百度新新之后还能不能允许站长这么疯狂就不得而知了,可以肯定的是采集软件群发这个做法已经过时了。
针对我以上的百度规则,我给大家介绍两种伪原创方法:
1 文章改写
将文章的首段和尾段删掉,然后自己撰写,搜索引擎是从上到下抓取的,第一段是百度蜘蛛最先看到的,而后面一段文字是带蜘蛛离开的。更重要的是改写的文字尽量多一些,如果原文字首段为20个字,那么你改写的文字至少为40个字,这样才会引起蜘蛛的兴趣。
2 翻译软件的巧妙使用
选择一篇文章,很好是比较老或者转载次数较少的文章,用翻译软件翻译成英文在翻译成中文,不断转换,转换几次,原来的文章就面目全非了,然后你自己在通读一遍,把语句不通顺的地方改掉,满足最基本的用户体验。
过多的方法我就不介绍了,这两种方法想必大家都知道,用的人想必就很少了,毕竟还要自己去改写,但经过这次百度反作弊大新新之后,那种一开软件就坐着数钱的日子已经不在了,站长们也要跟着不断的进化。
评论加载中...
|
Copyright@ 2011-2017 版权所有:大连仟亿科技有限公司 辽ICP备11013762-1号 google网站地图 百度网站地图 网站地图
公司地址:大连市沙河口区中山路692号辰熙星海国际2215 客服电话:0411-39943997 QQ:2088827823 42286563
法律声明:未经许可,任何模仿本站模板、转载本站内容等行为者,本站保留追究其法律责任的权利! 隐私权政策声明