说说百度对待伪原创的收录态度
作者:www.wangzhanbaojia.com 日期:2010/08/05
我相信有很多的朋友都搜索引擎喜欢原创文章,而且有自己的一套识别体系,可我最近在做“广州网站建设”这个关键词的时候,对这个体系就开始深度的思考了。大家做网站优化嘛,不能千篇一律,一切都得凭借事实说话。
先明确一个概念,原创和伪原创:
原创:通俗一点儿就是,你自己写的文章,然后发布到相关的平台上,互联网上没有跟你相似或相近的文章。
伪原创:相反就是两篇文章看似一样,虽细看却有差异,只是非常相近,非常相似的文章了,当然就不管你具体怎么伪的,今天不探讨的话题不符合。
那搜索引擎怎么判断伪原创呢?我想无非这几个因素。
1、看你这篇文章的快照更新日期,跟其他类似或相近的文章做对比,谁时间最久谁就是原创相反就是伪原创。
2、蜘蛛抓取日期,这个跟快照差不多,只是应该有小间隔,蜘蛛访问抓取,然后在排出来肯定是有个时间间隔。
3、页面外链的查询,说直接点儿就是发布页面的权重分析,权重高的他可能会判断是原创,权重低的就可能判断是伪原创。
4、多篇文章内容的比较,看相近程度分析,然后判断。一般都是看标题,段落分段,还有整体匹配等因素。这个肯定是多篇文章进行综合分析的。差异化小,而且最先发布的可能就会被认为是原创吧。编辑:力洋网络
先明确一个概念,原创和伪原创:
原创:通俗一点儿就是,你自己写的文章,然后发布到相关的平台上,互联网上没有跟你相似或相近的文章。
伪原创:相反就是两篇文章看似一样,虽细看却有差异,只是非常相近,非常相似的文章了,当然就不管你具体怎么伪的,今天不探讨的话题不符合。
那搜索引擎怎么判断伪原创呢?我想无非这几个因素。
1、看你这篇文章的快照更新日期,跟其他类似或相近的文章做对比,谁时间最久谁就是原创相反就是伪原创。
2、蜘蛛抓取日期,这个跟快照差不多,只是应该有小间隔,蜘蛛访问抓取,然后在排出来肯定是有个时间间隔。
3、页面外链的查询,说直接点儿就是发布页面的权重分析,权重高的他可能会判断是原创,权重低的就可能判断是伪原创。
4、多篇文章内容的比较,看相近程度分析,然后判断。一般都是看标题,段落分段,还有整体匹配等因素。这个肯定是多篇文章进行综合分析的。差异化小,而且最先发布的可能就会被认为是原创吧。编辑:力洋网络