网站内容重复,是百度K站的一个主要缘由,但是也有一些人并不知道什么状况才算网站内容重复,也不知道如何处置网站内容重复的问题。笔者以为网站内容重复不单单是指网站自身呈现了两篇或者多篇一样的文章,还包括很多方面,本文就几个常见的状况中止引见,有缺乏的中央欢送指出。
一、网站内容重复的状况:
1、同样一篇文章呈现多个URL,即便这篇文章属于原创,也会被百度给予惩罚
2、网站内容多为采集,这种网站内容重复会被当做采集站直接被百度处置掉,百度新的绿萝算法就是特地打击采集站点的。
3、网站的固定版块呈现次数太多,很多网站的右侧总是固定放一些版块或栏目,这些栏目的内容历来不中止更新,或者各个页面的右侧都是前篇一概的内容,就会构成页面重复度高。
4、未设置404错误页面,当我们删除某一个页面的时分,一定要用404状态码给予用户和蜘蛛一定的提示,假如代码设置错误,那么删除的页面在蜘蛛那里是假想存在的,由此一来就会多次收录。
5、动态页面和静态并存,百度爬去目录时收录了大量动态页面
6、网站内容以图片为主,文字很少,很多图片都是共用一个URL地址,这样一来蜘蛛在索引的时分很难保证不被重复收录。
重复内容是指不同的URL链接内容却是相同的,同时收录多个重复页面,设置多个页面中止引见,但是网页的大致内容是相同的,这样处置的办法是错误的。
二、重复内容的检测办法
1、关于检测一篇文章能否重复内容,title:+文章标题可找出相同的文章。
2、从文中摘取一段话,在百度搜一下,呈现大量红字,标明这篇文章的重复度高
3、站内搜索,能够找到呈现多次的内容。
4、应用一些页面相似度检查工具,判别一些相邻页面的相似度,80%以上相似度就需求对一些固定栏目中止处置。
三、如何消弭重复内容
1、原创内容的增加
关于网站内容多为采集或简单伪原创的网站,企赢001倡议增加原创文章的内容,宁可百度收录少一些,也不要让百度把之前收录的文章吐出来。
2、网站固定栏目内容随机展示
能够依据正文的关键词,随机调用右侧栏目的文章内容,让每一个页面都有不一样的内容,避免大量页面相似度高的状况呈现。
3、设置404页面
告知用户和搜索引擎某些页面不存在了,避免搜索引擎收录大量死链。
4、页面设置独立的Meta标签
关键词、标签、描画,每一个页面都需求不同,能够采用手动修正,或者依据一定的规则设置。
更多的办法,欢送与作者中止交流,共同进步!
SDFHYJYUKIUFGFD