什么是重复内容?
重复内容是指在您的站点上或外的多个位置上可用的所有内容。它通常存在于不同的URL上,有时甚至存在于不同的域上。它通常是偶然发生的,或者是不合格的技术实现的结果。例如,您的站点可以同时使用www和非www或HTTP和HTTPS——或者同时使用两者,这太可怕了!或者可能你的CMS使用了过多的动态URL参数,这会让搜索引擎感到困惑。即使你的AMP页面可以算作重复内容,如果没有正确链接。它无处不在。
谷歌对重复内容的定义如下:
重复内容通常是指域名内或跨域名的实质性内容块,这些内容要么完全匹配其他内容,要么非常相似。大多数情况下,这在本质上并不具有欺骗性。”
最后一点很重要。如果你刮,复制和旋转现有的内容-谷歌称为复制的内容-欺骗搜索引擎得到一个更高的排名,你将在危险的地方。
谷歌表示,这种类型的恶意意图可能会触发一个动作:
“网站上的重复内容不能作为在该网站采取行动的理由,除非重复内容的意图是欺骗和操纵搜索引擎结果。”
Michiel在他的DIY复制内容检查中有一些发现网站上重复内容的好方法,以及如果有人复制了你的内容该怎么办。如果您正在处理这种类型的内容,谷歌的文档也是一座宝库。
重复内容,复制内容和瘦内容:有什么区别?
重复内容的话题让很多人感到困惑。对于谷歌来说,它主要有一个技术来源,但它也会查看内容本身。我有两个url为同一篇文章,我应该选择哪一个?而大多数普通人可能会想到类似的内容出现在网站的其他地方。“我在其他几个地方用过这段文字,那不好吗?”这都是重复内容,但为了确定排名,搜索引擎会区分重复内容、复制内容和稀薄内容。
如果您使用现有的文本并快速地对其进行散列以在站点上重用,那么重复的内容可能会归类为复制的内容。不管您是稍微旋转一下还是放入一些关键字,这种行为都是不可接受的。再加上一些薄薄的内容页面——这些页面几乎没有高质量的内容——你就会陷入危险的境地。网站质量是一个问题,这些策略会给你的网站带来严重的伤害。还记得熊猫吗?
给我们Yoast复制帖子插件的用户一个简短的边注。不用担心,你用我们的插件克隆的文章不会被视为重复的内容。除非你在不做任何更改的情况下同时发布克隆和原始版本。
不要在你的网站上阻止重复的内容
谷歌非常擅长发现和处理重复内容。这个搜索引擎足够聪明,知道该如何处理它找到的大部分内容。如果它找到一个页面的多个版本,它会将它们折叠成它找到的最好的版本——在大多数情况下,这将是原始的文章/页面。不过,它需要的是对这些url的完全访问。如果你阻止Googlebot在你的robots.txt爬行这些url,它不能自己弄清楚这些东西,你将冒谷歌处理这些页面作为单独实例的风险。以下是你应该做的几件事:
允许机器人抓取这些url
使用rel=canonical将内容标记为duplicate(请参阅下面的详细内容)
使用谷歌的URL参数处理工具来确定应该如何处理参数
使用301重定向将用户和爬虫发送到规范URL
正如Joost在他的关于原因和解决方案的文章中所描述的那样,你还可以做更多的事情来对抗网站上的重复内容。
使用rel = canonical !
在你的重复内容战斗工具包中,一个重要的工具是rel= ” canonical “。您可以使用这段代码来确定一段内容的原始URL是什么,我们称之为规范URL。我们有一个极好的rel= ” canonical “的终极指南,它向您展示了关于它的所有知识。
专注原创、新鲜、权威的内容
另一种对抗复制、复制和非原创内容的工具是写作技巧。谷歌专注于质量。它总是在寻找最适合用户意图的内容。你的目标不应该是快速赚钱,而是要留下深刻的印象。注意稀薄的内容,确保它的原创性和高质量。