什么是重复内容?
重复内容是可以在网络上的多个URL上获得的内容。由于不止一个URL显示相同的内容,因此搜索引擎不知道哪个URL在搜索结果中列出的位置更高。因此,他们可能会将两个URL的排名都降低,并优先使用其他网页。
在本文中,我们将主要关注重复内容的技术原因及其解决方案。如果您想对重复内容有更广泛的了解,并了解它与复制或抓取的内容甚至是关键字吞噬之间的关系,建议您阅读这篇文章:什么是重复内容。
让我们用一个例子来说明
重复的内容可以比喻为十字路口,在该十字路口,路标指向同一目的地的两个不同方向:您应该走哪条路?更糟糕的是,最终目的地也有所不同,但只是略有不同。作为读者,您不会介意,因为您获得了您想要的内容,但是搜索引擎必须选择要在搜索结果中显示的页面,因为它当然不想两次显示相同的内容。
假设您有关“关键字x”的文章出现在http://www.example.com/keyword-x/上,相同的内容也出现在http://www.example.com/article-category/keyword-x/ 。这种情况不是虚构的:它发生在许多现代的内容管理系统中。然后,假设您的文章已被几位博客作者选中,其中一些链接到第一个URL,而另一些链接到第二个URL。这是搜索引擎的问题显示出其本质的时候:这是您的问题。重复的内容是您的问题,因为这些链接都宣传不同的URL。如果他们都链接到相同的URL,则对“关键字x”进行排名的机会会更高。
如果您不知道自己的排名是否受到重复内容问题的困扰,那么这些重复内容发现工具将帮助您找到答案!
内容重复的原因
重复内容的原因有很多。它们中的大多数都是技术性的:人们很少会决定将相同的内容放在两个不同的地方而没有弄清楚哪个是原始的。除非您是克隆帖子并偶然发布它。但是否则,对于我们大多数人来说,这是不自然的。
不过,有很多技术原因,并且大多是因为开发人员的想法不像浏览器甚至用户,更不用说搜索引擎蜘蛛了,他们像程序员一样。以我们前面提到的那篇文章为准,该文章出现在http://www.example.com/keyword-x/和http://www.example.com/article-category/keyword-x/上。如果您问开发商,他们会说它只存在一次。
误解URL的概念
不,开发人员并没有发疯,他们只是在说另一种语言。 CMS可能会为网站提供动力,并且在该数据库中只有一篇文章,但是该网站的软件仅允许通过多个URL检索数据库中的同一文章。这是因为在开发人员看来,该文章的唯一标识符是该文章在数据库中拥有的ID,而不是URL。但是对于搜索引擎而言,URL是一条内容的唯一标识符。如果您向开发人员解释这一点,他们将开始解决问题。阅读本文之后,您甚至可以立即为他们提供解决方案。
会话ID
您通常希望跟踪访客并允许他们例如将他们要购买的物品存储在购物车中。为此,您必须给他们一个“会话”。会话是访问者在您的网站上所做的简短历史,并且可以包含购物车中的物品之类的内容。为了在访问者从一个页面单击到另一个页面时保持该会话,该会话的唯一标识符(称为会话ID)需要存储在某个地方。最常见的解决方案是使用Cookie。但是,搜索引擎通常不存储Cookie。
那时,某些系统退回到使用URL中的会话ID。这意味着网站上的每个内部链接都会将会话ID添加到其URL中,并且由于该会话ID对于该会话而言是唯一的,因此它将创建一个新的URL,从而重复了内容。
用于跟踪和排序的URL参数
重复内容的另一个原因是使用URL参数,这些参数不会更改页面的内容,例如在跟踪链接中。您会发现,对于搜索引擎而言,http://www.example.com/keyword-x/和http://www.example.com/keyword-x/?source=rss是不同的URL。后者可能使您能够跟踪人员的来源,但也可能使您难以排名,这是非常有害的副作用!