在万维网的客户机-服务器架构中,浏览器和网站之间的交互是通过超文本传输协议(HTTP)处理的。该协议于1991年引入,是一个官方的web标准。几乎web上的所有流量都是通过HTTP处理的。
当像Googlebot这样的搜索引擎爬行器抓取一个网站时,它们的行为就像浏览器从一个网站请求web页面,并依赖HTTP进行这种交换。这就是为什么对于搜索引擎优化专家(SEOs)来说,了解HTTP协议是如何工作的,以及它对搜索引擎抓取和索引web页面的影响是很重要的。在本专栏中,我将解释您需要知道的一切。
但首先,让我告诉您在站点上执行必要测试所需的工具。谷歌Chrome DevTools允许你查看统一资源定位器(URL)完整的HTTP响应,但它可能是麻烦的查看。我更喜欢使用Ayima Page Insights和Ayima重定向路径Chrome插件来显示URL的完整HTTP响应。
在Chrome中使用Ayima Page Insights插件,这是HTTP响应的样子:
另一个做同样工作的工具是Live HTTP Headers for Chrome。
HTTP状态代码
让我们讨论一下HTTP状态码。
当一个网页从一个网站被请求时,网站的服务器响应一个HTTP状态码。这段代码是对客户机请求的确认,并指示服务器发送给客户机的响应类型。
web服务器可以响应数百种不同的HTTP状态代码,您在日常搜索引擎优化(SEO)工作中可能会遇到这些代码。它将帮助您熟悉它们中的大多数,以便您知道如何使用它们。这里是一个列表更常见的HTTP状态代码:
200好了。
300多个选择。
301年搬到永久。
302暂时转移。
304年不修改。
307年临时重定向。
400错误请求。
401未授权。
404没有找到。
410年过去了。
太多的请求。
内部服务器错误。
501没有实现。
503服务不可用。
550没有权限。
搜索引擎优化专家需要了解这些状态代码,并了解每个响应代码的目的。此外,seo应该了解像谷歌这样的搜索引擎是如何处理这些状态码的。让我们看看一些更常见的。
200好了
让我们从最明显的开始。来自web服务器的200响应意味着请求成功,即被请求的web页面存在,web服务器将开始向客户机发送该页面及其相关资源(图像、CSS & JS文件等)。
此响应代码非常简单。通常,附加的标题与响应代码一起发送,这可能会影响搜索引擎处理URL的方式。我们将在下面的HTTP头部分中查看这些内容。
301永久移动
301 HTTP状态码是SEO行业最受欢迎的代码之一,因为它让浏览器——以及搜索引擎——知道一个网页已经被另一个网页取代,而且这种改变是永久性的。对于搜索引擎来说,这意味着它们需要更新索引,并将旧URL的链接指标与新URL关联起来。
原始URL通过301重定向与新URL相关联的链接值的数量是一个可以猜测的问题,谷歌对此给出了矛盾的说法。
我相信301重定向具有与链接相同的PageRank阻尼因子——所以当页面a重定向到页面B时,它具有与页面a链接到页面B相同的效果。
总的来说,301重定向是SEO库中的一个重要工具,它有很多有用的应用程序,可以帮助网站保持排名甚至提高排名。
302年搬到临时
另一种类型的重定向是302 HTTP状态码,它表示一个页面已被另一个URL临时替换。
在短期内,这意味着搜索引擎将保留其索引中的原始URL,而用户则被发送到重定向的目标URL。但是,从长远来看,谷歌将302重定向解释为永久的301重定向,并将开始相应地处理它。
许多网站使用302重定向自动地理重定向,将用户发送到正确的国家/语言版本的内容。虽然理论上这看起来不错,但一般不建议使用重定向,因为这可能意味着谷歌这样的搜索引擎只能看到一个国家版本的网站内容。
谷歌主要从美国的IP地址爬行,所以对所有美国流量的自动302重定向意味着谷歌只能看到一个网站的美国内容。其他国家和语言的版本对谷歌来说是不可见的,除非你想办法为Googlebot设置例外。
304年不修改
304 HTTP状态码不经常使用,因为它应该。这段代码的作用是通知浏览器和搜索引擎爬虫自上次访问以来资源没有改变。这意味着t