与其他类型的站点相比,电子商务网站在开发URL结构方面臭名昭著,这种结构会给搜索引擎带来爬行和索引问题。为了避免重复的内容和爬行预算的复杂性,很重要的一点是要控制好这一点。
这里有五种方法来保持你的电子商务网站的最佳指数化。
1. 知道谷歌的下标是什么
首先,有必要定期检查有多少页面被谷歌报告为索引。您可以通过在谷歌上运行“site:example.com”搜索来查看整个web上谷歌能识别多少个页面。
虽然谷歌网站管理员趋势分析师Gary Illyes提到这个数字只是一个估计,但它是确定你的网站索引是否有问题的最简单的方法。
至于索引中的页面数量,Bing的Stefan Weitz也承认
我想谷歌已经有这么长时间了,人们都希望看到它出现在那里
您的内容管理系统(CMS)和电子商务平台、站点地图和服务器文件之间的数字应该几乎完全匹配,或者至少匹配任何处理和解释的差异。反过来,这些数字应该大致与谷歌站点操作符搜索返回的结果一致。智能现场搜索引擎优化在这里提供帮助;考虑到搜索引擎优化,网站可以避免重复的内容和结构问题,从而避免索引问题。
一个索引中太少的结果是一个问题,太多的结果也是一个问题,因为这可能意味着你在搜索结果中有重复的内容。虽然Ilyes已经确认没有“重复内容惩罚”,但重复内容仍然会损害您的抓取预算,还会稀释页面在重复内容上的权威性。
如果谷歌返回的结果太少:
从你的站点地图中找出哪些页面没有出现在谷歌分析的有机搜索流量中。(使用较长的日期范围。)
在谷歌中搜索这些页面的一个代表性示例,以确定索引中实际上缺少哪些页面。(您不需要对每一页都这样做。)
识别页面中没有索引的模式,并在站点中系统地解决这些模式,以增加这些页面被索引的几率。需要查找的模式包括重复内容问题、缺少入站内部链接、XML站点地图中没有包含内容、无意中没有索引或规范化,以及带有严重验证错误的HTML。
如果谷歌返回太多结果:
使用ScreamingFrog, deep爬行,SiteBulb或者类似的工具进行网站抓取,找出标题重复的页面,因为这些页面通常都有重复的内容。
确定是什么导致了重复,并删除它们。有各种各样的原因和解决方法,这些将构成这篇文章的大部分内容。
2. 优化站点地图,机器人。txt和导航链接
这三个要素是强指数化的基础,在其他地方已经深入讨论过了,但是如果我在这里没有提到,那就是疏忽了。
我无法强调一个综合的网站地图有多重要。事实上,我们似乎已经达到了这一点,它甚至比你的内部连接更重要。Gary Ilyes最近证实,即使是“头”关键词(相对于长尾关键词)的搜索结果也可能包含没有入站链接的页面,甚至没有内部链接。谷歌知道这些页面的唯一途径就是通过网站地图。
值得注意的是,谷歌和必应的指南仍然说页面应该至少有一个链接可以访问到,而网站地图也不会取消这一点的重要性。
同样重要的是要确保你的robots.txt文件是有效的,没有阻止谷歌从你的站点的任何部分你想被索引,并且声明你的站点地图的位置。txt文件是非常重要的,因为如果他们是关闭的,它可以导致谷歌停止索引你的网站根据Ilyes。
如果Googlebot由于服务器错误而无法访问robots.txt文件,它会完全停止爬行网站吗?pic.twitter.com/ExhB2Mu5rg
——加里”鯨理”不善地(@methode) 2月16日,2017年
最后,一个直观和逻辑的导航链接结构是良好的索引的必要条件。除了希望被索引的每个页面都应该至少有一个链接可以访问之外,良好的用户体验实践也是必不可少的。分类是关键。
例如,交互设计基金会的乔治·米勒的研究表明,人类大脑在短期记忆中一次只能存储大约7块信息。
我建议您的导航结构围绕这一限制进行设计,实际上,甚至可以将您的菜单限制在不超过5个类别,以使人们更容易使用它。每个菜单节五个类别和每个下拉列表五个子类别可能更容易导航。