草蛋网衡量流行关键字研究工具的质量-顶级复刻表

曾经想知道一些流行的关键字研究工具的结果如何与谷歌搜索控制台提供的信息堆栈?本文将比较谷歌搜索控制台(GSC)的搜索分析数据与值得注意的关键字研究工具，以及您可以从谷歌中提取的内容。

另外，您还可以通过使用本文末尾的代码获得相关搜索，人们还可以从谷歌搜索结果中搜索数据结果。

这篇文章并不是一个科学的分析，因为它只包含了七个网站的数据。可以肯定的是，我们收集了一些比较全面的数据:我们选择了美国和英国的网站以及不同的垂直网站。

过程

1. 从定义不同的垂直网站行业开始

我们使用SimilarWeb的顶级类别来定义分组，并选择了以下类别:

艺术和娱乐。

汽车和汽车。

商业和工业。

家庭和花园。

娱乐和爱好。

购物。

参考。

我们从我们的网站样本中提取匿名数据，并能够从搜索引擎优化专家(SEOs) Aaron Dicks和Daniel Dzhenev那里获得未见数据。由于最初的探索性分析涉及到定量和定性的组件，所以我们希望花时间理解过程和细微差别，而不是做出扩展分析所需的让步。我们认为这种分析可以为内部seo提供一种粗略的方法，让他们更明智地决定哪种工具更适合他们各自的垂直领域。

2. 获取各生态位网站的GSC数据

数据从谷歌搜索控制台通过编程和使用木星笔记本获得。

Jupyter notebook是一个开源的web应用程序，它允许你创建和共享包含实时代码、方程式、可视化和叙述性文本的文档，以便每天从Search Analytics API中提取网站级别的数据，提供比目前谷歌web界面更大的粒度。

3.为每个网站收集单个内部页面的排名关键字

由于主页倾向于收集许多关键字，这些关键字可能与页面的实际内容在主题上相关，也可能与实际内容无关，所以我们选择了一个已建立并运行的内部页面，这样排名更可能与页面的内容相关。这也更现实，因为用户倾向于在特定内容的背景下做关键词研究。

上面的图片是一个首页排名的例子，针对各种与业务相关的查询，但与页面的内容和意图没有直接关系。

我们删除了品牌术语，并将谷歌搜索控制台查询限制为首页结果。

最后，我们为每一页选择了一个标题词。短语“head term”通常用来表示一个高搜索量的流行关键字。我们选择了搜索量相对较高的词条，尽管不是绝对最高的搜索量。在印象最深刻的查询中，我们选择了最能代表该页面的查询。

4. 在各种关键字工具的关键字研究，并寻找头部术语

然后，我们使用在上一步中选择的首词在三个主要工具中进行关键词研究:Ahrefs、Moz和SEMrush。

使用了“搜索建议”或“相关搜索”选项，并保留了所有返回的查询，而不管工具是否指定了建议与首词之间的关系的度量标准。

下面我们列出了来自每个工具的结果数量。此外，我们从谷歌搜索中提取了每个首词的“人们也搜索”和“相关搜索”(对应国家)，并添加了结果的数量，从而给出了谷歌免费搜索的基线。

**这个结果返回了5000多个结果!它被截断为1,001，这是可操作的最大值，并按递减的体积进行排序。

我们编译了每个工具返回的关键词的平均数量:

5. 处理的数据

然后，我们使用一些语言处理技术处理每个来源和网站的查询，将这些词转换为它们的根形式(例如，“running”到“run”)，删除常见的词，如“a”、“the”和“and”，扩展缩写，然后对这些词进行排序。

例如，这个过程会将“Raleigh的SEO代理公司”转变为“Raleigh SEO代理公司”。这通常会保留重要的单词并将它们按顺序排列，这样我们就可以比较并删除类似的查询。

然后，我们通过将唯一术语的数量除以该工具返回的术语总数来创建一个百分比。这应该告诉我们工具中有多少冗余。

不幸的是，它没有考虑拼写错误，而拼写错误在关键字研究工具中也会产生问题，因为它们会给结果添加额外的冗余(不必要的、不想要的查询)。许多年前，可以针对网站页面上常见的术语拼写错误。今天，搜索引擎在理解方面做得很好