5个实际数据混合例子,更聪明的SEO洞察力且听风吟网

有时我们面临的问题很难用孤立的工具提供的信息来回答。我们可以使用的一种强大的技术是将来自不同工具的数据组合起来,从而发现有价值的新见解。

您可以使用谷歌Data Studio来执行数据混合,但是请注意,它仅限于一种混合技术:左外连接(下面将讨论)。我将介绍在Python(或者SQL)中可以实现的更全面的数据混合技术列表。

让我们探索一些实际的SEO应用程序。

整体方法

为了混合不同的数据表(想想Excel中的电子表格),您需要一个或多个列,它们需要有共同之处。例如,我们可以将谷歌分析表中的列ga:landingPagePath与谷歌搜索控制台表中的页列匹配。

当我们以这种方式组合数据表时,我们有几个选项来计算结果表。

上面的维恩图说明了标准集理论用来表示结果集中元素的隶属度。下面我们来讨论每个例子:

完全外部连接:结果集中的元素包括源集中所有元素的联合。连接两边的所有元素都包含在内,如果它们共享一个键,则包含连接信息,否则将包含空格。

内连接:结果集中的元素包括源集中所有元素的交集。只包含双方共享密钥的元素。

左(外)加入:在结果集的元素包括源集合中的所有元素的交集,只出现在第一组的元素。所有元素左边,额外加入的信息只有一个关键与右边共享。

正确的(外部)加入:在结果集的元素包括源集合中的所有元素的交集,只出现在第二组的元素。所有元素在右边,额外加入的信息只有一个关键与左边共享。

我将在下面介绍这些连接的一个示例,但是这个主题通过操作更容易学习。请随意使用这个交互式教程进行练习。

下面是一些实际的SEO数据混合用例:

添加转换/收入数据到谷歌搜索控制台

谷歌搜索控制台是我必须有工具的技术SEO,但像我一样,你可能会沮丧,你不能有收入或转换数据的报告。通过混合谷歌Analytics的数据,这个问题相对容易解决。

两个数据表必须使用相同的日期范围。

首先,我们将使用一些示例谷歌分析数据建立一个panda DataFrame,并将其称为df_a。

包含ga:landingPagePath, ga:revenue, ga:transactions(过滤到谷歌有机搜索流量)的谷歌分析数据表

接下来,我们将使用一些示例搜索控制台数据设置一个DataFrame,并将其命名为df_b。

谷歌搜索控制台数据表包含页面,印象,点击,位置

现在,我们将使用Pandas merge函数将两者结合起来,首先使用一个内连接(两个集合的交集),然后使用一个外连接(union)。

您可以看到,当另一方没有共享密钥时,外部的、左侧的和右侧的连接包含丢失的数据(“NaN”)。

你现在可以用点击来划分交易来得到每个登陆页面的转化率,以及每个交易的收入来得到平均订单值。

相关的链接和域随着时间的增加而增加

越来越多的反向链接是否导致了流量的增加?你可以从谷歌搜索控制台导出最新的链接(包括Googlebot上次抓取的链接),然后将这个数据表与谷歌分析在同一时间段内的有机搜索流量相结合。

与第一个示例类似,两个数据表必须使用相同的日期范围。

以下是你需要的数据:

谷歌搜索控制台:链接页面,最后爬行

谷歌分析:ga:日期,ga:newUsers

公共列(用于合并函数):left_on: Last – climb, right_on: ga:date

您可以绘制交通和链接的时间。您可以选择将计算的域列添加到搜索控制台数据表中。这将允许您通过流量绘制链接域。

将新用户访问与内容长度相关联

你的内容文章的最佳长度是多少?您可以根据每个客户实际计算这个值,而不是根据经验给出答案。我们将结合数据表从您最喜欢的爬虫与性能数据从谷歌分析或谷歌搜索控制台。这样做的目的是通过字数对页面进行分组,并检查哪些组获得了最自然的搜索访问。

两个数据表必须使用相同的登录页集。

尖叫青蛙爬行:地址,字数

谷歌分析:ga:landingPagePath, ga:newUsers

常用列:left_on:Address, right_on: ga:landingPagePath

您需要创建单词计数容器,按容器分组,然后绘制流量

滚动至顶部