他们说一张图片胜过千言万语——哇,他们是正确的!
今天,我将展示一些强大的方法来可视化你的网站结构,特别是当它涉及到那些获得链接的页面时;不过,我们还将讨论使用分析指标或其他第三方数据的此技术的其他应用。
您希望这样做的原因有很多,其中之一是为数据提供可视化上下文。正如我们将在下面看到的,数据的可视化表示可以帮助快速识别网站结构中的模式,这些模式在作为电子表格或原始数据时可能不明显。您还可以使用这些视觉效果向客户和其他利益相关者解释网站结构中发生了什么。
为了建立一个可视化的表示我们的网站结构,因为它涉及到传入的链接,我们将:
运行尖叫青蛙收集内部页面数据和链接结构。
将每个页面的反向链接数量添加到页面的度量中。
使用Gephi创建该数据的可视化表示。
对于那些不熟悉Gephi的人来说,它是一个开源的数据可视化工具——基本上,它把数据转换成交互式图片。
获取核心数据
不管你是想根据网站流量或其他指标来可视化你的网站结构,过程本质上是相同的。所以,让我们从…
收集你的内部链接结构
第一步是下载尖叫青蛙,如果你还没有安装它。对于网址少于500个的网站,免费版本就足够了;那些拥有大型网站的用户可能想要购买高级版本,但他们仍然可以使用免费版本来大致了解自己的网站结构。
现在,使用尖叫青蛙爬行你想地图的网站。您不需要收集图像、CSS、JavaScript等,因此爬行器配置应该如下面的屏幕截图所示。(然而,您需要根据自己的需要和站点结构来决定是否要抓取子域名等等。)
尖叫的青蛙
输入你想要检查的域,然后点击“开始”。爬行完成后,就该导出数据并稍微清理一下了。要做到这一点,只需去:
批量导出>响应码>成功(2xx)链接
下载完成后,打开文件并执行以下操作:
删除包含“所有链接”的第一行。
删除第一列“Type”。
将“Destination”列重命名为“Target”。
删除“源”和“目标”之外的所有列。
保存编辑过的文件。您可以任意命名它,但在本文中,我将把我的命名为work .csv。
清理尖叫青蛙数据在Excel
我强烈建议浏览您的源和目标列以寻找异常情况。例如,我为下面的屏幕截图抓取的站点包含大量页面上的锚链接。我快速搜索了目标栏中的标签并删除了它们,这样它们就不会影响我的链接流信息。
有了这个,我们剩下的电子表格应该看起来像这样:
分析这些数据本身就很酷——因此,我建议阅读Patrick Stox的文章“用Gephi简化页面排名和页面组的可视化”。
在他的文章中,Stox使用Gephi可视化网站页面之间的关系,并查看哪些页面是最强的(基于网站的内部链接图)。
Gephi模块化
你可以阅读他的文章来了解方向和描述,但简而言之,我们看到的是不同的页面“集群”(基于链接最频繁的页面——不完美但还不错),按颜色和内部链接的大小分组(链接最多的页面会更大)。
这些信息很方便,可以肯定的是。但如果我们想要更多呢?如果我们想要真正基于他们的站点部分来为页面着色,如果我们想要他们的大小由入站外部链接的数量?
要实现这一点,首先需要从谷歌搜索控制台下载顶级链接页面。如果你还没做到这一点,只需登录到你的搜索控制台账户,做到以下几点:
点击左侧导航中的“搜索流量”。
在打开的菜单中点击“链接到你的网站”。
点击“您链接最多的内容”栏下的“更多>>”。
和“下载这个表格。”
下载数据的惟一问题是,出于我们的目的,我们需要以域的形式显示url,而表只显示路径。要轻松处理这个问题,你可以简单地:
打开电子表格。
在URL路径之前插入一个新列a。
在单元格A3中放置你的域名https://www.yourdomain.com/(假设B2包含你的域名,奇怪的是,这是唯一一个完整显示的URL),这样你就不会创建https://www.yourdomain.com/https://www.yourdomain.com/。
用您最近添加的域双击单元格的右下角,将域复制到电子表格的底部。
从A和B列选择数据(