原文来源:SparkToro

作者:Vlado Pavlik

2022.7-8月,SparkToro(通过Twitter、email newsletter、LinkedIn、Facebook和Instagram等多个平台)招募志愿者分享其网站的Google Analytics 数据。过1,000名参与者与我们分享了他们网站的流量数据。接着我们收集了四家第三方网站流量估计工具(即SEMRush、Datos、SimilarWeb和Ahrefs*)提供的数据,并将其与Google Analytics 报告的数据进行比较。此外,我们还收集了Moz域名权重数据和Google Trends 的品牌搜索量数据。所有这些数据都基于同一时间范围:2020年6月至2021年6月,为期一年。


*在收集指标并发布这篇文章后,有人指出,Ahrefs的流量估算未包含所有流量来源,而仅包含自然搜索访问数据,我们在最初撰写时并未说明或进一步确认。抱歉!


我们有两个目标:


1️⃣ 找到一个可靠的第三方平台,其估计的流量数据与 GA 数据相关性高且误差较小。这样我们就能(希望如此)将这些数据应用到 SparkToro后续的的受众调研产品中。

2️⃣ 与营销从业者们分享我们的研究成果,以便其他营销人员和分析师能在接下来的工作中更好地利用这些信息和工具。


先说结论,坏消息是:我们认为目前这些第三方网站估计都不够准确,无法应用在SparkToro的后续项目中。我们希望未来这个情况能有所改善,也希望这篇博客可以推动平台们进步。


但也有一个好消息。经过广泛的数据收集、数据整理、MySQL和Excel分析,我们有很多有趣的数据可以与大家分享。接下来就让我们一起来看看吧。


01
哪家第三方网站
估计工具与GA的数据误差小于30%?

如果只用单一方式来呈现数据,结果可能会太片面。因此,在这篇文章中,我们将网站规模划分成了六个梯队来进行多维度的对比。其中,如果我得选择一个最喜欢的,且未来几年我将经常提及的(直到有人进行更全面的研究),那就是下面这张分析图表:

为了得到第三方工具最佳运行状态下的结果,我们完成了以下四个操作:

  • 我们选择使用GA的 "用户 "(Users)指标,该指标可以衡量曾被称为 "独立访客(Unique Visitors) "的相关数据。我们发现,这个指标与第三方平台的数据最为吻合,对那些只估计总访问量/所有会话数据的平台而言也是如此。

  • 我们使用了每个平台的以下指标(这些指标,经测试,与GA指标的相关性最高)。SEMRush的 "访问量"(Visits),从他们工具的网页界面中提取,设置如下:(根域名),(所有设备),(全球),(偏差范围:关闭)【(root domain), (all devices), (worldwide), (deviation range: OFF)】;Ahrefs的 "流量表现"(traffic performance),包括所有子域名,每月流量,平均自然流量(all subdomains, monthly volume, avg. organic traffic);Datos的每月会话(包含所有流量,由Datos团队发送);SimilarWeb的 "总访问量"( total visits),我们采用的是全球范围数据,由SimilarWeb团队发送给我们;Google Trends的 "平均兴趣时间"(Average Interest Over Time),从工具的网页界面收集;以及Moz的 "域名权重 "(Domain Authority)和 "链接根域名 "(Linking Root Domain)估计,我们从其API提取。

  • 有1,053 个网站与我们共享了流量数据,但在分析前我们先对这些数据进行了筛选和清理,同时排除掉了没有第三方平台数据的网站、以及任何在其 GA 报告的流量中可能存在差异或错误的网站(例如,如果他们的网站或部分页面中删除了 GA 收集器,可能造成月份缺失或不全)。

  • 我们还从剩余的数据中删除了几十个异常值,这使得相关性和准确性的范围变得更加一致。对于下面的数据和图表,我们采用了641个网站提供给我们的共7,692项独特数据进行比较(12个月X 641个网站)。


在上面的图表中,每个第三方数据平台也呈现了其每月流量数据与GA提供的数据误差在30%以内的次数百分比。重要的是,我们还根据网站的流量高低对其进行了细分,最终呈现为如下六个梯队:

  • 平均每月250,000+ GA 用户的网站(641 个网站中,共46 个属于此类)

  • 平均每月100,000-250,000 GA 用户的网站(641 个网站中,共39个属于此类)

  • 平均每月50,000-100,000 GA 用户的网站(641 个网站中,共 91 个属于此类)

  • 平均每月 25,000-50,000 GA 用户的网站(641 个网站中, 共96 个属于此类)

  • 平均每月 5,000-25,000 GA 用户的网站(641 个网站中, 共 186 个属于此类)

  • 平均每月 <5,000 GA 用户的网站(641 个网站中, 共 183个属于此类)

我们相信这些结果是真实且有用的。我们调研的网站规模已经足够大,即使我们将样本量增加10倍甚至100倍(比如收集10W+网站的GA数据),最终结果可能也差不多。


值得注意的是,尽管SimilarWeb是明显的赢家,但还是有一个例外:它在小型网站(根据GA的定义,小型网站指的是每月访问者少于5,000人的网站)的流量估计中表现最差。如果它在这方面能有所改进,它将在其他分析中也能占据明显优势。但,但当我们采用其他指标来评判时,情况发生了很大的变化。


02
第三方工具
与GA用户之间的相关性

我们介绍的第二个指标是大多数估计人员都很熟悉的一个指标:相关系数。如果你很早之前就已经关注了我的博客,你可能记得我曾经介绍过谷歌排名和Moz指标之间的相关性。


这个分析有些不同。


为什么呢?因为所有的第三方平台和GA(我们正在与之比较)都试图测量同样的东西:网络流量。机器学习指标与有数百或数千输入的算法是不冲突的。下面的图表简单地展示了SEMRush、Datos、SimilarWeb和Ahrefs的流量指标与Google Analytics在相同时间框架内对相同网站收集的流量指标的对比。

上图显示了各个平台与Google Analytics每个月报告的用户指标之间的原始相关性。范围从0(无相关性)到1.0(完美相关性),在641个网站共7692项每月数据中,SEMRush表现最好,为0.790,紧随其后的是Datos的0.720,然后是SimilarWeb的0.659,以及Ahrefs的0.504(注意,Ahrefs只测量有机搜索流量;当他们与Google Search Console的指标进行相关性分析时,结果是~0.75)。


如果你想了解的话,我们还选择了包括Moz的域名权重(Domain Authority)和Google Trends的"平均兴趣时间"(Average Interest Over Time)指标。这两个指标都不是用来衡量搜索流量的,但两者仍然具有相关性,而且我们知道营销人员有时会使用它们作为相对流量水平的参考指标。这份报告有助于澄清它们是否有助于衡量搜索流量。


但是,关联性只是衡量这些指标性能的一种方式。为了继续挖掘这些指标的价值,我们决定研究大家都比较感兴趣的问题:"这些第三方平台的数据到底存在多大的偏差?"


03
第三方指标
的流量估算范围

在下面的图表中,你会看到每个数据提供平台的正负值。这些正负值代表了它们与GA数据的偏差,即每个平台高估或低估了网站流量的最大值。由于数据较多,这张图只能看第一梯队(GA估计用户超过25万/月的网站)的数据。

下方的图表比较了所有四个平台在五个流量较低的梯队的表现。

在这些数据中,我们看到了平台之间一些很有意思的差异。其中最突出的几个是:

  • 对于每月 <50K GA Users的网站来说,Ahrefs的误差值最小

  • 对于每月5K-100K GA Users的网站来说,SimilarWeb 的实力突出

  • 对于GA Users处于第一梯队的网站,所有平台的表现都不尽人意,出现了较大误差。

这些不是平台和GA的数据之间的平均方差;它们显示了最大误差和最小误差。上面的图回答了"所有第三方平台在整个数据集的大方向上有多大偏差?”,而这些图表回答的是"这些数据可能存在多大偏差?"


如你所见,偏差值可能高达+/-100%甚至更多,这意味着第三方平台可能会声称某网站在6月获得了50,000次访问,但它实际上却仅有5,000或高达100,000次访问。事实上,这些工具在小型和中型网站表现出了更高的准确性,但差异也可能很大。


04
第三方工具
出现误差的频率如何?

最后一个要回答的问题是——是否不同平台提供的流量数值常常在同一方向上存在偏差?下图比较分析了每个平台在六个梯队的表现来较为全面地回答这个问题。

一些有意思的发现:

  • Ahrefs 几乎总是低估数据(这也说得通,毕竟,他们只估计自然搜索流量,而不是所有流量)但是对于每月5000以下 GA用户的网站,它又总是高估数据。

  • Datos 和 SimilarWeb 在高估和低估之间相当平衡。

  • SEMRush 高估的次数远远多于低估的次数

这轮分析并没有告诉我们方差值,但好在我们已经在上述分析中涵盖了这一点。


研究思考:


我们进行这次数据分析是为了找到一个(或几个)数据值得信赖的平台,哪怕结果并不完美。在过去的几年里,我们的首选是SimilarWeb,但也非常看重Eli Goodman和Datos的团队,以及Tim Soulo和他在Ahrefs的伙伴们。


但是,至少当涉及到估计一个网站在某个月得到多少流量,或者流量是上升还是下降这个问题上,我与Martin MacDonald的看法是一致的:

对于某些范围的流量,一些平台是相当不错的。但是,目前没有哪个第三方工具的数据是一贯准确的,不足以让大家完全相信它们的数据。相关性并不是很糟糕。误差范围也没有特别大(访问量最大的站点除外)。这些数据并不是来源于猜测,很显然这些平台都拥有可靠数据源和流程的支持。只是数据还没有精准到那个程度。


如何使用这些数据?


对于大型网站,建议使用SimilarWeb的估计数据。在大部的情况下,相比于其它平台,它提供的数据误差都在30%以内。


对于小型网站,Datos的数据表现是最强的。由于他们是一个刚成立不久平台(<2年),希望在几年后,如果我们重新做这份评估,它可以成为行业领导者。



不得不说,我们对Google Trends品牌搜索兴趣(brand search interest)与流量的相关性如此之差感到震惊。这无疑是本次研究中,最让我们惊讶的一个。对我们来说,接下来需要马上采取的措施是:停止使用Google Trends来预测一个网站有多受欢迎。事实证明,一些热门品牌的网站并没有获得多少流量,而一些品牌搜索兴趣较低的网站却获得了很多流量。



点赞(1) 打赏

评论列表 共有 0 条评论

暂无评论

服务号

订阅号

备注【拉群】

商务洽谈

微信联系站长

发表
评论
立即
投稿
返回
顶部