首先要知道的是,GA 并不能真正识别和过滤所有 bot 流量,因为 GA 会根据:iab/abc international spiders & bots list 的名单设置 filter 机制, 不會自主添加更多 filter. 所以如果有需求让 GA 官方做一些 bot 流量排除, 要先和这个小组先联系。

现在可以实现爬取网页的 bot 和应用很多,这就导致识别 bot 流量变得更加困难。所以要大家擦亮自己的眼睛,多多去查看 GA 报告,根据用户行为找出这些非人为流量,并做数据清理。

先观察一下下面的报告:

报告

观察 Language = c 的数据列,仔细研究他的数据和其他维度:

  • 设备: Apple iPhone
  • 浏览器: Safari
  • 访问质量: (看起來這部分流量瀏覽質量很差)
    • Bounce Rate: ~ 100%
    • Page/Session: ~1
    • Avg. Session Duration: ~00:00:01
    • 浏览页面: 大部分是 index 页面

这就很明显的可以看出,这部分流量是非人为流量。那么可以对这部分进行 filter 操作,防止这样的数据再进来:

filter

对于已经收集到的数据,可以使用 Segment 做排除,这样查看数据的时候就不会被这部分数据干扰到。