揭示SEO中5种常见网站日志文件分析方法见解

日志文件分析应该成为每个seo专业人士工具的一部分,但是大多数SEO从未进行过 。这意味着大多数SEO都缺少常规爬网工具无法产生的独特而宝贵的见解 。
让我们揭开Log File Analysis的神秘面纱,让它不再那么令人生畏 。如果您对日志文件的美好世界以及它们可以带给您的站点审核感兴趣,则本指南绝对适合您 。
什么是日志文件?日志文件是包含有关谁和什么向您的网站服务器发出请求的详细日志的文件 。每次漫游器向您的站点发出请求时,数据(例如时间,日期IP地址,用户代理等)都会存储在此日志中 。这些宝贵的数据可让任何SEO找出googlebot和其他抓取工具在您的网站上正在做什么 。与常规的爬网(例如,Screaming Frog SEO Spider)不同,这是真实的数据,而不是对网站爬网方式的估计 。它是网站爬网的准确概述 。
拥有这些准确的数据可以帮助您确定爬网预算浪费的领域,轻松查找访问错误,了解您的SEO努力如何影响爬网等等 。最好的部分是,在大多数情况下,您可以使用简单的电子表格软件来完成此操作 。
在本指南中,我们将重点放在Excel上以执行日志文件分析,但是我还将讨论其他工具,例如Screaming Frog鲜为人知的Log File Analyzer,它可以通过帮助您管理而使工作变得更加轻松和快捷 。更大的数据集 。
注意:拥有Excel以外的任何其他软件都无需遵循本指南,也可以避免使用Log Files 。
 如何打开日志文件将.log重命名为.csv当您获得扩展名为.log的日志文件时,实际上就像重命名文件扩展名为.csv并在电子表格软件中打开文件一样容易 。如果要编辑扩展名,请记住将操作系统设置为显示文件扩展名 。
如何打开拆分日志文件日志文件可以是一个大日志,也可以是多个文件,具体取决于站点的服务器配置 。某些服务器将使用服务器负载平衡在服务器池或服务器场中分配流量,从而导致日志文件被拆分 。好消息是它真的很容易组合,您可以使用以下三种方法之一来组合它们,然后按常规打开它们:

  1. 在windows中使用命令行,方法是Shift +右键单击包含日志文件的文件夹,然后选择“从此处运行Powershell”

揭示SEO中5种常见网站日志文件分析方法见解

文章插图
 
然后运行以下命令:
复制* .log mylogfiles.csv
现在,您可以打开mylogfile.csv,它将包含您的所有日志数据 。
或者,如果您是mac用户,请首先使用cd命令转到日志文件的目录:
cd文件/ MyLogFiles /
然后,使用cat或concatenate命令合并文件:
猫* .log> mylogfiles.csv
2)使用免费工具“ 日志文件合并”,合并所有日志文件,然后将文件扩展名编辑为.csv并正常打开 。
3)使用Screaming Frog日志文件分析器打开日志文件,就像拖放日志文件一样简单:
揭示SEO中5种常见网站日志文件分析方法见解

文章插图
 
分割字符串(请注意:如果您使用Screaming Frog的日志文件分析器,则不需要此步骤)
打开日志文件后,您需要将每个单元格中的繁琐文本分成几列,以便以后进行排序 。
Excel的“文本到列”功能在这里派上用场,就像选择所有填充的单元格(Ctrl / Cmd + A)并转到Excel>“数据”>“文本到列”并选择“定界”选项一样简单,定界符是空格字符 。
分离出来之后,您可能还想按时间和日期进行排序-您可以在“时间和日期”戳记列中进行排序,通常使用“:”冒号分隔符来分隔数据 。
您的文件应类似于以下文件:
揭示SEO中5种常见网站日志文件分析方法见解

文章插图
 
如前所述,请不要担心您的日志文件看起来并不完全相同-不同的日志文件具有不同的格式 。只要那里有基本数据(时间和日期,URL,用户代理等),您就可以使用它!
了解日志文件现在您的日志文件已准备好进行分析,我们可以深入了解并开始了解我们的数据 。日志文件可以采用多种格式处理多个不同的数据点,但是它们通常包括以下内容:
  1. 服务器IP
  2. 日期和时间
  3. 服务器请求方法(例如GET / POST)
  4. 要求的网址
  5. HTTP状态码
  6. 用户代理
如果您对具体细节感兴趣,可以在下面找到有关常见格式的更多详细信息: