精华内容
下载资源
问答
  • 做为网站拥有,我们应该关注IIS日志,从里面我们不仅仅可以看到网站的访问记录和搜索引擎抓取记录,还可以看到哪些网站盗链本站哪些资源、部分死链接以及其他出错信息。其实对于我们来说,蜘蛛抓取记录和相关...
  • 般情况下很多朋友都不在意IIS日志,有是因为购买虚拟主机不给提供,有是...做为网站拥有,我们应该关注IIS日志,从里面我们不仅仅可以看到网站的访问记录和搜索引擎抓取记录,还可以看到哪些网站盗链本...

    般情况下很多朋友都不在意IIS日志,有的是因为购买的虚拟主机不给提供,有的是提供了,但是还必须与服务器管理员联系才能得到。像新网的部分服务器ftp目录有这个文件,但是就是提示没权限查看也没有权限下载,还得必须给他们打电话才能要到。

    做为网站拥有者,我们应该关注IIS日志,从里面我们不仅仅可以看到网站的访问记录和搜索引擎的抓取记录,还可以看到哪些网站盗链本站的哪些资源、部分死链接以及其他出错信息。其实对于我们来说,蜘蛛抓取记录和相关出错信息是我们最想关注的。哪些蜘蛛什么时间抓取了什么页面,返回的什么结果,是否正常,都可以从日志里清楚的看到。

    下面说说IIS W3C格式日志中记录的字段及说明(一般都是选择的W3C格式日志)。

    date:发出请求时候的日期。
    time:发出请求时候的时间。注意:默认情况下这个时间是格林威治时间,比我们的北京时间晚8个小时,下面有说明。
    c-ip:客户端IP地址。
    cs-username:用户名,访问服务器的已经过验证用户的名称,匿名用户用连接符-表示。
    s-sitename:服务名,记录当记录事件运行于客户端上的Internet服务的名称和实例的编号。  
    s-computername:服务器的名称。
    s-ip:服务器的IP地址。
    s-port:为服务配置的服务器端口号。
    cs-method:请求中使用的HTTP方法,GET/POST。
    cs-uri-stem:URI资源,记录做为操作目标的统一资源标识符(URI),即访问的页面文件。
    cs-uri-query:URI查询,记录客户尝试执行的查询,只有动态页面需要URI查询,如果有则记录,没有则以连接符-表示。即访问网址的附带参数。
    sc-status:协议状态,记录HTTP状态代码,200表示成功,403表示没有权限,404表示找不到该页面,具体说明在下面。
    sc-substatus:协议子状态,记录HTTP子状态代码。
    sc-win32-status:Win32状态,记录Windows状态代码,参照chxwei博客上前几天发的日志“IIS中的sc-win32-status——Win32状态详细说明”的说明。
    sc-bytes:服务器发送的字节数。
    cs-bytes:服务器接受的字节数。
    time-taken:记录操作所花费的时间,单位是毫秒。
    cs-version:记录客户端使用的协议版本,HTTP或者FTP。
    cs-host:记录主机头名称,没有的话以连接符-表示。注意:为网站配置的主机名可能会以不同的方式出现在日志文件中,原因是HTTP.sys使用Punycode编码格式来记录主机名。 特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系 
    cs(User-Agent):用户代理,客户端浏览器、操作系统等情况。
    cs(Cookie):记录发送或者接受的Cookies内容,没有的话则以连接符-表示。
    cs(Referer):引用站点,即访问来源。

    附一:IIS日志的时间问题

    GMT时间就是英国格林威治时间,也就是世界标准时间,是本初子午线上的地方时,是0时区的区时,与我国的标准时间北京时间(东八区)相差8小时,即晚8小时。

    附二:HTTP状态代码:

    概括:

    1**:表示请求收到,继续处理
    2**:表示操作成功收到,分析、接受
    3**:表示完成此请求必须进一步处理
    4**:表示请求包含一个错误语法或不能完成
    5**:表示服务器执行一个完全有效请求失败

    详细代码说明:

    100——客户必须继续发出请求
    101——客户要求服务器根据请求转换HTTP协议版本

    200——交易成功
    201——提示知道新文件的URL
    202——接受和处理、但处理未完成

      203——返回信息不确定或不完整
    204——请求收到,但返回信息为空
    205——服务器完成了请求,用户代理必须复位当前已经浏览过的文件
    206——服务器已经完成了部分用户的GET请求

    300——请求的资源可在多处得到
    301——删除请求数据
    302——在其他地址发现了请求数据
    303——建议客户访问其他URL或访问方式
    304——客户端已经执行了GET,但文件未变化
    305——请求的资源必须从服务器指定的地址得到
    306——前一版本HTTP中使用的代码,现行版本中不再使用
    307——申明请求的资源临时性删除

    400——错误请求,如语法错误
    401——请求授权失败
    402——保留有效ChargeTo头响应
    403——请求不允许
    404——没有发现文件、查询或URl
    405——用户在Request-Line字段定义的方法不允许
    406——根据用户发送的Accept拖,请求资源不可访问 . 
    407——类似401,用户必须首先在代理服务器上得到授权
    408——客户端没有在用户指定的饿时间内完成请求
    409——对当前资源状态,请求不能完成
    410——服务器上不再有此资源且无进一步的参考地址
    411——服务器拒绝用户定义的Content-Length属性请求
    412——一个或多个请求头字段在当前请求中错误
    413——请求的资源大于服务器允许的大小
    414——请求的资源URL长于服务器允许的长度
    415——请求资源不支持请求项目格式
    416——请求中包含Range请求头字段,在当前请求资源范围内没有range指示值,请求也不包含If-Range请求头字段
    417——服务器不满足请求Expect头字段指定的期望值,如果是代理服务器,可能是下一级服务器不能满足请求

    500——服务器产生内部错误
    501——服务器不支持请求的函数
    502——服务器暂时不可用,有时是为了防止发生系统过载
    503——服务器过载或暂停维修
    504——关口过载,服务器使用另一个关口或服务来响应用户,等待时间设定值较长 特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系. 
    505——服务器不支持或拒绝支请求头中指定的HTTP版本

    来源:http://www.chxwei.com/article.asp?id=350




    本文转自温景良(Jason)博客园博客,原文链接:http://www.cnblogs.com/wenjl520/archive/2010/07/08/1773536.html,如需转载请自行联系原作者

    展开全文
  •  IIS日志中记录了,网站页面所有访问记录,包括时间、获取方法、文件URL、访问者IP,以及协议状态(200是正常)。(更多信息可查看百度百科 IIS日志)  具体方法为:将IIS日志导入数据库中,使用SQL查询...

    背景:需要给客户查询哪些IP访问了软件。并查出IP的地址。只能通过查IIS的日志数据了。

    以下方法需要知识:SQL

     

              IIS日志中记录了,网站页面的所有访问记录,包括时间、获取方法、文件的URL、访问者IP,以及协议状态(200是正常)。(更多信息可查看百度百科 IIS日志

             具体方法为:将IIS日志导入数据库中,使用SQL查询语句分析日志中统计数据。方法很简单,仅供参考。

    一、      获取表结构

    将少量数据复制到excel表中,删除无效数据,然后使用SQL导入向导,导入少量数据,然后将数据删除。注意导入的excel的第一行数据会被判断为列字段。

    二、      使用bulk insert语句导入完整日志数据

    打开日志文件ex120629.log(举例),将无用的说明数据和第一行数据删除,执行下面的语句

    BULK INSERT test.iis29

       FROM 'd:\ ex120629.log'

       WITH 

          (

             FIELDTERMINATOR ='  ',

             ROWTERMINATOR =' \n'

          )

     


     注:导入过程中,有可能会会提示数据超出格式范围,手动修改相关的字段类型为nvchar(MAX),即可。BULK Insert 详细请参考 微软知识库

    三、      查询访问记录的统计结果

    1.         查询每个IP的访问次数,并按照访问次数排序,执行下面的SQL语句:

    select [c-ip] ,COUNT([c-ip]) b  from iis29

    group by [c-ip]

    order by b desc

     

     


     

    2.         查询每个IP访问单个页面的数据统计,按照访问次数排序,执行下面的SQL语句:

    select [c-ip] ,[cs-uri-stem],count([c-ip]) b  from iis29

    group by [c-ip],[cs-uri-stem]

    order by b desc

     

    同时也编写了一个工具,可以到下载中心下载《IIS日志查看器》。

     

    展开全文
  • 此应用程序用于保存访问者会话的历史记录,而不是访问者的当前状态。 要求 安装了Django的 下载 pip install django-tracking2 建立 将tracking添加到项目的INSTALLED_APPS设置中: INSTALLED_APPS = ( ...
  • 一般情况下很多朋友都不在意IIS日志,有是... 做为网站拥有,我们应该关注IIS日志,从里面我们不仅仅可以看到网站的访问记录和搜索引擎抓取记录,还可以看到哪些网站盗链本站哪些资源、部分死链接以及其他出错
    一般情况下很多朋友都不在意IIS日志,有的是因为购买的虚拟主机不给提供,有的是提供了,但是还必须与服务器管理员联系才能得到。像新网的部分服务器ftp目录有这个文件,但是就是提示没权限查看也没有权限下载,还得必须给他们打电话才能要到。

      做为网站拥有者,我们应该关注IIS日志,从里面我们不仅仅可以看到网站的访问记录和搜索引擎的抓取记录,还可以看到哪些网站盗链本站的哪些资源、部分死链接以及其他出错信息。其实对于我们来说,蜘蛛抓取记录和相关出错信息是我们最想关注的。哪些蜘蛛什么时间抓取了什么页面,返回的什么结果,是否正常,都可以从日志里清楚的看到。

      下面说说IIS W3C格式日志中记录的字段及说明(一般都是选择的W3C格式日志)。

      date:发出请求时候的日期。
      time:发出请求时候的时间。注意:默认情况下这个时间是格林威治时间,比我们的北京时间晚8个小时,下面有说明。
      c-ip:客户端IP地址。
      cs-username:用户名,访问服务器的已经过验证用户的名称,匿名用户用连接符-表示。
      s-sitename:服务名,记录当记录事件运行于客户端上的Internet服务的名称和实例的编号。
      s-computername:服务器的名称。
      s-ip:服务器的IP地址。
      s-port:为服务配置的服务器端口号。
      cs-method:请求中使用的HTTP方法,GET/POST。
      cs-uri-stem:URI资源,记录做为操作目标的统一资源标识符(URI),即访问的页面文件。
      cs-uri-query:URI查询,记录客户尝试执行的查询,只有动态页面需要URI查询,如果有则记录,没有则以连接符-表示。即访问网址的附带参数。
      sc-status:协议状态,记录HTTP状态代码,200表示成功,403表示没有权限,404表示找不到该页面,具体说明在下面。
      sc-substatus:协议子状态,记录HTTP子状态代码。
      sc-win32-status:Win32状态,记录Windows状态代码,参照chxwei博客上前几天发的日志“IIS中的sc-win32-status——Win32状态详细说明”的说明。
      sc-bytes:服务器发送的字节数。
      cs-bytes:服务器接受的字节数。
      time-taken:记录操作所花费的时间,单位是毫秒。
      cs-version:记录客户端使用的协议版本,HTTP或者FTP。
      cs-host:记录主机头名称,没有的话以连接符-表示。注意:为网站配置的主机名可能会以不同的方式出现在日志文件中,原因是HTTP.sys使用Punycode编码格式来记录主机名。
      cs(User-Agent):用户代理,客户端浏览器、操作系统等情况。
      cs(Cookie):记录发送或者接受的Cookies内容,没有的话则以连接符-表示。
      cs(Referer):引用站点,即访问来源。

      附一:IIS日志的时间问题

      GMT时间就是英国格林威治时间,也就是世界标准时间,是本初子午线上的地方时,是0时区的区时,与我国的标准时间北京时间(东八区)相差8小时,即晚8小时。

      附二:HTTP状态代码:

      概括:

      1**:表示请求收到,继续处理
      2**:表示操作成功收到,分析、接受
      3**:表示完成此请求必须进一步处理
      4**:表示请求包含一个错误语法或不能完成
      5**:表示服务器执行一个完全有效请求失败

      详细代码说明:

      100——客户必须继续发出请求
      101——客户要求服务器根据请求转换HTTP协议版本

      200——交易成功
      201——提示知道新文件的URL
      202——接受和处理、但处理未完成
      203——返回信息不确定或不完整
      204——请求收到,但返回信息为空
      205——服务器完成了请求,用户代理必须复位当前已经浏览过的文件
      206——服务器已经完成了部分用户的GET请求

      300——请求的资源可在多处得到
      301——删除请求数据
      302——在其他地址发现了请求数据
      303——建议客户访问其他URL或访问方式
      304——客户端已经执行了GET,但文件未变化
      305——请求的资源必须从服务器指定的地址得到
      306——前一版本HTTP中使用的代码,现行版本中不再使用
      307——申明请求的资源临时性删除

      400——错误请求,如语法错误
      401——请求授权失败
      402——保留有效ChargeTo头响应
      403——请求不允许
      404——没有发现文件、查询或URl
      405——用户在Request-Line字段定义的方法不允许
      406——根据用户发送的Accept拖,请求资源不可访问
      407——类似401,用户必须首先在代理服务器上得到授权
      408——客户端没有在用户指定的饿时间内完成请求
      409——对当前资源状态,请求不能完成
      410——服务器上不再有此资源且无进一步的参考地址
      411——服务器拒绝用户定义的Content-Length属性请求
      412——一个或多个请求头字段在当前请求中错误
      413——请求的资源大于服务器允许的大小
      414——请求的资源URL长于服务器允许的长度
      415——请求资源不支持请求项目格式
      416——请求中包含Range请求头字段,在当前请求资源范围内没有range指示值,请求也不包含If-Range请求头字段
      417——服务器不满足请求Expect头字段指定的期望值,如果是代理服务器,可能是下一级服务器不能满足请求

      500——服务器产生内部错误
      501——服务器不支持请求的函数
      502——服务器暂时不可用,有时是为了防止发生系统过载
      503——服务器过载或暂停维修
      504——关口过载,服务器使用另一个关口或服务来响应用户,等待时间设定值较长
      505——服务器不支持或拒绝支请求头中指定的HTTP版本

      来源:http://www.chxwei.com/article.asp?id=350
    展开全文
  • Nginx软件会把每个用户访问网站的日志信息记录到指定日志文件里,供网站提供分析用户浏览行为等,此功能由ngx_http_log_module模块负责。对应官方地址为:...

    Nginx访问日志(access_log)

    Nginx访问日志介绍

    Nginx软件会把每个用户访问网站的日志信息记录到指定的日志文件里,供网站提供者分析用户的浏览行为等,此功能由ngx_http_log_module模块负责。对应的官方地址为:http://nginx.org/en/docs/http/ngx_http_log_module.html

    访问日志参数

    Nginx的访问日志主要由两个参数控制。

    Nginx日志格式中默认的参数配置如下:

     log_format  main  '$remote_addr - $remote_user$time_local]"$request" '
    '$status $body_bytes_sent "$http_referer" '
    '"$http_user_agent" "$http_x_forwarded_for"'

    Nginx记录日志的默认参数配置如下:

    access_log  logs/access.log  main;

    访问日志配置说明

    1.日志格式的定义说明
    先来看其语法:

    定义语法: log_format name string ……;

    其配置位置在http标签内。
    日志格式说明如下:

    log_format  main  '$remote_addr - $remote_user$time_local]"$request" '
    '$status $body_bytes_sent "$http_referer" '
    '"$http_user_agent" "$http_x_forwarded_for"'

    其中,log_format为日志格式关键参数,不能变。
    main是为日志格式指定的标签,记录日志时通过这个main标签选择指定的格式。其后所接的所有内容都是可以记录的日志信息,具体见表5-5。注意,所有的日志段以空格分隔,一行可以记录多个,不同列的意义:

    在没有特殊要求的情况下,采用默认的配置即可,更多可以设置的记录日志信息的变量见:
    http://nginx.org/en/docs/http/ngx_http_log_module.html

    2.记录日志的access_log参数说明
    下面是有关access_log参数的官方说明。
    语法如下:

    access_log path[format[buffer=size[flush=time]][if=condition]];
    access_log path format gzip[=level][buffer=size][flush=time][if=condition];
    access_log syslog:server=address[,parameter=value][formatif=condition]];

    buffer=size为存放访问日志的缓冲区大小,flush=time为将缓冲区的日志刷到磁盘的时间,gzip[=level]表示压缩级别,[if=condition]表示其他条件。一般的场景中,这些参数都无须配置,极端优化时才可能会考虑这些参数。

    access_log off中的off,表示不记录访问日志。
    默认配置:access_log logs/access.log combined;
    放置位置在http、server、location、if in location、limit_except中。

    展开全文
  • IIS日志是每个服务器管理都必须学会查看,服务器一些状况和访问IP来源都会记录在IIS日志中,所以IIS日志对每个服务器管理非常重要,seoer也不例外,这点同时也可方便网站管理人员查看网站的运营情况。...
  •  IIS日志是每个服务器管理都必须学会查看,服务器一些状况和访问IP来源都会记录在IIS日志中,所以IIS日志对每个服务器管理非常重要,seoer也不例外,这点同时也可方便网站管理人员查看网站的运营情况。...
  • 当前网站分析中对访客行为追踪,最常用方式Web服务器日志和JavaScript页面标记两种方式。  Web服务器日志 基本原理 用户对网页提出一次请求,就称为一次命中。通过Web服务器日志软件,将请求信息记录在...
  • 每一个网站开发者和所有,想知道他的网站的完整的状态访问信息,目前互联网中有很多分析工具,本文选取了10款最好的分析工具,可以为你提供实时访问数据。 1.Google Analytics 这是一个使用最广泛的访问统计...
  • 网络分析工具可以帮助你收集、预估和分析网站访问记录,对于网站优化、市场研究来说,是个非常实用的工具。每一个网站开发者和所有,想知道他的网站的完整的状态访问信息,目前互联网中有很多分析工具。
  • cookie是什么 ...当下次你再访问同一个网站,Web服务器会先看看有没有之前在该网站保存Cookie资料,有话,就会依据Cookie里内容来判断使用,送出特定网页内容给你。 cookie作用: c...
  • 每一个网站开发者和所有,想知道他的网站的完整的状态访问信息,目前互联网中有很多分析工具,本文选取了10款最好的分析工具,可以为你提供实时访问数据。 1. Google Analytics 这是一个使用最广泛的访问...
  • 对于一个合格SEOer来说,要想分析一个网站的目前状态,首先要学会就是如果查询IIS日志,因为网站的一些搜索引擎蜘蛛爬寻状况和访问IP来源都会记录在IIS日志中,所以IIS日志对每个SEOer或网站管理非常重要...
  • 每一个网站开发者和所有,想知道他的网站的完整的状态访问信息,目前互联网中有很多分析工具,本文选取了20款最好的分析工具,可以为你提供实时访问数据。 1. Google Analytics 这是一个使用最广泛的访问...
  • 互,记录浏览者的基本信息,通过后台审核确定其信息的有效性。 5、商品分类显示模块 商品分门别类、分层次展示不仅方便浏览者迅速找到自己的目标商品,同时增强了网站的亲和力。该模块 是浏览者与网站接触最频繁...
  • 而在很多场景下,浏览网页时,网站服务器要记录访问者的浏览轨迹(前后操作之间要连续才叫轨迹);登陆的网站登陆一次可以访问多个资源(访问多个资源不必每次验证账号密码,使用前面的状态)。如何记录来访者的...

空空如也

空空如也

1 2 3 4 5 ... 17
收藏数 339
精华内容 135
关键字:

网站记录访问者的状态