精华内容
下载资源
问答
  • 2019年就这么匆匆过去了,就在前几天国家电影局发布了2019年中国电影市场数据,数据显示去年总票房为642....不过作为名严谨求实的数据分析师,我从官方数据中看出了一点端倪:国产票房增幅都已经高达8.65%了,为什...

    2019年就这么匆匆过去了,就在前几天国家电影局发布了2019年中国电影市场数据,数据显示去年总票房为642.66亿元,同比增长5.4%;国产电影总票房411.75亿元,同比增长8.65%,市场占比 64.07%;城市院线观影人次17.27亿,同比增长0.64%。

    看上去似乎是一片大好对不对?不过作为一名严谨求实的数据分析师,我从官方数据中看出了一点端倪:国产票房增幅都已经高达8.65%了,为什么观影人次增长不足1%?

    到底为什么会出现这样的现象,最好的办法就是从数据中找答案。我们说干就干,按照老规矩,先用python爬取数据、再用BI进行数据分析,最终事情的真相就会显现在我们面前。

    一、分析目的和分析指标

    首先明确我们数据分析的目的,根据2019年电影的数据分析国内电影市场,主要是为了找到票房与观影人次的关系。

    怎么去衡量一部电影的好坏呢?懂电影的人应该都知道这么几个指标:“电影票房”、“票房占比”、“上座率”、“排片比”、“评分”等等,其中我们的数据源就用猫眼电影吧,但是因为猫眼评分门槛很低,可能充斥着很多水军,所以这次就不用“评分”这个指标了。

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    二、python爬取

    下面就要开始爬取数据了,因为猫眼电影的网页结构比较简单,爬取操作比较简单,所以这里我就不详细展示了,只说几步需要注意的地方就行。

    注:源代码可以在后台私信回复我 “电影” 获得!

    1、先看看结构

    从猫眼电影上可以看到我们要爬取的网页,首先要提取出这个网页的信息,在了解了大体的情况之后,就右键选择查看网页的源代码,看一下我们需要爬取的数据信息在源代码中的什么地方。

     

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    2、伪装成浏览器进行数据请求

    这个方法就是老生常谈的事情了,这里不细讲了,在发送请求前加上headers参数即可。

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    3、提取数据

    猫眼里的电影票房等都是加密后的字体,因此我们需要解密字体。虽然字符的编码是变化的,但是对象是不变的。那么我们可以通过第一次下载一个字体文件origin.ttf,并把对应编码的字体写出来,当第二次从网上重新下载一个字体文件online_base64.ttf 的时候,可以对比对象信息,如果对象是一样的,那么就把第一次编码对应的文字赋值给第二次的编码,这样即可。

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    4、主程序调用保存在excel中

    首先需要建立一个空列表,将所有的数据添加到里面去。在之前的提取数据那个函数的时候,将print(data),改写成yield data,将所有的数据添加到一个列表之后就可以保存数据了。

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    5、需要注意的地方

    • 下载一个基本字体路径,找到它对应的数字及其编码
    • 每一次爬取网页时,都要先下载该网页的字体文件,然后与基本字体文件作对比,获得爬取网页的数字对应编码。

    三、BI分析

    有了源文件,我们就可以进行BI分析了,至于为什么不用python是因为比较麻烦,像我们如果要做二八分析模型,代码写起来还是比较麻烦的,日常共工作中不太能满足需求。

    所以一般来说我现在都是用专业的BI工具进行数据分析。目前市场上的BI工具十分繁多,但是性能也参差不齐,这里我就以国产BI工具的优秀代表FineBI为例。

    注:想要获取finebi下载地址,可以后台私信回复“电影”获得!

    1、数据连接

    首先导入我们需要分析的数据,finebi可以连接Excel,CSV,XML,以及各类数据库,这里因为有了python爬取到的excel表,所以直接选择excel导入即可。

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    2、数据加工

    我们爬取到的数据可能需要第二次加工,比如脏数据处理、数据合并、过滤等等,FineBI是通过自助数据集的方式,根据需求对原数据进行再加工处理,新建一个用于分析的数据集,再处理包括选择字段、过滤、分组汇总、新增列、字段设置、排序、合并的操作。

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    3、数据可视化

    因为本次涉及到的指标比较简单,所以基本通过FineBI拖拽数据字段即可呈现可视化。

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    四、结论分析

    不说废话,先放结论:

    • 国内电影市场接近饱和,今年的成绩是虚假繁荣;
    • 头部效应加剧,大多数电影票房惨淡,市场成绩不佳;
    • 票房的增长基本是靠电影价格拉动起来的,观影人次基本没有增长,电影寒冬到来;

    1、票房排名前二十的电影

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    今年票房前二十名中一半以上都是国产电影,看似繁荣,但其实从上图的区间柱状图中能够看出,《哪吒》、《流浪地球》、《复联4》三部电影属于第一梯队,票房在40亿以上;《我和我的祖国》、《中国机长》、《疯狂的外星人》、《海王》属于第二梯队,票房在20-30亿左右;剩下的电影中基本在20亿以下,排名20的《银行补习班》只有8亿。

    整体来说,去年国内电影市场爆款较多,但是整体呈现阶梯状,断崖较多,大部分集中于前五名之中,大体上符合二八法则。

    2、票房的帕累托模型

    为了搞清是否真的符合帕累托法则,我特意用FineBI加入了一条票房累积百分比:

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    结果很明显,排名前20%的电影占据了整个市场80%以上的票房总量,也就是说,去年国内市场的票房总量基本上靠着几大爆款电影撑起来的,票房分布越来越集中绝对不是一件好事,这意味大多数的电影成绩惨淡,根本没有生存空间。

    3、票房占比、排片率与票房的关系

    • 票房占比:电影票房收入占总收入的比例,票房占比越高,说明电影质量越好,人们越想看;
    • 排片率:排片率高、票房低就是烂片,而排片率低、票房高的电影才是黑马;

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    这张图我们可以跟排名前二十的柱状图对比一下,真正意义上高票房、高票房占比、低排片率的黑马电影有哪些呢?答案只有一部《流浪地球》。

    《哪吒》的排片率高是因为上映同期没有什么优质电影与之竞争,所以《哪吒》的成功一半要归功于人和,一半要归功于天时;《疯狂外星人》的表现中规中矩,《海王》属于典型的商业片,《我和我的祖国》属于特殊情况,不能一概而论。

    4、上座率与票房的关系

    • 上座率:即一部影片获得观众人次的多少,优秀的影片上座率就高,反之则低

    python爬取百部电影数据,我分析出了一个残酷的真相

     

    为了方便对比,我在图中加入了一条平均上座率的警戒线,其中上座率最高的是《我和我的祖国》、《我为你牺牲》,原因就不说了,大家应该都明白;其中比较奇怪的是《飞驰人生》、《新喜剧之王》、《攀登者》,上座率非常高,票房成绩却不如人意,应该是得益于其导演、主演的号召力。

    《流浪地球》上座率在平均值以上,无论从哪个角度看都是一部好电影,无懈可击。

    值得欣慰的是,上座率排名靠前的基本都是国产电影,看的出来国外电影尚不能满足大多数人的口味。

    5、做点其他分析

    python爬取百部电影数据,我分析出了一个残酷的真相

    电影类型与上座率的关系

    喜剧电影一骑绝尘,动画电影黑马突起,科幻电影方兴未艾,惊悚、悬疑、历史等小众题材的电影仍然惨淡无比。

     

    python爬取百部电影数据,我分析出了一个残酷的真相

    颜色越深代表上座率越高,字体越大代表票房越高

    陈凯歌现在虽然经常被烂片之王所诟病,但是不得不说他的成绩还是很不错的,另外像宁浩、韩寒、郭帆、陈国辉等人都是国产电影的希望。

    最后别忘了,python源代码和BI下载地址,都可以私信我“电影”获得!

    展开全文
  • 网站分析05——流量分析

    千次阅读 2019-05-14 23:02:42
    笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中有趣的事情。 我的公众号为:livandata ...

    笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中有趣的事情。

    我的公众号为:livandata

    流量是产品分析的第一步,也是常规运营的主要数据基础,流量的来源以及流向分析是主要的两个分析方向:

    在流量的来源分析中,常见的来源主要有三个,呈现可画图如下,当数据进入网站后又会经历首页、导航页和详细页的流动:

                                

    在网站上部的三组来源中,主要是分清楚哪个数据来自于哪里,对来源渠道进行细分,这一细分主要是通过url进行判断,其中存在的refer_url来判断来源,判断清楚后,对应的访问信息就会进入到网站中,进入到网站中后,需要做的就是理清楚网站本身的页面树和行为流,在这两个结构的基础上,分析客户访问过程中存在的问题。

    下面我们详细的描述这一流程。

    一、流量来源介绍:

    1)直接流量:

    用户直接访问到产品页面,而非从其他渠道过来的。从流量日志数据中的判断条件是没有来源页的链接(即没有reffer_url)。一般地,用户使用APP访问、WEB端收藏网址后从收藏夹点击链接访问、从浏览器直接输入网站地址后访问、点击别人分享的链接访问、扫描线下推广的二维码后访问等访问类型都属于直接访问;

    2)搜索流量:

    主要是来自于google和百度的搜索来源,分为两种:SEO与SEM。

    对于SEO流量:可通过搜索来源页链接(即reffer_url),来判断流量来源,如从百度搜索来的流量来源链接中包括'%http://baidu.com/s?%',从搜狗搜索来的流量中来源链接包括'%.http://sogou.com/link?%'(上述示例中的%为模糊匹配);

    对于SEM流量:可通过链接的配置参数来区分,由于SEM为付费推广,广告投放人员需要对投放的链接配置参数进而跟踪效果,Google提供了5个参数(source、medium、campaign、term、content)用于标记链接来源;

    针对SEM流量可从曝光量(从投放后台查看)、UV、投放地域、投放关键词、注册用户、订单量、营收等角度进行分析。

    3)推介流量:

    可以分为商务合作链接<即外链(在别人官网上放置自己的网站链接)>和自媒体渠道访问<即公众号或者今日头条等渠道>,包括一些广告流量。

    二、常规指标介绍:

    所有的流量会进入到网站的落地页,也就出现了我们平时说的落地页分析,此时一般会通过落地页来判断用户的来源,同时根据落地页可以看到页面的分流情况,画出首页地图、落地页地图等。

    经过落地页主要是进行一些指标性的分析:

    主要包括:转化率、访问深度、访问时长、PV、UV等值,具体信息可以查看:https://blog.csdn.net/livan1234/article/details/88861523

    其中描述了常见的一些指标以及对应的一些网站分析的方法。

    三、 流量分析的场景

    1)第一个场景为落地页分析:

    我们上面所提的落地页分析,可以分析出用户的来源,并结合首页信息可以确定出首页地图,以及明确网站首页的分流情况。

    2)流量的访问路径分析:

    即用户进入到页面之后访问了哪些页面,停留了多少时间,以此整理出用户的一个行为流:

    从这里流程中可以看出如下问题:

    • 用户的访问断点在哪里?
    • 用户访问的关键路径是哪些?
    • 用户访问是否存在迷路的情况?

    也可以计算出对应的访问深度等指标。

    3)搜索关键词的分析:

    搜索关键词是分析用户到访目的的另一个方法,用户搜索了多少关键词,这些关键词都有哪些?对这些关键词进行排序,可以分析出用户进入到网站后关注的前几个关键词是什么。

    关键词搜索框主要有两个位置,一个是首页的搜索框,另一个是在某一栏目下的搜索框,这两种搜索框可以结合使用,通过首页搜索框找到用户搜索的大类,然后再通过某一栏目下的搜索框,定位用户的主要目的和需求点。

    4)流量的地域分布分析:

    地域分析主要是针对用户的访问位置确定在某一区域内有多少访问量,进而结合地图形成关于访问量的热力图。

    5)流量的新老客户分析:

    主要是通过是否是第一次登陆来确定是新访客户或者老客户,来确定在某一个时间段用户的新老比例,这一指标往往是需要考虑历史的因素,即每一个月的新客户和老客户访问量形成访问的图,如果有需要可以结合地域分析,得到在每个区域中,新老客户的访问情况,通过这组数据来分析用户登陆出现差异时的原因。

    四、流量波动的常见原因:

    1)品牌广告:

    网站的logo和网址比较好记,而且推广较为有效的话,可以吸引较多的人来查看对应的网站,引发流量的上升。

    2)热点事件:

    既包括正面的也包括负面的热点信息,可以设想一个场景:如果某个网站突然登上了微博的头条栏位,他的访问量一定是在短时间内激增的。

    3)内部访问:

    自己内部员工访问网站,也会对应的带动流量,这种情况除了网站有专享的功能外,更多的一个原因就是测试。

    4)营销活动:

    营销活动是非常明显,且可控的的一方法,线下的一些活动会吸引大量的用户进入到网站中,进而引发网站流量的增加。

    展开全文
  • 网站数据分析指标体系

    千次阅读 2017-08-27 12:26:17
    本文整理自网友分享的份 Word 文档,主要介绍了网站分析的 KPI 指标、数据分析方法、网站分析工具介绍和对比等。 、总论 1. 概念  网站流量统计,是指对网站访问的相关指标进行统计。网站访问分析...
    标签: 郑来轶 数据分析 分析报告 数据报表 网站分析 分类: 03.数据分析

    【编者注】网站流量统计,是指对网站访问的相关指标进行统计。本文整理自网友分享的一份 Word 文档,主要介绍了网站分析的 KPI 指标、数据分析方法、网站分析工具介绍和对比等。


    一、总论


    1. 概念

       网站流量统计,是指对网站访问的相关指标进行统计。网站访问分析(有时也使用“网站流量分析”、“网站流量统计分析”、“网站访问统计分析”等相近的概念),是指在获得网站流量统计基本数据的前提下,对有关数据进行统计、分析,从中发现 用户访问网站的规律,并将这些 规律与网络营销策略等相结合,从而发现目前网络营销活动中可能存在的问题,并为进一步修正或重新制定网络营销策略提供依据。

    2. 意义

       • 了解网站的目标人群特征,为产品设计提供重要依据
       • 了解网站关注行业用户量的潜在规模
       • 对比行业平均指标,作为评估自身网站发展的指标
       • 分析网站与竞争对手之间的用户重合度
       • 分析自身网站内部各栏目间的用户重合度

    3. 分析报告

       网站统计分析通常按 日 、 周 、 月 、 季度 、 年或围绕营销活动的周期为采集数据的周期。当然单纯的网站访问统计分析是不够的,我们在分析报告中需根据网站流量的基本统计和可采集的第三方数据的基础上,对网站运营状况、网络营销策略的有效性及其存在的问题等进行相关分析并提出有效可行的改善建议才是网站访问统计分析报告的核心内容。应该包括以下几方面的内容:

       • 网站访问量信息统计的基本分析 

       • 网站访问量趋势分析

       • 在可以获得数据的情况下,与竞争者进行对比分析
       • 用户访问行为分析
       • 网站流量与网络营销策略关联分析
       • 网站访问信息反映出的网站和网站营销策略的问题诊断

       • 对网络营销策略的相关建议


    二、关键绩效指标(KPI)


    1.常用指标

       红色标记的指标是最为必要的 KPI, 对网站的统计分析有很大的意义和作用。

    1.1.  网站流量 KPI

       网站流量统计 KPI 常用来对网站效果进行评价,主要的统计指标包括:

       访问量(Page View):即页面浏览量或者点击量,用户每次对网站的访问均被记录 1 次。用户对同一页面的多次访问,访问量值累计。

       衍生出的指标:
       日均访问量:指对应时间范围内,网站每日的平均访问量。
       最高日访问量:指对应时间范围内,网站在某天获得最高访问量。

       PV%:指选择时间范围内,某个类别的 PV 占总 PV 的比例。


       独立 IP :指在一天之内(00:00-24:00),访问网站的独立 IP 数。相同 IP 地址只被计算 1 次。


       独立访客(Unique Visitor):将每台独立上网电脑(以 cookie 为依据)视为一位访客,指一天之内(00:00-24:00)访问您网站的访客数量。一天之内相同 cookie 的访问只被计算 1次。

       衍生出的指标:

       UV%:指选择时间范围内,某个类别的 UV 占总 UV 的比例。


       重复访客(Repeat Visitor):某个 cookie 的再次访问计为一个重复访客,它的数目即为重复访客数量。
       衍生出的指标:
       重复访客百分比:重复访客占全部访客的比例。
       重复访问数量:是指某个 cookie 除第一次访问之后,又访问您网站的次数。
       人均访问页面数:指对应时间范围内,每个访客访问网站的平均页面数。

    1.2. 用户行为 KPI

       用户行为 KPI 主要反映用户是如 何访问网站的、在网站上停留了多长时间、访问了哪些页面等,主要的统计指标包括:
       访问深度(Depth of Visit):在一次完整的站点访问过程中,访客所浏览的页面数。访问页面越多,深度越高,访问深度可以理解为是平均页面访问数的另一种形式,也是衡量网站粘度的指标。
       新访客:某个 cookie 的首次访问计为一个新访客。
    最近访客:最新访客统计,最近一段时间内(5 分钟内)访问您网站的 100 个独立访客,按“进入时间”倒序排列。
       同时在线人数:15 分钟(时间范围可自己定)内在线访问的 UV 数。
       最高小时在线人数:指对应时间范围内,网站在某一小时内最高同时在线的唯一访客数。注:
       “天”以 24 小时(00:00-24:00)为单位。
       访问入口:每次访问过程中,访客进入的第一个页面,此页面可以显示网站对外或搜索引擎的一些链接入口。
       访问出口:每次访问过程中,访客结束访问,离开前点击的最后一个页面,此页面可以显示网站对外或搜索引擎的一些链接入口。
       访问最多的页面:访客访问最多的页面。
       进入最多的页面:作为访客访问站点的访问入口中最多的页面。
       退出最多的页面:作为访客访问站点的访问出口中最多的页面。
       到达最多的目标:通过点击链接到达的最多的目标页面。
       首页访问数:首页的游览量。
       站点覆盖(点击密度分析):通过覆盖在 Web 页面上方的点击,可以直接显示访客在 Web页面上点击了哪里。
       访客所用搜索引擎:分析网站访客访问网站所使用的搜索引擎。
       访客所用关键字:分析网站是通过哪些关键字搜索带来的流量,并分析每个关键字是由哪些搜索引擎带来的。
       衍生出的指标:
       最频繁的关键字:使用最多的关键字的比例。
       访客停留时间(访问时长):访客访问网站的持续时间。
       衍生出的指标:
       访客平均停留时间:所有访客的访问过程,访问持续时间的平均值。
       来源分析:分析网站访客的来源类型,来源页面统计。来源类型分为:
       搜索引擎:由搜索引擎的链接访问网站。
       其他网站:由非搜索引擎的其他网站链接访问网站。
       直接输入网址和标签:访客通过在地址栏、收藏夹、书签等方式直接访问网站。
       站内跳转:访客在网站内部的页面之间进行跳转,产生的流量。
       总数据:网站自开通盘点系统之日起至今的各数据量总和。
       访问量变化率:指对应数据项在当前时间段,与上一个时间段相比较,访问量的同比变化率。
       例如,上周(7 天)的访问量变化率为 ↓21.1% ,表示上周的访问量比上上周的访问量下降了 21.1%。又如,今日 10:00-11:00 的访问量变化率为 ↑1.3% ,表示今日 10:00-11:00 比昨日 10:00-11:00 的访问量上升了 1.3%。
       被访页面:分析网站中各个页面的流量分布,以及其随时间的变化趋势。
    当前访客活跃度:是指您网站上当前访客的多少,它在一定程度反应了您网站在当前时间的受欢迎程度。
       访问路径:每个访问者从进入您的网站开始访问,一直到最后离开您的网站,整个过程中先后浏览的页面称为访问路径。
       访问频度:指您网站上访问者每日访问的频度,用于揭示您网站内容对访问者的吸引程度。
       点击次数:是指用户点击页面上链接的次数。

    1.3.  用户访问方式 KPI

       用户访问方式 KPI 主要反映用户访问网站的地域、设备、浏览器名称和版本、操作系统等,主要的统计指标包括:
       地理位置:网站的访客来源于哪个省、市、自治区或国外。
       网络服务提供商:网站的访客所处的网域,是电信用户还是网通用户。
       IP 段:网站的访客所在的 IP 段。
       浏览器:网站的访客所使用的浏览器类型。
       屏幕分辨率:网站的访客所使用的各种屏幕分辨率。
       操作系统:网站的访客所使用的操作系统类型。
       语言环境:网站的访客使用的哪国语言的操作系统。
       插件类型:网站的访客安装的各种插件情况。
       Cookie 支持:网站的访客所使用的浏览器是否支持 cookie。
       终端类型:网站的访客所使用什么类型的终端上网。

    2.  重要指标

       关键指标是网站访问统计中最为重要的参考指标,分为如下两类:

    2.1. 用户和流量增长 KPI

       用户增长百分比:即 UV 的增长百分比(一般是同上个月或上一周来比较)。
       流量增长百分比:即 PV 的增长百分比(同上)。
       从搜索引擎而来的流量百分比:从搜索引擎而来的 PV 占总 PV 的比例。
       新访客比例:新访客占全部访客的比例。

    2.2. 内容效率 KPI

       每次访问的平均页面数:总访问量/访问人次。平均页面访问数代表了网站的粘度,粘度越高,用户看的页面越多,平均页面访问数也就越高。
       每个独立访客的平均访问次数
       回访率:回访访客占所有访客的比例,用于揭示网站访问者对网站的 忠诚度。
       新访客同回访客的比例
       网站访问者在不同逗留时间(0—30 秒,30 秒—2 分钟等)的数量
       不同访问深度的访客数量
       跳出率(Page Bounce Rate):指仅浏览了该页面(一个页面)就离开网站的用户比例。

    3.  特殊指标

       如果网站有全站搜索,才用得到这部分,不过很多统计工具不提供这种统计。

    3.1.  内部搜索效率 KPI

       使用搜索的用户百分比
       每次访问的平均搜索次数
       得到"0 结果"的搜索百分比
       从搜索结果中得到"0 点击"的百分比

    4.  营销类指标

    4.1. 营销效率的 KPI

       每个访客的平均成本
       每个访客的平均收益
       新访客和回头客的收益比较
       新客户同旧客户的收益百分比
       每个购物车的平均商品数量
       每次转换的订单平均价值和平均成本

    4.2.  购物车的 KPI

       购物车放弃率:指在购物过程中途放弃的比例。
       开始购物率:指添加第一个商品到购物车的访客数量除以总的访客数量。
       开始结帐率:指点击了结帐按钮的访客数除以总的访客数。
       完成结帐率:总的完成付款购物的用户数目/点击了结帐按钮的用户总数。

    4.3. 转换 KPI

       转换率(Conversions Rates):进行了相应的动作的访问量/总访问量。
       新访客的转换率

       回访客的转换率


    三、数据的分析方法


    1、聚类分析(相应的算法分析 K-means 算法,统计学上的原理等)

    2、用户细分

       大部分访问者从哪里来—分析网站流量来源
       访问者最关注哪些栏目—分析访问者的浏览路径
       访问者从哪里流失得最多—分析网站流量流失的原因

       分析访问来源的差异性—分析不同访问渠道对流量的贡献程度


    四、访问统计分析工具


    1. 分类

    1.1. 服务器端软件

       通过直接读取网站访问 Log 文件,来做统计分析。
       优点:
       • 可以从任何地方都可以访问;
       • 速度快,因为通常这些统计分析都是通过 Cron 任务来定时执行的;
       • 可靠度高,因为是直接读取 Log 文件,当然所有访问服务都有记录;
       • 隐私问题,因为是使用自己的分析工具,当然没有被第三方获得的机会;
       • 网站访问错误统计,同样是因为基于 Log 日志的统计,所有的访问记录都有,也包括 404错误等各类错误统计;
       • 搜索引擎的蜘蛛访问统计

    1.2. 桌面软件

       这种软件通常都是商业软件,极少免费的,比如 Web Trends,Sawmill 等。一般这种软件是安装在用户的桌面电脑上,然后定期下载网站的 Log 文件,在本地进行分析统计,无需上网都可以使用。

    1.3. 在线统计服务

       这种服务现在很流行,目前使用最多的就是 Google Analytics。要使用在线统计服务的话,需要在你的网站的所有页面中,都加入一段统计代码。而统计的过程中,是不会统计到那些404 错误的。

    2. 统计服务商对比

    2.1. CNZZ 站长统计

    优点:后台栏目设置分类比较清晰,统计的数据比较详细。
    缺点:没有统计访客的停留时间和跳出率;没有深入的分析报告。

    2.2. 51 啦统计

    优点:后台界面比较清晰,顶部栏目设置很不错。
    缺点:没有统计访客的停留时间和跳出率;没有深入的分析报告。

    2.3. 51yes 统计

    优点:客户地理位置统计用地图显示。
    缺点:后台功能的归类比较零散,不方便统计,没有深入的分析报告。

    2.4. 量子恒道统计

    优点:界面比较清晰,比较简洁。
    缺点:数据不是很详细,没有深入的分析报告。

    2.5. Google Analytics

    优点:对访客停留时间和跳出率都有统计,功能是其中最为复杂强大的。
    缺点:没有什么明显缺点。

    2.6. 百度统计

    优点:基于搜索引擎关键字分析。
    缺点:很难申请到。

    3. 免费工具

    3.1. Woopar

       站在业界尖端的统计系统。Woopra 的客户端可以运行在目前 99%的平台,包括 Windows、Mac 和 Linux,界面非常华丽。除了可以实时查看访问流量、搜索关键字、访问来源等常规信息外,还可以进行搜索、查看实时分析数据及图表、创建事件提醒等功能。
       非常有特色的一个地方就是,你可以通过客户端自带的 IM 系统同正在访问你的网站的用户实时沟通。这个功能是目前的统计系统都没有的功能。可以对特别的用户用 tag 来表示,并且可以查看历史上他所访问的记录。还有很多很多的特别的功能。丰富的界面实时通讯实时统计。
       Tips:需下载客户端,是基于 JAVA 开发的平台,注册是免费的。
       地址:http://www.woopra.com/

    3.2. 维度统计

       是一个类似 Woopra 的统计系统,也有客户端,还有 IM,但不是基于 Java。它的客户端界面不够漂亮,效率也不够高,数据同步较慢。
       地址:http://www.vdoing.com/

    3.3. Analog

       需要下载的一个站点统计工具,非常的专业。
       地址:http://analog.cx/

    3.4. Awstats

       Awstats 除了可以分析 Web,还可以分析 FTP,Email Log 文件。
       地址:http://www.awstats.org/

    3.5. OneStatFree

       提供免费的点击统计和网站分析。同时提供高级的付费服务。
       地址:http://www.onestatfree.com/

    3.6. CrazyEgg

       具有追踪、评估功能,可以根据访客点击的位置对网站进行优化。
       CrazyEgg 有一个非常有特色的地方,就是 heat map,就像一张红外线照片,用红色橙色蓝色的不同区域在你的网页上表示出哪些部分是热区。最基本的服务是免费的,每月可以统计5000 个 Visits,同时可以统计 4 个页面。作为一种尝试,也是不错的。
       地址:http://crazyegg.com/

    3.7. Piwik

       Piwik 是一个开放源代码的网站分析应用,它使用 PHP 和 MySql 开发。Piwik 有一个允许你任意延伸和自定义的“插件”系统。你可以选择仅仅安装你需要的插 件,或者全部安装。
       Piwik 插件系统,和你想象的一样,它也给你一个创建你自己的定制扩展应用的可能,并且Piwik 是个轻量级的应用,下载包只有 1.9MB。
       地址:http://piwik.org/
    http://piwik.org/demo/index.php?module=CoreHome&action=index&idSite=1&period=day&dat
    e=yesterday#module=Dashboard&action=embeddedIndex&idSite=1&period=day&date=yesterday(在线演示地址)

    3.8. FireStats

       FireStats 是一个简单和直接的网站分析应用,使用 PHP 和 MySql 开发。它支持多种平台,包括 C#站点,Django 站点等,以及 Wordpress 和其他的一些平台。FireStats 还有一个优秀的 API[应用程序接口,它可以协助你创建你自己的基于你的 FireStats 数据的特制应用程序或发布平台组件。
       地址:http://firestats.cc/

    3.9. Snoop

       轻量级的站点统计服务商 reinvigorate 推出的一个桌面工具,能够让你实时查看自己站点发生的各种事件,比如用户注册,留言,访问等,常规的站点统计服务,便于在一定时间后对各种累积数据的统计分析,而 Snoop 的功能则在于事件的动态展现,能够让 Blogger 即时了解自己的 Blog 状况,提供实时访客追踪,具有姓名标签合并等高级功能。
       Snoop 是一个基于桌面,运行在 Mac OS X 和 Windows XP/Vista 平台的 web 分析工具。它运行后,会驻留在你的系统状态栏或系统托盘中,当一些事件发生的时候,会有声音来提醒你。另外一个显著的 Snoop 特色就是 Name Tags 选项,允许你使用“标记”来更容易的识别访客。
       地址:http://report.reinvigorate.net/snoop

    3.10. Clicky

       这是一款功能全面的分析套装软件,服务主要针对于小网站和博客,易于使用,包括实时访客追踪、深度内容分析等高级服务。
       地址:http://getclicky.com/

    3.11. Enquisite

       尤其擅长搜索引擎访问和 PPC 访问。提供地域数据、页面位置等深度统计。
       地址:http://www.enquisite.com/

    3.12. 103bees

       是一款实时搜索引擎分析和统计工具,高度关注搜索引擎访问量,擅长为网站 SEO 分析关键词。
       地址:http://103bees.com/

    3.13. Measure Map

       为博客提供容易理解的统计数据,目前该网站不接受新帐号,但是可以输入电子邮件获取未来通知,该网站归 Google 所有。

    3.14. whos.amung.us

       实时访客计数器,能显示任何一个时刻网站的总访问人数,不需要注册,很容易安装。
       地址:http://whos.amung.us/

    3.15. FeedBurner

       全球最大的 RSS 托管服务网站。针对博客,界面简洁、直观,提供深度统计数据,目前归Google 所有。
       地址:http://feedburner.google.com

    3.16. ClickTale

       记录访客活动,网站 SEO 分析后便可理解用户行为并提高网站的可用性。
       地址:http://www.clicktale.com/
    展开全文
  • 网站流量分析报告1思维导图2流量分析2.1趋势分析2.2对比分析2.3当前在线3来源分析3.1来源分类3.2搜索引擎3.3搜索词3.4受访...从最近7天的流量趋势来看,网站每天早上10点到下午5点这时间段的访客最多,每天平...

    1思维导图

    在这里插入图片描述

    2流量分析

    2.1趋势分析

    从最近7天的流量趋势来看,网站每天早上10点到下午5点这个时间段的访客最多,每天平均访问量在500左右。
    在这里插入图片描述
    在一周中,周六日的浏览次数和访客数最低,这和正常上下班时间是相匹配的,同时独立IP、新访客、访问次数、人均浏览页数、平均访问深度等指标也较低。
    在这里插入图片描述

    2.2对比分析

    在这一周和上一周中,PV环比降低了4.49%,但UV却环比增长了1.78%。
    在这里插入图片描述
    UV增加,PV减少,是因为人均浏览页数和平均访问深度不够。
    在这里插入图片描述

    2.3当前在线

    在近15分钟内,共有3个独立访客访问网站,且都是新访客
    在这里插入图片描述

    3来源分析

    3.1来源分类

    从访问来源看,用户主要是通过其他外部链接、直接输入网址或标签的形式访问论坛主页。
    在这里插入图片描述
    从来源域名来看,其他外部链接大部分都是以百度和360搜索(www.so.com)的域名进行访问。(这可能和cnzz内部的统计方法有关?)
    在这里插入图片描述
    从来源域名来看,外部链接主要是从经管之家跳转进来的。
    在这里插入图片描述

    3.2搜索引擎

    从搜索引擎来看,通过360网页访问主页的访客数最多,占比74%。
    在这里插入图片描述

    3.3搜索词

    从搜索词看,用户主要通过搜索引擎搜索数据分析师培训和minitab教程跳转到论坛主页。
    在这里插入图片描述

    3.4受访界面

    在受访页面中,论坛主页和Minitab论坛排名前三,排名第四的是minitab的一个使用教程(无网易云教程推广)。
    在这里插入图片描述

    4访客分析

    4.1区域分布

    近7日记录中,广东省不管是独立访客数还是总浏览次数都位列第一,上海独立访客数虽排名第二,但浏览次数却排名第三,明显小于江苏省。
    在这里插入图片描述在这里插入图片描述
    从城市分布看,在近7日访客中,用户主要分布在上海、北京和南通市,南通PV高,但是UV,跳出率却低,可见南通用户对该论坛兴趣度较高。
    在这里插入图片描述

    4.2运营商

    在访问的网络运营中,电信遥遥领先于联通和移动,并高于两者之和,三者份额占总访问量的88%。
    在这里插入图片描述
    在电信运营商中,上海、南通和深圳的PV占比较高,可见沿海和南方地区访问量较高。
    在这里插入图片描述

    4.3终端

    非移动设备访问占比高达99.78%,即用户几乎都是通过PC端方式进行访问。
    在这里插入图片描述
    在操作系统上,96%以上的用户使用windows系统访问论坛;在浏览器上,用户主要使用360和谷歌浏览器,占比达57%。
    在这里插入图片描述

    4.4新老访客

    在最近7天访问中,新老访客分别占比82%、18%,且主要通过百度和360进行访问。
    在这里插入图片描述

    4.5忠诚度

    75%的用户只访问一次就离开了网站,可见该论坛跳出率比较高,用户忠诚度较低。
    忠诚度

    4.6活跃度

    结合下图,可以发现用户访问深度为1页占比达79%,活跃度很低。
    在这里插入图片描述

    4.7用户结构

    在所用访客中,以男性访客为主,年龄主要集中在18-30岁之间,其中大部分都是游客访问,沉迷网民占比23.14%。
    哈哈哈

    5结论与建议

    5.1结论

    1. 用户在周一至周五期间,每天早上10点到下午5点这个时间段的访客最多,周六日访客数相对较少。
    2. 在这一周和上一周中,PV环比降低了4.49%,但UV却环比增长了1.78%,源于人均浏览页数和平均访问深度不够。
    3. 从访问来源看,91%的用户通过其他外部链接、直接输入网址或标签的形式访问论坛主页,外部链接主要是从经管之家跳转进来的。
    4. 从搜索引擎看,用户最喜欢通过360网页访问论坛主页,占比达74%。
    5. 从搜索词看,用户主要通过搜索引擎搜索数据分析师培训和minitab教程跳转到论坛主页,占总搜索次数的60%。
    6. 在受访页面中,以论坛主页和Minitab论坛为主。
    7. 近7日记录中,广东省不管是独立访客数还是总浏览次数都位列第一,上海独立访客数 虽排名第二,但浏览次数却排名第三,明显小于江苏省。
    8. 从城市分布看,在近7日访客中,用户主要分布在上海、北京和南通市,南通PV高,但是UV,跳出率却低,可见南通用户对该论坛兴趣度较高。
    9. 非移动设备访问论坛主页占比高达99.78%。
    10. 在操作系统上,96%以上的用户使用windows系统访问论坛;在浏览器上,用户主要使用360和谷歌浏览器,占比达57%。
    11. 75%的用户只访问一次就离开了网站,论坛跳出率比较高,用户忠诚度较低。
    12. 用户访问深度为1页占比达79%,活跃度很低。
    13. 在所用访客中,以男性访客为主,年龄主要集中在18-30岁之间,其中大部分都是游客访问,沉迷网民占比23.14%。

    5.2建议

    (1)针对用户跳出率较高的问题,是否可以通过请UI设计人员重新对页面进行排版设计,以增强用户吸引力。
    (2)由于在周一至周五的上午10点到下午5点用户浏览量较大,故可以在此时间段做广告推广(360或谷歌浏览器,也许费用较高),提高网站访问量,增加网易云课程的销售量。
    (3)论坛主页“一个月学会数据分析”的推广页面较小,不够吸引用户的注意,另外推广标题是否可以变成“dmer老师教你一个月从零开始学会数据分析”(可能有点low,提个建议而已,想法是能否和新闻标题一样,第一眼就能吸引用户注意)。
    (4)网易云课堂直接跳转到课程目录页会不会好一点?毕竟课程介绍和评价在购买之前肯定会去找,会去看的。以我个人而言,我刚开始最想看到的是课程具体会讲些什么,而且目录那个字眼有点小,说实话不注意都看不到,用户可能会直接关闭页面就走了。
    (5)根据用户评论区的反馈,对课程内容加以改进,提高口碑,有助于好友推荐,提高课程销量。

    展开全文
  • 数据仓库设计 网站/APP 流量分析、用户访问分析 网站/APP 流量分析、点击流分析、用户...这概念更注重用户浏览网站的整个流程。 用户对网站的每次访问包含了系列的点击动作行为,这些点击行为数据就构成了...
  • hadoop网站日志分析

    千次阅读 2017-09-19 17:54:41
    网站日志分析项目案例()项目介绍 网站日志分析项目案例()项目介绍:当前页面 网站日志分析项目案例(二)数据清洗:http://www.cnblogs.com/edisonchou/p/4458219.html 网站日志分析项目案例(三)统计分析...
  • 行业分析常用到的21个网站

    千次阅读 多人点赞 2020-10-15 21:31:04
    我之前接触得迷迷糊糊的,知道融资轮次(可以看国家企业信用信息公示系统)、知道财务报表(可以看同花顺财经)、知道行业分析(看,就是不能把这几个放在一个体系中。 [外链图片转存失败,源站可能有防盗链机制,建议...
  • 如何进行网站流量分析

    万次阅读 2018-02-06 18:29:25
    如何进行网站流量分析(一)流量分析整体来说是一个内涵非常丰富的体系,整体过程是一个金字塔结构:金字塔的顶部是网站的目标:投资回报率(ROI)。网站流量分析模型举例1 网站流量质量分析(流量分析)流量对于每...
  • 广大站长有没有这样一个体验,网站流量异常,要通过网站日志来分析的时候非常头疼,日志文件很大,一条一条来查看分析几乎不可能,需要借助网站日志分析工具来分析,但很多日志只有一个大概的访问统计,不是很详细。...
  • 网站数据统计分析工具是网站站长和运营...本文将简要分析这种数据收集的原理,并一步一步实际搭建一个实际的数据收集系统。 1、数据收集原理分析 简单来说,网站统计分析工具需要收集到用户浏览目标网站的行为(如打
  • 免费专利检索分析网站

    万次阅读 2016-11-12 22:01:00
    专利检索是我认为很重要的一个基本技能,其分 “器”与“术”,“术”我在线下活动中讲过一次,结合了专利分析而讲。今天我讲讲器。器就是我们检索的网站,之前使用过很多,有些已经让我把网址丢失了,而从我能找到...
  • 一个数据分析师的自我修养

    千次阅读 2016-04-15 15:08:00
    因为在之前的回答里提到,建议希望成为数据分析师的知友们在学习过相关知识以后,做份自己的数据报告,作为求职的敲门砖,展示已有能力。后来发现,我这建议自以为干货,但其实犯了“给鸡汤不给勺子”的错误,...
  • 虽然现在对数据分析师的需求处于历史高位,但国内数据分析行业对于国外知名的数据分析博客网站... Cross Validated 交叉验证 作为开发人员Q&A社区的Stack Exchange网络的一部分,Cross Validated是一个用于统计,...
  • 网站点击流数据分析项目

    万次阅读 多人点赞 2017-08-07 15:05:24
    比如点击了哪一个链接,在哪个网页停留时间最多,采用了哪个搜索项、总体浏览时间等。而所有这些信息都可被保存在网站日志中。通过分析这些数据,可以获知许多对网站运营至关重要的信息。采集的数据越全面,分析就能...
  • 如何分析网站日志?

    千次阅读 2019-03-17 15:25:36
    条访问日志如下: 112.10.94.234 - - [22/Aug/2017:14:01:26 +0800] “POST /item/detail.mooc?a=1&amp;b=2&amp;c=5 HTTP/1.1” 200 2582 “http://www.chinamoccs.com/study/initplay/540.mooc” ...
  • 网站打开慢原因分析

    千次阅读 2017-12-01 23:01:00
    作为一个运维工程师,我们该从哪些角度去分析问题,判断问题,并最终解决问题。那么首先我会从几个方面分析这个问题,也许可能有纰漏或者说得不是很准确,大家借鉴就好,仅做参考。   二、分析可能的原因 2.1 ...
  • 购物网站需求分析

    万次阅读 2013-04-03 14:07:26
    购物网站需求分析 发布时间: 2012-10-08 13:55 浏览: 386 ——功能性业务要求 4.1购物网站首页 展示网站总体格局,发挥导航作用。它包含商品购物模块、商品搜索模块、商品后台管理模块、用户管理模块、...
  • 一个项目到了汇总的时候,免不了形成一份相对完整的数据分析报告,一个数据分析报告的框架,主要包含以下几项,具体如下: 项目背景:简述项目相关背景,为什么做,目的是什么 项目进度:综述项目的整体进程,以及...
  • 网站后台统计数据分析

    万次阅读 2014-09-04 15:29:09
    网站后台的数据分析应该说是最最重要的,也是一个网站数据分析的核心部分,这里的数据分析主要包括IP,PV,时段分析,关键词流量,关键词入口分析,浏览深度分析,回头客分析,访问者信息分析等,这些数据能直观的...
  • 网站流量分析数据指标

    千次阅读 2018-05-11 15:04:04
    如果如果把一个网站比作一家超市,运营网站就像打理超市的生意,那么目标就是让访客多停留、多购买、多办几张会员卡。为了达成这个目标,我们先要了解当前的情况,比如有多少人走进了超市、看了多少件产品、多少人...
  • 前几天,领导甩给我一个任务,考察几个BI工具,下季度立项用。 潜心做ETL的我,对BI只是略懂。之前上的BO,由于开发模式不适应、人员用不惯,再加上负责这块的同事走的走,一直被搁置。所以这次目标很明确,急需...
  • 网站技术分析工具:Wappalyzer

    千次阅读 2019-08-08 16:31:07
    经常有人会问,这个网站使用什么技术搭建的? AngularJS?Django?Jquery?还是什么呢?如果遇到这样的问题,建议你装一个这样的插件:Wappalyzer https://wappalyzer.com/比如CSDN:比如 worktile: ...
  • Splunk是一个分析计算机系统产生的机器数据,并在广泛的场景中提供数据收集、分析、可视化分布式的数据计算平台。客户可使用 Splunk 来搜索、监测、分析和可视化机器数据。 本套课程为2018年录制,共23集,软件版本...
  • 前言 打印出GC日志之后,就可以拿去GCeasy官网上进行GC可视化分析了。...这部分分别使用了表格和图形界面来展示了JVM堆内存大小。如图所示: 左侧分别展示了年轻代的内存分配分配空间大小(All...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 649,883
精华内容 259,953
关键字:

如何分析一个网站