精华内容
下载资源
问答
  •  在一行中统计24小时内所有货物销售(售出,退货)数据,把日期考虑在内。 分析:  这实际上是行转列一个应用,在进行行转列之前,需要补全24小时所有数据。补全数据可以通过系统数字辅助表 spt_values来...
  • 如何做好数据分析

    2019-09-13 15:49:58
    百度统计,CNZZ,51LA等网站统计工具似乎每个网站都不缺少,但是大部分...我们通常所说的数据分析是一个广义的概念,包括对自己网站的分析和对竞争对手的分析,具体包括:网站各个时间段的流量,IP、PV,网站日志,...

    百度统计,CNZZ,51LA等网站统计工具似乎每个网站都不缺少,但是大部分站长只把这些当做是查询工具,草草看过就立刻关掉,并没有充分利用挖掘这些工具的内在价值。我们通常所说的数据分析是一个广义的概念,包括对自己网站的分析和对竞争对手的分析,具体包括:网站各个时间段的流量,IP、PV,网站日志,外链丢失率,网站收录、网站热力图分析、网站结构布局、关键词分析、内容质量分析……每一个看似很小的指标却都直接关系到网站的竞争力,因为如今各大中小网站中有排名无转化率的实例太多太多了,下面笔者就举几个简单的例子和大家一起探讨如何做好网站的数据分析

    一、网站SEO综合数据分析

    这应该是每个SEO从业人员每天早上开工做的第一件事,就是要查询一下自己的网站综合数据,包括快照情况,收录情况,外链情况,PR值,关键词排名等。让这些成为每天的一个例行工作,一旦有什么意外情况需要立即采取措施,对症下药。

    1、谷歌PR值:PR值是一个网站权重的最直接体现。当然这个并不需要过多在意,在友情链接交换的时候自然会体现它的价值。

    2、网站快照:当日或者隔日快照的网站体现了搜索引擎对网站的信任度和关注度,但是快照和排名并无直接联系,主要是对网站收录方面有促进作用。

    3、外链丢失率:大家都知道外链越多越广越好,但是必须注意外链的丢失情况,因为这点直接关系到网站的关键词排名情况,百度通常是一个星期一次更新,站长在发现外链丢失时需要及时弥补,防止被降权。

    4、收录情况:一个网站的收录量可以从侧面体现SEO的成熟度,但并不是说收录越多就越好,一定要注意网站的文章总数和收录数量的比值,例如一个网站百度收录数量是1555,但是实际页面数已达到4万多,所以表面看似收录不错,但是实际收录率比值并不高。

    二、网站日志分析

    网站在起初购买空间的时候,一定要和经销商说明需要具备日志下载功能,因为网站每日的日志分析同样是非常重要的工作,从日志中我们可以发现网站的诸多问题,比如死链接,404错误页面,服务器是否经常出错,到底蜘蛛喜欢什么时候光临网站……都是需要处理妥当的细节问题。

    三、网站后台数据分析

    这部分的数据分析应该说是最最重要的,也是一个网站数据分析的核心部分,因为文章开头说关键词排名的时代已经过去,现在站长们应该更注重的是网站的转化率和留住用户的能力。这里的数据分析主要包括IP,PV,时段分析,关键词入口分析,浏览深度分析,回头客分析,月报表分析……归根结底,我们要知道用户是从哪里来的,来做什么,停留在哪里,从哪里离开的,去了哪里。只有掌握了这些数据,我们才能够有的放矢,做出相应的改进,可能是布局方面的,可能是内容方面的,可能是产品方面的……

    以上是几种SEO中需要经常做的数据分析,数据分析是一个系统并且需要耐心的工作,但是很多朋友把数据分析当做是一个很高深的工作,觉得需要有统计学的基础才可以做,其实不然,SEO的数据分析可能更多的是心理学和消费行为学的东西,但是无可否认的是,一个懂得数据分析的站长可以让一个网站更加人性化,更加具有价值。


    转载于:https://my.oschina.net/taisha/blog/36322

    展开全文
  • 虚拟数据中心基础架构梳理涉及诸多关键信息如集群/主机/虚机/网络/存储/内存/CPU 存储/等等,在排故和性能分析中又缺一不可、如何快速了解基础架构、关联分析、发现延迟以及影响范围,是排故/性能分析中效率关键...

    统计地图功能详解
    虚拟数据中心的基础架构梳理涉及诸多关键信息如集群/主机/虚机/网络/存储/内存/CPU 存储/等等,在排故和性能分析中又缺一不可、如何快速了解基础架构、关联分析、发现延迟以及影响范围,是排故/性能分析中效率的关键。明辰智航-云安通过统计地图进行展现,下面来看云安是如何做的!
    通过时间轴选定分析时间范围(故障/性能下降时间段)
    以热力图的形式呈现基础资源各个层级的健康态势
    自动绘制图谱并关联到资源的从属级别
    在这里插入图片描述
    举例(接上图)通过时间轴定位性能下降的范围,看到宿主机呈红色性能变差的态势、使用鼠标定位到宿主机可直接进行信息挖掘、查看关联指标确定影响范围。确认该主机CPU使用率已经94%且出现CPU就绪时间变长的情况。
    在这里插入图片描述
    通过明辰智航-云安统计地图可以迅速看清虚拟数据中心基础架构,分析到性能下降的原因。

    展开全文
  • 我现在有timedelta从1秒到17个小时的数据,需要分组统计各个时间段的数据量有多少,比如:5分钟、10分钟……55分钟、60分钟、70分钟……120分钟、150分钟……各个时间段内的数据量有多少,但是现在我不知道如何生成...
  • 在实际生活中,我们经常会遇到在一项事物中,最重要部分只占20%,其他80%却是次要,这就是二八定律。也叫做帕累托法则。...在下图中,是各个分数学生成绩数量的统计,图表中不仅可以看出分数区间人...
    在实际生活中,我们经常会遇到在一项事物中,最重要的部分只占20%,其他80%却是次要的,这就是二八定律。也叫做帕累托法则。而帕累托图(也叫做柏拉图)就是专门分析二八定律的图表。比如排查质量问题,我们只要花费少量精力和时间解决累计占比达到80%的导致问题的因素,就能显著改善质量问题,没必要花费更多的精力和时间去解决20%的问题。

    在下图中,是各个分数段学生成绩数量的统计,图表中不仅可以看出分数区间的人数分布情况(80~90分最多),而且可以看到分数累计占比。(区间分布最多的三项,即70~100分占比达到83%,区间分布在0~70的两项占比仅为17%)。说明成绩普遍比较优秀。

    84d7bdb0e033de7d7c0dde4b04e44536.png

    效果图

    我们可以直接插入直方图中的排列图制作一个简易的帕累托图。

    操作步骤:选中D1~G6单元格——【插入】——【图表】——【所有图表】——【直方图】——【排列图】。就可以做好一个简单的帕累托图了。但是这种生成的图表不能添加折线图的数据标签,也无法对折线图进行其他方式设置,所以制作比较规范的帕累托图需要运用图表组合。

    动图演示:

    9f269f9e86e5eecb7ad05e4706bbc7a1.gif

    此处开始介绍利用组合图表制作帕累托图。

    步骤一:添加辅助列并设置辅助列样式。

    1. 根据AB列设置好DE列后,在F2单元格输入公式=E2/SUM($E$2:$E$6)并向下填充,计算各个分段占总数的占比。
    2. 在G2单元格输入公式=SUM($F$2:F2),向下填充,算出累计占比。选择F2~G6单元格,按【Ctrl+shift+5】把数据改为百分比形式显示。
    3. 对E列中的数据进行降序排序。(选中E列中的任意数据,【鼠标右键】——【排序】——【降序】)
    4. 隐藏F列的数据,然后在累计百分比前插入一个0%的行。
    942136cd7f814800064a973daf2f2efa.gif

    步骤二:生成组合图表。

    1. 选中D1~G7区域,插入柱状图。
    2. 选择累计百分比的柱形,右键选中【更改系列图表类型】,图表类型改为折线图,勾选【次坐标轴】复选框。
    3. 在右上角【加号】中,勾选【坐标轴】中的【次要横坐标轴】;勾选【数据标签】。(图例项如果不需要可以删除)
    3dff9233bb68f76a4f048701ffe1955e.gif

    步骤三:设置图表形状和颜色。

    1. 双击柱形,在【设置数据系列格式】中——【间隙宽度】设置为0。
    2. 选中网格线,delete键删除。
    3. 双击柱形,在【设置数据系列格式】中选择【填充与线条】,颜色设置为浅绿。双击折线,颜色设置为深绿。
    ae7df62235f802a0b6cbf3aee6e4a3be.gif

    步骤四:设置坐标轴。

    1. 双击图表上方的【次要横坐标轴】,坐标轴位置选择【在刻度线】上。(这一步操作完后折线从0开始)
    2. 选中图表下方的【主要横坐标轴】,选择【设计】选项卡中的【选择数据】,在【编辑】中,把空白数据前面的复选框对勾去掉。(这步操作完后柱形图也会从最左边开始)
    3. 双击图表左侧的【主要纵坐标轴】,最大值改为18。(因为数量合计为18个)。
    4. 双击图表右侧的【次要纵坐标轴】,最大值改为1,向下拖动后——选择【数字】——类别改为百分比——小数位数改为0。
    a9e0bbe3466da4793cad75068675bf29.gif

    步骤五:隐藏次要横坐标轴、设置数据标签位置以及添加标题,设置字体等。

    1.双击图表上方的【次要横坐标轴】,在坐标轴选项中选择【标签】,标签位置选择【无】。

    2.双击折线图中的数据标签,【标签位置】选择【靠上】,双击柱形图的数据标签,【标签位置】选择【数据标签内】。

    3.更改图表标题为成绩分析,字体加粗显示。对其他字体也分别加粗显示。(加粗快捷键Ctrl+B)

    4.再次选择柱形,在【格式】选项卡中【形状轮廓】选择黑色,【粗细】可以选择1磅。

    fb8ea666031bd3a1cbc9169a9ffa850c.gif

    这就是本文介绍的制作帕累托图的方法,赶快试一下吧。

    展开全文
  • 数据运营思维导图

    2018-04-26 14:24:22
    各个时间段启动app人数分布 用户行为 短期点击行为、搜索行为、收藏行为 等级分析 各个等级平均耗时 用户成长速度 需要严格控制高端用户成长速度 各个等级用户流失 各个等级次日、3日、7日、14日、30日未...
  • 2019数据运营思维导图

    2019-03-29 21:34:09
    使用间隔 平均多长时间启动/使用一次app 用户对app依赖程度 各个时间段启动app人数分布 用户行为 短期点击行为、搜索行为、收藏行为 等级分析 各个等级平均耗时 用户成长速度 需要严格控制高端用户成长速度 各个...
  • 去年在深圳呆过一段时间,印象最深是,深圳总是突然就下雨,还下好大雨。对于我这种从小在南方长大但是后面又在北京呆了2年多人来说,熟悉而又无奈。今天早上本来想随便浏览浏览一个天气网站,看看深圳历史...

    背景

    最近在计划明年从北京rebase到深圳去,所以最近在看深圳的各个方面。去年在深圳呆过一段时间,印象最深的是,深圳总是突然就下雨,还下好大的雨。对于我这种从小在南方长大但是后面又在北京呆了2年多的人来说,熟悉而又无奈。

    今天早上本来想随便浏览浏览一个天气网站,看看深圳的历史天气如何的,但是,一不小心发现,这家网站竟然直接能用API来抓数据,这~~~还不抓一波,省的自己一个月一个月地看。

    先上最后的效果图:

    所有的code都在我的GitHub上:boydfd

    下面从几个方面讲一讲我是怎么做的:

    爬取数据

    用pandas显示数据

    功能扩展

    遇到的坑

    爬取数据

    先是在http://tianqi.2345.com上面浏览了一下深圳的6月份天气。然后发现点切换月份的时候,网址没有变,那应该有请求API吧,看看这个API长啥样吧。

    发现返回值就是纯JS代码,那就解析一下吧:

    去掉var =和最后的;。

    用到demjson解析成Python的List[Dict]对象。

    转成pandas的DataFrame

    加上我们的date字段

    date = '201905'

    weather = requests.get('http://tianqi.2345.com/t/wea_history/js/{date}/59493_{date}.js'.format(date=date)).text.split('=')[1][:-1]

    weather = demjson.decode(weather)['tqInfo']

    df = pd.DataFrame(weather)

    df['month'] = date

    结果是这样的:

    用Pandas显示数据

    太多雨天

    我们可以看到,有各种雷阵雨啊,阴转雨啊,雨转阴之类的,这样看到的天气太杂了,所以我就统一了一下,按照雨、多云、阴、晴的顺序来排序,先出出现的关键词优先级更高。

    写一个函数来处理之:

    rain = '雨'

    rain_index = ' ' + rain

    cloudy = '多云'

    cloudy_index = ' ' + cloudy

    overcast = '阴'

    overcast_index = ' ' + overcast

    sunny = '晴'

    sunny_index = ' ' + sunny

    def weath_category(row):

    tianqi = row['tianqi']

    if tianqi.find(rain) != -1:

    return rain_index

    if tianqi.find(overcast) != -1:

    return overcast_index

    if tianqi.find(cloudy) != -1:

    return cloudy_index

    return sunny_index

    多个月的数据

    一个月的数据不够啊,我们想要很多个月的数据,那就写得函数来生成月份吧。

    def date_generate(start, end):

    start = datetime.strptime(start, '%Y%m')

    end = datetime.strptime(end, '%Y%m')

    while True:

    next_start = start + relativedelta(months=1)

    yield start.strftime('%Y%m')

    if next_start > end:

    break

    start = next_start

    画图

    分好类,爬了多个月份的数据,就剩最终的画图部分了。使用Pandas提供给我们的函数,可以很容易就画出图来。

    def plot_weather(start, end):

    df = read_weather(start, end).dropna().reset_index()

    df['weather'] = df.apply(weath_category, axis=1)

    from pylab import rcParams

    rcParams['figure.figsize'] = 40, 10

    weather_df = df.groupby(['month', 'weather']).aqi.count().unstack().reset_index()

    weather_df.plot.bar(x='month', y=[rain_index, overcast_index, cloudy_index, sunny_index])

    功能扩展

    现在只能收集到一个月的数据,想收集多个月的数据,还都自己去页面上找城市代表的code是啥,太低效了。

    这个网站这么容易爬,那就再试试能不能找到调用code的API。

    啊哦,一不小心找到了所有的code,哈哈哈。

    那就在JS里面提取一下。

    先把所有的JS代码都复制到浏览器的console里, 结果长这样:

    将其转换成字符串。

    provqx.flatMap(a => a).join('|')

    在Python里处理它。

    def line_to_city_code(line):

    return line.split(' ')[1].split('-')

    def get_city_to_code():

    city_code_list = list(map(line_to_city_code, city_code.split('|')))

    return {city_code[0]: city_code[1] for city_code in city_code_list if len(city_code) == 2}

    这样我们就拿到所有的code了,只需要输入城市,开始时间,结束时间,一张漂亮的图就出来了,我还写了个类稍微封装了一下,只需要这样就能使用了:

    Weather('深圳').plot_weather('201701', '201906')

    遇到的坑

    以前在电脑里面处理过一次,就是matplotlib画图中文乱码的事情,这次换了新电脑又碰到了。所以又搞了一次,

    大概的步骤可以参考https://www.jianshu.com/p/8ed59ac76c06

    我为了以防下次再经历一次,就写了个脚本自动处理这件事,目前只支持macOS和Python3。

    脚本也在我的GitHub:bash,

    直接执行下面的bash脚本就可以解决这个问题:

    curl -o- https://raw.githubusercontent.com/boydfd/one_step_solve/master/matplotlib_chinese.sh | bash

    展开全文
  • 这里写自定义目录标题背景爬取数据用Pandas显示数据太多雨天多个月的数据画图功能扩展遇到的坑 背景 最近在计划明年从北京rebase到深圳去,所以最近在看深圳的各个方面。去年在深圳呆过一段时间,印象最深的是,深圳...
  • 去年在深圳呆过一段时间,印象最深是,深圳总是突然就下雨,还下好大雨。对于我这种从小在南方长大但是后面又在北京呆了2年多人来说,熟悉而又无奈。今天早上本来想随便浏览浏览一个天气网站,看看深圳历史...
  • -支持具体时间段的形式比如天、周、月、年、全部来查看统计分析; -支持以应用程序、热门文档、热门程序、自定义标签等形式查看统计; -操作界面漂亮、直观、自定义操作性强; -本地数据存储、 隐私明智的,只有...
  • 近日在做一个项目需要统计各个年龄段的数据,表里只有一个birthday field,得根据birthday计算出年龄。下面我们看看MySQL如何计算时间差。TIMESTAMPDIFF(interval,datetime_expr1,datetime_expr2)这个函数是根据...
  • MySQL 获取两个日期之间

    千次阅读 2015-03-24 11:04:49
    近日在做一个项目需要统计各个年龄段的数据,表里只有一个birthday field,得根据birthday计算出年龄。下面我们看看MySQL如何计算时间差。 TIMESTAMPDIFF(interval,datetime_expr1,datetime_expr2) 这个函数是根据...
  • 英雄联盟10.25版本已经上线有一段时间了,不知道各位玩家游戏体验如何,这个版本改动还是很多,比如说潘森,一波加强让他直接成为了上中辅三路T1,迎来了一波小巅峰。不过这种风光只是一时,现在潘森只是在...
  •  我国GIS软件市场在很长一段时间内完全由国外软件所独霸。近几年来,国产软件开始在市场上出现,销售量增长较快,势头良好。但最近一年来,国外不少GIS软件厂商相继进入中国市场,与原有国外软件厂商一起,与国产...
  • excel使用

    2012-11-25 17:06:01
    Excel的自定义格式使用下面的通用模型:正数格式,负数格式,零格式,文本格式,在这个通用模型中,包含三个数字和一个文本:大于零的数据使用正数格式;小于零的数据使用负数格式;等于零的数据使用零格式;...
  • 9.2 分布式数据库设计的数据分片、复制和分配技术 182 9.2.1 数据分片 182 9.2.2 数据复制和分配 184 9.2.3 分片、分配和复制示例 185 9.3 分布式数据库系统的类型 187 9.4 分布式数据库中的...
  • 除了由计算机技术人员对硬件网络设施的维护外,各个部门操作人员的数据及时更新尤为重要。适当的时候可以推行一些有关ERP的实施制度和方案。 最后,开展过程中的程序控制和各方协调。ERP的实施大体上分三个阶段:...
  • 某精密生产设备在某各时间段非计划停机,故障排查时需要考虑是否有电能质量问题,而电能质量问题有电网主网供电问题(如电压骤降)和厂区内其他设备反馈谐波超标原因。所以对其他系统中可能产生谐波设备数据与...
  • 6.3.2 段的相关案例 144 6.3.3 表空间的案例 148 6.3.4 rowid 151 6.4 本章习题、总结与延伸 153 第7章 且慢,探寻表的设计让SQL飞 154 7.1 表设计 154 7.1.1 表的设计 155 7.1.2 其他补充 155 7.2 表设计...
  • 可能某一读者恰好喜欢杨廷琨理解方式和文字表达,那他可以一段时间内多花时间去看他那1500多篇博客积累。可能另一些人因为欣赏Eygle技术能力与为人方式,因此虚拟地拜师学艺,可以少走弯路。师傅领入门,修行...
  • 现供职于支付宝(中国)网络技术有限公司,担任商业智能部门的数据仓库工程师.关注BI架构与设计、数据库和操作系统技术,常沉浸其中,偶有所得亦欣然自喜.平时好读书,爬山,骑车,四处走走.愿行万里路,交天下朋友.  ...
  • 本来一个接口能返回的数据,必须通过分别调用不同服务的接口来完成。更糟糕的是,不同的服务使用不同的存储引擎,以前一个sql join能解决的事情,变得非常的复杂。 如何解决? - 得益...
  • Foxpro 开发答疑160问

    2014-10-07 19:55:45
    155. 如何在报表运行时访问报表的数据环境 518 156. 如何检测报表的当前输出模式 518 157. 如何进行帐页格式的报表设计 519 158. 如何进行报表的打印设置 520 159. 如何在NT/XP系统中添加自定义纸张 521 160. ...
  • SessionStorage 存储的数据只在会话期间有效,关闭浏览器则自动删除 Sqlite 一款轻型的数据库,是遵守ACID的关系型数据库管理系统,它包含在一个相对小的C库中 W3C 万维网联盟,创建于1994年,是Web技术领域最具权威...
  • 绘制地区(四川)各市州的疫情统计数据,主要统计新增感染人数、死亡人数、痊愈人数和感染总人数的数据可视化。 5.1.1 接口设计 绘制地区区域内分类柱状图需要先得到地区(四川)的分类统计数据(表5-1-1)。 ...
  • 记录表: ``` CREATE TABLE [dbo].[wsd_count]( [id] [int] IDENTITY(1,1) NOT NULL, ... [uid] [varchar](64) NULL, ...)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_...
  • 说明: 与 NLS_TIME_FORMAT 相似, 只不过它设置是 TIMESTAMP 数据类型默认值, 该数据类型既存储YEAR, MONTH 和 DAY 这几个日期值, 也存储 HOUR, MINUTE 和 SECOND 这几个时间值。 语法: TIMESTAMP '1997-01-31 ...
  • 顺序存储方式主要用于线性的数据结构,它把逻辑上相邻的数据元素存储在物理上相邻的存储单元里,结点之间的关系由存储单元的邻接关系来体现。 链式存储结构就是在每个结点中至少包含一个指针域,用指针来体现数据...

空空如也

空空如也

1 2 3 4
收藏数 76
精华内容 30
关键字:

如何统计各个时间段的数据