订阅云计算RSS CSDN首页> 云计算

DataV首次实战分享:教你30分钟创建汽车大屏

发表于2016-08-31 11:20| 次阅读| 来源阿里云栖社区| 0 条评论| 作者木酱

摘要:作者是一个技术男,同样也是个汽车爱好者,上个月买了辆的宝马,却发现路上的“宝马越来越多”。作者最近研究了一下数据可视化,发现用datav可以玩出一些花样,本文分享了他做汽车数据大屏的经验。

【在线技术公开课预告】9月8日,来自阿里数据引擎数据可视化团队的闻啸 (花名:宁朗)将通过DataV团队在数据产品和数据大屏两个应用场景中的数据可视化实践案例,向大家分享开发过程中的信息设计思考和技术实现细节。欢迎关注数据可视化的开发者报名: http://edu.csdn.net/huiyiCourse/detail/188


先看一下汽车大屏: https://datav.aliyun.com/share/20acd88491367bf262fcb1e862ee8f1c


我是一个技术男,同样也是个汽车爱好者,上个月买了辆的宝马,却发现路上的“宝马越来越多”(⊙﹏⊙)b ......
我喜欢钻研技术,也喜欢钻研汽车,最近研究了一下数据可视化,发现用datav可以玩出一些花样,这次就分享一下我做汽车数据大屏的经验。

没数据是不行的,首先七拼八凑了一些汽车数据,然后......

清洗数据

我找到的数据是这样的

尺寸 人数
4567mm*1786mm*1454mm 1
5300*1800*1600 1
长 4369mm 宽 1802mm \高1445mm 1
4670mm*1780mm*1435mm 1
4430*1793*1399 1
4671*1815*1478 1
4929mm*1898mm*1655mm 1
4430mm*1793mm*1399mm 1
4714*1810*1442 1
长4484mm 宽1798mm \高 1577mm 1
5090×1926×1900 1

看到这尺寸我就吐了…… 真是什么格式都有。

作为一个前端,用 javascript 简单的把他转化成了一个统一、干净的格式还是很容易的,相同尺寸的人数也统计(加)起来

var car = {};
require("tongji.txt")
.split("\n")
.forEach(function(v){
  var [size, num] = v.split("\t");
  size = size.replace(/^\D*(\d{4})\D*?(\d{4})\D*?(\d{4})\D*$/g, '$1*$2*$3')
  if (!car[size]) car[size] = 0;
  car[size] += num*1; 
});

/*
car = {
  4369*1802*1445: 1,
  4430*1793*1399: 2,
  4484*1798*1577: 1,
  4567*1786*1454: 1,
  4670*1780*1435: 1,
  4671*1815*1478: 1,
  4714*1810*1442: 1,
  4929*1898*1655: 1,
  5090*1926*1900: 1,
  5300*1800*1600: 1,
  //...
}
*/

清洗好的数据,就存入数据库

匹配车型

数据虽然干净了,但我还是有点不放心,通过车辆尺寸真的能找到车型?

找了一个车型库,简单写一个 SQL 测试一下

select 
  concat(`长度(mm)`, '*', `宽度(mm)`, '*', `高度(mm)`) as size, 
  count(distinct 车系) as cnt,
  group_concat(distinct 车系)
 from models 
group by size 
order by cnt desc 
limit 1000

得到的结果都是如下表一样,都是同品牌的相似车型,应该对结果不会有太大影响。
再连接上我的测试数据,结果几乎只是国产、进口的区别。

size cnt group_concat(distinct 车系)
4629*1880*1653 2 奥迪Q5,奥迪Q5(进口)
4638*1803*1598 2 英菲尼迪EX,英菲尼迪QX50(进口)
4624*1811*1460 2 宝马3系,宝马3系(进口)
4660*1852*1400 2 英菲尼迪G系,英菲尼迪Q60

为了计算方便,我再把 size 直接转化成了车型 id,这样数据就算准备好了。

DataV 上场

首先选了一个最顺眼的模板(技术男一般喜欢冷色,除非你心里住了一只小绵羊,才会选择“双11”的同款大屏)


我暂时没有什么地理数据,所以人人喜爱的地图,这次就删掉了,如果有人想看地图的操作分享,可以给我留言,我会再做异常关于地图可视化的分享。


先把指标想好,把模块的标题改成想要的指标,不知道想看什么指标,就像我一样,神秘点——数据探索。


中间想要一个车系分布,这么大的区域可以列出很多车了。

添加一个饼图,调整好位置后直接选择到已经建好的数据库,

输入sql

selectsum (l.num) as y, 车系 as x
  from stats aslleftjoin models asconc.id = l.car
 groupby x orderby y desclimit30;

效果不满意,怎么办?再教你一招设计

r2d

然后再添加一些组件丰富一下

r3a

再增加几个个查询:

/* 总价值 */

select sum(num * price)*10000 as value from stats as l 

left join models as c on c.id = l.car;

/* 车辆总数 */

select sum(num) as value from stats

/* 平均车价 */

select sum(num*price)/sum(num) as value from stats

left join models as car on car.id = stats.car;

/* 排量分布 */

select sum(l.num) as y, `排量(L)` as x

from stats as l 

left join models as c on c.id = l.car 

group by `排量(L)` 

order by x asc

limit 20

/* 60万以内的价格分布 */

select sum(l.num) as y, concat(ceil(price/5)*5,"万") as x

from stats as l 

left join models as c on c.id = l.car 

where price < 60

group by FLOOR(price/5)

order by FLOOR(price/5) asc

这样就完成了中部的开发。


同样的方法给左侧添加数据,上面两个组件并不是我的style。先换掉,注意换掉组件的时候,数据源要重新选择一次。

r5a

右边也就以此类推啦,其实不一定要等想好了所有指标才动手。在做这个屏的时候,当数据输出成图表的瞬间,我经常会得到更有意思的想法。这个时候动手改改sql,也许更棒的指标就出来了。

做大屏重要的就是设计和数据:

设计方面:

如果你像我一样,是位个人爱好者,可以多去看看好莱坞大片,提升下数据审美。

如果你在一家有设计资源的企业,那就让他帮你做个视觉定位。一般是中间指标最关键,然后左边一栏指标是一条业务线,右边一栏指标是一条业务线,方便解读。

数据方面:

如果是个人学习,就到网上找点公开数据,或者直接在页面编辑静态数据。

如果是企业,那就按照企业的要求指标计算好,然后从数据读实时来读, DataV的数据一栏中可以设置多久读一次库。

除此之外,我其实还是个数据分析师,如果你有数据不知道怎么分析,也可以留言给我,我可以帮你用 DataV深入分析下。记住,汽车数据优先哦!

给DataV留个传送门,还没买的人可以看下,1块钱3个月,一般人我不告诉他。


本文经授权,转载自 阿里云栖社区。更多技术分享,欢迎关注 阿里云栖大讲堂
0
0
  • CSDN官方微信
  • 扫描二维码,向CSDN吐槽
  • 微信号:CSDNnews
程序员移动端订阅下载

微博关注

相关热门文章