精华内容
下载资源
问答
  • 物流园区交通分析图

    2018-11-05 10:14:22
    比较实用的交通流线分析,了解物流园区开发建设中的核心要素互动
  • 2020年度中国主要城市交通分析报告-高德地图.pdf
  • 20210122-高德地图-交通行业:2020年度中国主要城市交通分析报告.pdf
  • 利用Python爬取交通指数,分析得出所有路网平均速度的脉冲,找出了每天的易发拥堵路段。 脚本包含爬虫程序,分析程序。
  • 这是一份完整的程序,运行环境为VC6.0++,也能够在更高版本上的VS2015等(IDE)上运行。 程序的功能介绍:根据实测数据绘制速度-密度(占有率)、速度-流量、流量-...关系,并进行分析;(指出最大值、临界值等)。
  • 本研究报告由高德地图智慧交通行业中心数据分 ...主要城市交通分析报告》”,且不得对报告进行有悖原 意的引用、删节和修改。报告以中文编写,英文版由中 文版翻译而成,若两种文本间有差异之处,请以中文版 为准。
  • 2020Q1中国主要城市交通分析报告-高德地图-2020.4-47页.pdf
  • 高德地图-2020Q3中国主要城市交通分析报告-2020.10-45页精品报告2020.pdf
  • 2019年Q3中国主要城市交通分析报告-高德地图-201910.pdf
  • 在一个2^k*2^k个方格组成的棋盘中,恰有一个方格与其他方格不同...棋盘覆盖问题要求下四种不同形状的L型骨牌覆盖给定棋盘上除特殊方格以外的所有方格,且任意2个L型骨牌不得重叠覆盖。 (仅供参考,请独立完成实验)
  • 2019年Q2中国主要城市交通分析报告-高德地图-201907.pdf
  • 基于高德地图的数据,对2016年中国主要城市交通状况进行分析
  • 2020Q1中国主要城市交通分析报告-高德地图-2020.4-47页
  • 基于地图API数据挖掘的道路交通运行状态分析.pdf
  • 车辆交通分析和交通运营管理工具的集合。 该项目包括: 交通引擎:基于 OpenStreetMap 的交通监控引擎。 Traffic-engine 使用 GPS 实时或离线位置数据并转换为道路速度的综合度量。 可用于各种分析应用,包括生成...
  • 2018年Q2中国主要城市交通分析报告,由高德地图大数据团队撰写
  • 基于高德地图的交通数据分析

    万次阅读 2018-08-21 23:30:10
    设计需求在于每天上班早高峰期,每次都提前出门,虽然有地图可以实时查看路况,但是再过一阵时间 就会异常的堵车如果通过数据监控分析每天指定路段在什么时间段相应的拥堵情况,即可合理控制时间. 有时候很早出门,却堵车...

    前言

    设计需求在于每天上班早高峰期,每次都提前出门,虽然有地图可以实时查看路况,但是再过一阵时间 就会异常的堵车如果通过数据监控分析每天指定路段在什么时间段相应的拥堵情况,即可合理控制时间. 有时候很早出门,却堵车堵得依然快迟到,而有时出门时间晚了,却发现那个时间段的路况良好,和早出门最终到达目的地的时间相近。

    这里写图片描述

    具体思路

    还在coding中,待补充。。。

    开源项目地址

    欢迎 star or fork!
    https://github.com/unlimitbladeworks/traffic-monitor

    展开全文
  • 一种基于深度学习和图像边缘分析交通场景车道线检测方法.pdf
  • Excel折线图面积图模板-动态分析图
  • 摘要:2020年全国50个主要城市的平均路网高峰行程延时指数为1.609,同比2019年下降2.5%。 来源:高德地图 如需查看完整报告和报告下载或了解更多,微信公众号:行业报告......

    摘要:2020年全国50个主要城市的平均路网高峰行程延时指数为1.609,同比2019年下降2.5%。

     

    来源:高德地图

     

     

     

     

    如需查看完整报告和报告下载或了解更多,微信公众号:行业报告智库

    展开全文
  • 精品文档 建筑人的 PS 之二分析图的制作 路径工具 2012-05-26 20:23:04 用 Photoshop 作分析图时经常需要用到如上图的图例 比如交通分析 景观分析 下面简要介绍 一下如何用路径做出这些效果 另外做分析图更为好用的...
  • 从数据获取到交通可达性分析【全流程】

    千次阅读 多人点赞 2021-04-01 20:03:29
    嗨咯各位小伙伴们,小编又来跟大家分享GIS干货啦!今天呢,我们一起探讨一下ArcGIS中基于最小阻抗的交通可达性的完整流程,当然这个教程在其他许多公众号里都比较常见,所以今天小编会从数据获...

    嗨咯各位小伙伴们,小编又来跟大家分享GIS干货啦!

    今天呢,我们一起探讨一下ArcGIS中基于最小阻抗的交通可达性的完整流程,当然这个教程在其他许多公众号里都比较常见,所以今天小编会从数据获取、数据处理、构建交通网络、计算交通可达性等几个方面出发,将交通可达性分析整个流程从无到有的跟大家一一落实。好啦,接下来就跟小编一起进入正题吧!

    我们知道,交通可达性分析已经比较成熟应用于城市问题研究,

    首先分享一个下载路网数据的网站www.openstreetmap.org。

    1.路网数据获取。

    路网的获取方式有很多种,比如全国基础地理信息库、各种下载数据的软件、osm网站等。那我们就以OSM路网为例,先看看怎么下载吧!首先,打开osm官网,搜索我们想要的地区,比如长沙,页面会自动跳转到长沙范围。

    然后点击导出,选择手动框选区域,我们以五一广场周边作为研究区域(注意:这种下载方式不适合过大范围的选择,如需大范围的下载可选择下载镜像文件,在左侧边栏下面有几种方式可以选择),点击导出即可,数据会以osm的格式保存在本地。

    2.ArcGIS加载osm文件。

    从osm官网下载下来的文件是osm格式的,ArcGIS不支持怎么办?这时我们需要用到一个插件——ArcGIS editor for OSM(插件的下载链接我会附在文章后面,安装也很简单,一搜就有)。这里我们先用这个工具将osm数据加载进来,设置好目标文件名(放在默认地理数据库就行),系统会自动帮我们以shp格式保存下来,此过程比较慢,不是卡,需要耐心等待一会儿。

      可以看见,点线面都被加载进来啦,接下来我们需要把道路提取出来用于构建交通网络,直接按属性选择,然后根据我们分析目标选择需要的道路,右键图层导出数据即可。

    3.构建交通路网

    前几步主要介绍了怎样从osm网站下载数据并在ArcGIS中加载出来,进而提取出我们需要的道路网。那么这一步就是正式进入交通可达性分析的流程啦,首先我们先进行构建交通网络。

    a.基础数据导入。

    在工作文件夹中新建一个个人地理数据库“交通网络”,在“交通网络”下新建一个要素数据集“路网”,将之前整理好的道路导入到“路网”中(一定要记得先投影)。

    b.基础数据编辑及检查

    将数据库中的道路加载进来,打开编辑器,开始编辑,右键“道路”打开属性表,按属性选择道路类型为主要道路,下拉编辑器菜单选择合并,按照相同的步骤将其他同类型的道路一一合并。

    全部合并后,将所有要素选中,打开高级编辑工具,点击打断相交线将要素在交点处打断,这是构建交通网络的需要,然后在编辑器中点击保存并停止编辑。

    c.拓扑检查

    在“路网”要素数据集中新建一个拓扑,按照提示一直往下走,直到设置拓扑规则的步骤,按照图中所示添加规则,设置完成后验证拓扑。

    出现错误的地方,用“修剪”、“延伸”等工具进行修正,在验证拓扑直到没有错误即可构建交通路网。最终结果如图所示,路网中间已经没有拓扑错误,只有道路尽头存在悬挂点。

    d.设置道路属性

    右键道路属性,添加一个新字段“Drivetime”代表车行时间(分钟),打开道路属性表。利用字段计算器计算车行时间,公式为Drivetime=shape_length/1000。这里表示车行速度60公里每小时下的车行时间。当然每种类型的道路的车行时间不同,大家可以尝试。本文就假定是60公里每小时吧~

    e.新建交通网络

    右键“路网”数据集,新建网络数据集,按照提示往下点,依次设置路口转弯、连通性、高程建模、通行成本等属性,注意的是为网络制定通行成本的时候选择Drivetime为默认字段。即可完成一个简单的交通网络的构建。构建好的交通网络包括节点和边两种要素。

    4.交通可达性计算

    这里的交通可达性主要是区域各位置至其他任意位置的交通便捷程度,这里我们利用最小阻抗的可达性分析。我们继续吧~

    a.新建OD成本矩阵

    首先启动网络分析工具(Network Analyst),下拉工具条菜单选择新建OD成本矩阵,加载起始点和目的地点,在这里我们默认将所有路口的交点设置为起始点和目的地点,设置好后点击工具条上的求解按钮。

    b.计算可达性

    打开od线的属性表可以看见,起始点、目的地点和车行时间是我们想看见的,接下来需要计算起始点的可达性。

    右键点击“OriginID”,选择汇总,勾选“total_minutes”的总和选项,意思就是按照“OriginID”分类汇总车行时间,汇总方法是求和。最终生成可达性计算表。

    将生成的可达性计算表添加到地图中显示,打开表格,添加一个新的字段“可达性”,利用字段计算器输入公式可达性=[Sum_Total_] /( [Cnt_Origin] -1),即可求解成功。

    c.可视化

    将可达性表连接到起始点上,右键起始点,选择连接,按照图中提示进行设置即可。

    右键起始点,选择属性,切换到符号系统中,对可达性进行分级显示,选择一个自己喜欢的色带,即可。

    在工具中找到反距离权重插值工具,按照图中提示进行参数设置,其他的暂时先默认就行啦,点击确定生成可达性空间分布图。

       最后再通过一系列地图整饬进行制图表达就完成啦,最后给大家看看效果图~~~

        好啦,今天的内容到这里就结束啦,如果小伙伴们在实验过程中有什么地方遇到问题可以加小编提问,小编将竭力为您解答,我们下期见哦,后台回复【osm】领取插件链接点个赞呗!

    展开全文
  • R-交通事故数据分析报告

    千次阅读 2021-03-17 08:42:45
    本文的目标是对这些数据进行统计分析,探寻发生事故最多的州,并探查什么时候容易发生事故,事故发生时天气状况,并对此做出可视化展示:总结分析所得信息,讲述美国发生事故的总体情况,找出影响事故

    引言

    该数据来源于kaggle网站中的一个项目,其原数据集(US_Accidents_Dec20)是一个数据量49列,共400多万数据量包含2016-2020年交通事故信息。
    本文的目标是对这些数据进行统计分析,探寻发生事故最多的州,并探查什么时候容易发生事故,事故发生时天气状况,并对此做出可视化展示:总结分析所得信息,讲述美国发生事故的总体情况,找出影响事故发生以及影响事故严重程度的因子;最后对事故的严重程度进行预测分析。

    数据基本分析

    缺失值处理

    查看原始数据的缺失值数量结果如下:

    library('dplyr')
    library('DMwR')
    library('ggplot2')
    library('lubridate')
    #install.packages('Rmisc')
    library(Rmisc)
    library(mice)
    #install.packages('VIM')
    library(VIM)
    library(zoo)
    library(reshape2)
    #导入数据
    data = read.csv("D:/R数据/US_Accidents_Dec20.csv")
    ####----------------数据预处理-----------------------
    head(data)
    #查看数据的变量名
    colnames(data) 
    #查看数据的结构(4232541,49)
    dim(data)
    #查看数据中含有空值的列
    colSums(is.na(data))
    table(is.na(data))
    #可以看到TMC含1516064;End_Lat含2716477;End_Lng含2716477
    #Number含2687849;Temperature.F.89900;Wind_Chill.F.1896001;
    #Humidity...95467;Pressure.in.76384;Visibility.mi.98668;
    #列变量可视化展示
    miscol = colSums(is.na(data))##列变量缺失值计数
    miscol = sort(miscol,decreasing = T)  ##降序排列
    miscol = miscol[miscol > 0]
    p <- barplot(miscol,col = 'pink',axisnames=F,ylim=c(0,2000000),main = '列变量缺失值数量展示')
    axis(side=1,p,labels = F)
    labs <- names(miscol)
    text(cex=0.8,x=p-0.25,y=-0.1,labs,xpd=T,srt=45,adj = c(1,1))
    

    在这里插入图片描述
    首先,本文将变量值缺失个数多于总个数的20%的交通事故案例去除,此处共去除22913个案例;而后,因街道编号、风寒指数、风速、降水量的缺失值过多,所以将这几个变量移除;然后,移除与事故发生原因不相关变量;最后,采用均值插补的方法对温度、湿度、气压和能见度四个变量的缺失值进行插补,最终保留了27个变量。

    #去除空值占比过大的行
    r1 <- rowSums(is.na(data))/ncol(data) >= 0.2
    #r1是缺失值大于0.2的行
    data1 <- data[!r1, ]
    rm(r1)
    colSums(is.na(data1))
    dim(data1)    #4209628      
    #将空值过多以及对研究影响因素作用不大的变量去除
    data2 <- subset(data1, select = -c(ID,Source,TMC,End_Time,Zipcode,Timezone,
                                       End_Lat,End_Lng,Number,
                                       Distance.mi.,Description,Airport_Code,
                                       Weather_Timestamp,Wind_Chill.F.,
                                       Civil_Twilight,Nautical_Twilight,
                                       Astronomical_Twilight))
    
    #补齐缺失值
    ##用均值插补温度湿度气压能见度
    fun1 <- function(x) {
      x[is.na(x)] <- mean(x, na.rm = TRUE)
    }
    data2$Temperature.F. <- sapply(data2$Temperature.F., fun1)
    data2$Humidity... <- sapply(data2$Humidity..., fun1)
    data2$Pressure.in. <- sapply(data2$Pressure.in., fun1)
    data2$Visibility.mi. <- sapply(data2$Visibility.mi., fun1)
    ##使用0填补降水量的缺失值
    data2$Precipitation.in.[data1$Precipitation.in. %>% is.na()] <- 0
    ##测试各个变量之间有无显著线性关系
    symnum(cor(data1 %>% select(Severity,Start_Lat,Start_Lng,Distance.mi.,Temperature.F.,Humidity...,Pressure.in.,
                                Pressure.in.,Visibility.mi.,Wind_Speed.mph.,Precipitation.in.), use="complete.obs"))
    ##对风速使用前值插补法
    data2$Wind_Speed.mph.[1:5] <- zoo::na.locf(data1$Wind_Speed.mph.[1:5],fromLast = T)
    data2$Wind_Speed.mph. <- zoo::na.locf(data1$Wind_Speed.mph.)
    head(data2)
    #table(is.na(data2$Precipitation.in.))
    

    对27个变量的解释如下:

    “Severity” 显示事故的严重程度1-4 ;
    “Start_Time” 在本地时区事故的开始时间;
    “Street” 街道名称;
    “Side” 事故发生在哪一侧(L/R);
    “City” 城市名;
    “County” 乡镇名;
    “State” 州名;
    “Country” 国家US ;
    “Temperature.F.” 温度;
    “Humidity…” 湿度;
    “Pressure.in.” 气压;
    “Visibility.mi.” 能见度;
    “Wind_Direction” 风向;
    “Weather_Condition” 天气状况(雨、雪等);
    “Amenity” 附近有无便利设施;
    “Bump” 附近有无减速带;
    “Crossing” 附近有无交叉路口;
    “Give_Way” 附近有无该标志;
    “Junction” 附近是否是交界处;
    “No_Exit” 附近有无该标志;
    “Railway” 附近有无铁路;
    “Roundabout” 附近有无回旋处;
    “Station” 附近有无车站;
    “Stop” 附近有无停车标志;
    Traffic_Calming" 附近有无该标志;
    “Traffic_Signal” 附近有无该标志;
    “Turning_Loop” 附近有无转弯提示;
    "Sunrise_Sunset " 白天或晚上

    2.2 各州事故总数

    各州在2016-2020年间事故发生总数如下:

    #----------------分析各个州之间的数据----------
    data3 <-
      data2 %>%
      group_by(State) %>%
      count %>%
      ungroup
    data3 %>% nrow
    data3
    

    在这里插入图片描述
    在表中可以看到,事故发生量最多的州为CA(California),CA为美国第一大州,其经济总量在2019年约等于世界第五大经济体。经济繁荣必然伴随着交通的发达,同时交通事故发生的数量也会增大

    ##--------------------事故发生地图---------------
    install.packages('maps')
    install.packages('ggmap')
    library(maps)
    library(ggmap)
    m <- borders("state",colour = "gray50",fill="white")
    df2 <- data2 %>% select(Start_Lat,Start_Lng)  
    point <- df2[sample(nrow(df2),3000),]
    p1 <- ggplot(point,aes(x=Start_Lng,y=Start_Lat)) + m 
    p1 + geom_point(color='steelblue',alpha=.6) + 
      labs(title='美国交通事故地图')+ 
      theme(plot.title = element_text(hjust = 0.5))
    

    在这里插入图片描述

    2.3时间处理

    原始数据包含了2016-2020年五年间的数据,五年事故总数如下表所示:
    2016-2020事故总数

    年份20162017201820192020
    数量4088687121868853279494001253847

    由于事故数量庞大,本文提取出2020年的数据进行统计分析。

    3影响因素

    3.1天气状况

    本文将数据中Weather_Condition变量提出进行分析,看到该变量有85个不同的值,于是本文选取总数大于5000 的11个值,对这11个天气状况与事故出现的严重程度的关系进行交叉分析如下图所示。

    #---------------提取某一年的数据进行分析-------
    data2$year <- year(data2$Start_Time)
    summary(data2$year)
    #选择2020年的数据
    data4 <- data2[data2$year == 2020,]
    head(data4)
    colnames(data4)
    #--------------探究影响车祸程度的因子--------
    data4$Severity <- as.factor(data4$Severity)
    data4$Wind_Direction <- as.factor(data4$Wind_Direction)
    data4$Weather_Condition <- as.factor(data4$Weather_Condition)#设为因子
    str(data4)   #查看数据类型
    #封装绘图函数
    # data:数据源,xlab:x轴数据,fillc:填充颜色,
    #pos:调整位置,xname:x轴标签文本,yname:y轴标签文本
    fun_bar <- function(data, xlab, fillc, pos, xname, yname) {
      ggplot(data, aes(xlab, fill = fillc)) + 
        geom_bar(position = pos) + 
        labs(x = xname, y = yname) + 
        coord_flip() +
        theme_minimal()
    }
    #-----------探索不同天气状况的时候对事故程度的影响-------------
    #天气状况很多,只画出一部分
    rm(x1,x2,x3,x4)
    x1 <-
      data4 %>%
      group_by(Weather_Condition) %>%
      count %>%
      ungroup
    table(x1)
    #选取weather出现的数量大于5000的
    #data_wea <- subset(data4, select = c(Weather_Condition,Severity))
    #data_wea <- data_wea[data_wea$Weather_Condition != "",]
    table(data4$Weather_Condition)   #有空值
    data5 <- data4[data4$Weather_Condition != "",]
    df3 <- data5 %>% group_by(Weather_Condition) %>% dplyr::summarize(count=n())
    #按照天气状况分类统计个数,挑选出个数大于5000的情况
    df4 = df3[df3$count > 5000,]   #选出11个
    a <- df4$Weather_Condition #selected weathers
    data6 <- data5[which(data5$Weather_Condition %in% a),]
    data7 <- subset(data6, select = c(Weather_Condition, Severity))
    df5 <-
      data7 %>%
      group_by(Weather_Condition,Severity) %>%
      count 
    df5   #交叉分析统计出11个最常出现的天气下对应程度1-4的个数
    write.csv(df5,"D:/R数据/US_Accidents_2020_weather.csv", row.names=F)
    #ggplot(data7,aes(x=Weather_Condition,fill=Severity))+geom_bar(position="dodge")
    p3 <- fun_bar(data = data7, xlab = data7$Weather_Condition,
                  fillc = data7$Severity,  #堆积条形图
                  pos = 'fill', xname = 'weather', yname = 'severity')
    p3
    #rm(data7)
    

    在这里插入图片描述
    从上图可以看出发生事故最多的11个天气状况都为云雾或雨天,其中暴雨(Heavy Rain)对事故的影响相对较大,更容易照成严重的交通事故。
    随后,本文选择Temperature.F.变量进行分析,画出事故数量与温度变化的直方图:

    #-----------探索不同温度的时候对事故发生的影响-------------
    data8 <- subset(data4, select = c(Temperature.F.))
    table(is.na(data8$Temperature.F.))   #有29615个缺失值
    data8 <- na.omit(data8)   #删除缺失值
    binsize <- diff(range(data8$Temperature.F.))/80
    ggplot(data8, aes(x = Temperature.F.)) + geom_histogram(aes(y = ..density..), binwidth = binsize,
                                                            fill = "pink", colour = "blue")+
      stat_function(fun = dnorm, args = list(mean(data8$Temperature.F.), sd(data8$Temperature.F.)), 
                    size = 1) + geom_density(colour = "blue", size = 1)
    rm(data8)
    

    在这里插入图片描述
    事故发生时的温度主要集中在50-70F左右,此温度接近人体最适宜温度,会有更多人的出门,增大事故发生的机率
    随后选择Humidity…、Pressure.in.、Visibility.mi.三个变量进行分析,画出三者分别对事故发生数量的影响如下:

    #-----------探索不同湿度的时候对事故发生的影响-------------
    data8 <- subset(data4, select = c(Humidity...))
    table(is.na(data8$Humidity...))   #有32072个缺失值
    data8 <- na.omit(data8)   #删除缺失值
    binsize <- diff(range(data8$Humidity...))/40
    ggplot(data8, aes(x = Humidity...)) + geom_histogram(aes(y = ..density..), binwidth = binsize,
                                                            fill = "pink", colour = "blue")+
      stat_function(fun = dnorm, args = list(mean(data8$Humidity...), sd(data8$Humidity...)), 
                    size = 1) + geom_density(colour = "blue", size = 1)
    rm(data8)
    
    #-----------探索不同气压的时候对事故发生的影响-------------
    data8 <- subset(data4, select = c(Pressure.in.))
    table(is.na(data8$Pressure.in.))   #有32072个缺失值
    data8 <- na.omit(data8)   #删除缺失值
    binsize <- diff(range(data8$Pressure.in.))/40
    ggplot(data8, aes(x = Pressure.in.)) + geom_histogram(aes(y = ..density..), binwidth = binsize,
                                                         fill = "pink", colour = "blue")+
      stat_function(fun = dnorm, args = list(mean(data8$Pressure.in.), sd(data8$Pressure.in.)), 
                    size = 1) + geom_density(colour = "blue", size = 1)
    rm(data8)
    
    #-----------探索不同能见度的时候对事故发生的影响-------------
    data8 <- subset(data4, select = c(Visibility.mi.))
    table(is.na(data8$Visibility.mi.))   #有32072个缺失值
    data8 <- na.omit(data8)   #删除缺失值
    binsize <- diff(range(data8$Visibility.mi.))/40
    ggplot(data8, aes(x = Visibility.mi.)) + geom_histogram(aes(y = ..density..), binwidth = binsize,
                                                          fill = "pink", colour = "blue")+
      stat_function(fun = dnorm, args = list(mean(data8$Visibility.mi.), sd(data8$Visibility.mi.)), 
                    size = 1) + geom_density(colour = "blue", size = 1)
    rm(data8)
    

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在上图中可明显得看出,能见度低的时候正是事故的高发时期,能见度低会导致车辆和行人视野受限,没有足够的时间应对紧急情况,从而导致事故的发生。
    美国大部分地区气候为地中海气候,全年温暖少雨,一年四季阳光充足,十分宜居。从上图也能看出,在天气状况较好时事故发生次数最多。很大原因是天气晴朗时,会有更多人走出家门游玩,人流量和车流量都会相应增大,发生交通事故的可能性也会上升。相比之下,天气状况不好时事故发生数量反而降低,这种天气下,人们会减少出行次数。

    3.2时间因素

    首先,对每天中交通事故发生时间进行分析,作出折线图:

    #---------------分析各个时间段发生事故的数据----------
    head(data2)
    data2$Start_Time <- as.POSIXct(data2$Start_Time)#设置时间格式
    data2$St_hour <- hour(data2$Start_Time)
    df1 <- data2 %>% group_by(St_hour) %>% dplyr::summarize(count=n())
    p2 <- ggplot(df1,aes(x=St_hour,y=count,fill='pink'))
    p2 + geom_line(linetype=1,color='blue')+
      geom_point(size = 3, shape = 21, colour = "blue",fill='white')+
      geom_area(fill = 'pink',alpha=.7)+
      scale_x_continuous(breaks = c(0:23),name='hour')+
      labs(title='各时间车祸发生次数')+ 
      theme(plot.title = element_text(hjust = 0.5))
    #rm(df1)
    data2$mon <- month(data2$Start_Time)
    df1 <- data2 %>% group_by(mon) %>% dplyr::summarize(count=n())
    p2 <- ggplot(df1,aes(x=mon,y=count,fill='pink'))
    p2 + geom_line(linetype=1,color='blue')+
      geom_point(size = 3, shape = 21, colour = "blue",fill='white')+
      geom_area(fill = 'pink',alpha=.7)+
      scale_x_continuous(breaks = c(0:23),name='month')+
      labs(title='各月车祸发生次数')+ 
      theme(plot.title = element_text(hjust = 0.5))
    write.csv(data2,"D:/R数据/data2.csv", row.names=F)
    

    在这里插入图片描述
    从上图可知,一天之中两个事故发生高峰期位于早上6-9点与下午4-6点之间,这与人们的生活作息相关,如这两段时间内人们会集中上下班和上学放学。
    对于每年中交通事故在各月中出现的次数进行分析,探查其季节规律,绘出折线图如下:

    在这里插入图片描述
    由上图可知,2016-2020年间美国在上半年的事故数明显少于后半年的事故数。

    3.3路况因素

    对于路况、白天黑夜这样的环境因素对于事故发生的影响,我们选取多个逻辑变量进行探寻,绘制出环境因素的堆积条形图如下:

    #------------探索定性变量对事故的影响--------------
    library(plyr)
    library(magrittr)
    data9 <- subset(data4, select = c(Crossing, Sunrise_Sunset, Precipitation.in., Traffic_Signal,
                                      Give_Way, Junction, Bump, Station, Railway, Traffic_Calming,
                                      Turning_Loop))
    #Traffic_condition <- data1 %>% select(Crossing,Sunrise_Sunset,Precipitation.in.,Traffic_Signal,Give_Way,Bump)
    #将降雨量转化为逻辑变量
    data9$Precipitation.in.[data9$Precipitation.in. > 0] <- 'True'
    data9$Precipitation.in.[data9$Precipitation.in. == 0] <- 'False'
    head(data9)
    #查看各个变量的结构
    table(data9$Sunrise_Sunset) #Sunrise_Sunset中有空值,删去
    data9 <- data9[data9$Sunrise_Sunset != "",]
    data9$Sunrise_Sunset[data9$Sunrise_Sunset == 'Day'] <- 'True'
    data9$Sunrise_Sunset[data9$Sunrise_Sunset == 'Night'] <- 'False'
    df6 <- rbind(colSums(data9=='True'),colSums(data9=='False')) %>%cbind(Boolean=c('True','False')) %>% data.frame()
    data_env <- melt(df6,
                    id.vars = 'Boolean',
                    variable.name = 'Environ',
                    value.name = 'Accidents'
    )
    str(data_env)   #Accidents为字符型数据,转换为数值型
    data_env$Accidents <- as.numeric(data_env$Accidents)
    x1 <- ddply(data_env,'Environ',transform,
                percent_num = Accidents/sum(Accidents)*100)
    p4 <- ggplot(x1,aes(x=Environ,y=percent_num,fill=Boolean))
    p4 + geom_bar(stat = 'identity',color='blue')+ 
      scale_fill_brewer(palette = 11)+
      geom_text(aes(label=paste(round(percent_num),"%"),vjust=-0.3))+
      labs(title='环境因素堆积条形图')+ 
      theme(plot.title = element_text(hjust = 0.5))
    

    在这里插入图片描述
    从上图可知,交通事故主要发生道路交界处、交通信号灯、车站等地方。这些地方往往路况比较复杂,车流量和人流量都比较大,容易发生交通事故。尤其是十字交叉路口,四个方向的车汇集此处,相比普通路段,碰撞的概率大大增加。

    4 预测分析

    本文选取Crossing、Sunrise_Sunset、Precipitation.in.、Traffic_Signal、Junction、Station、Railway、Temperature.F.、Humidity…、Pressure.in.、Visibility.mi.、St_hour、mon这13个因子对事故的严重程度建立模型进行预测。其中,将逻辑变量转化为数值型的0、1,将所有因子转化为数值型变量进行xgboost模型的建立。

    #--------------------预测--------------------
    install.packages('xgboost')
    library(xgboost)
    #由上述分析中,将有用指标提取出来
    data4$mon <- month(data4$Start_Time)
    data0 <- subset(data4, select = c(Crossing, Sunrise_Sunset, Precipitation.in., Traffic_Signal, Junction,
                                      Station, Railway, Temperature.F., Humidity..., Pressure.in., Visibility.mi.,
                                      St_hour, mon, Severity))
    table(data0$Sunrise_Sunset)
    data0 <- data0[which(data0$Sunrise_Sunset!=''),]
    data0$Sunrise_Sunset[data0$Sunrise_Sunset=='Night'] <- 'False'
    data0$Sunrise_Sunset[data0$Sunrise_Sunset=='Day'] <- 'True'
    data0[data0=='False'] <- 0
    data0[data0=='True'] <- 1
    str(data0)
    colnames(data0)
    #将变量值转化为数值型
    data0[,1:13] <- data0[,1:13] %>% apply(2,as.numeric) %>% data.frame()
    y <- data0$Severity
    X <- scale(data0[,-14],scale = T) %>% data.matrix()
    bst <- xgb.cv(data = X,label = y,max.depth=12,eta=0.007,nrounds = 10,
                  objective = "multi:softmax",num_class=5,nfold = 5,booster='gbtree')
    
    xgmodel <- xgboost(data = X,label = y,max.depth=12,eta=0.007,nrounds = 10,
                       objective = "multi:softmax",num_class=5,booster='gbtree')
    pre_y <- predict(xgmodel,X)#预测值
    accuracy <- sum(pre_y==y)/length(y)#计算准确率
    accuracy
    
    

    最后计算出模型的准确率为0.816472,模型比较合适。

    5 总结

    1. 美国交通事故发生最多的州是加利福尼亚州,并且交通事故数量逐年上升。
    2. 影响交通事故的主要因素有天气、路况、出行时间等。天气越好,路况越差,事故发生越频繁;
    3. 出行时间则与人们的生活作息有关。各城市经济越发达,事故发生次数也越多。
    4. 我们在外出之时,需要注意路况,在交叉路口、转弯标识等处注意车辆和行人。
    展开全文
  • 2019年Q1中国主要城市交通分析报告-高德地图-201904.pdf
  • 通过ANSYS-CFX软件对正常情况与不同颈内动脉狭窄程度时的Willis环分别进行了流固耦合有限元分析,结果表明,前交通动脉部分的血流随狭窄程度增大呈增大趋势,血管应力集中位置与前交通动脉瘤的发生位置相一致,为临床...
  • 通过对一典型雾天交通场景图像进行分析,采用HSL色彩空间直方方法、FFT频谱分析方法、小波多尺度子空间能量分布分析等方法,分析并比较了原、天空区域子图、交通标志子图的特性。提取了反映雾天照明强度和交通...
  • 智能视频分析介绍 智能视频分析VCA Video Content Analysis 是计算机图像视觉技术在安防领域应用 的一个分支主要有两种一种基于目标行为的智能分析如智能周界入侵检测另一种是基 于目标特征的内容识别如车牌识别人脸...
  • 交通事故致因分析

    千次阅读 2018-07-10 14:26:55
    1、挖掘背景 ...分析事故发生的原因,找到事故发生的内在规律,对交通部门进行道路交通的改进和提高民众的出行安全具有重大意义。  本次提供了交通事故相关的多维度数据,通过对事故类型、事故人员、事...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 58,936
精华内容 23,574
关键字:

交通分析图分析什么