精华内容
下载资源
问答
  • 【功能】 1. 快速准确抓取数据 2. 断点续抓(关闭程序后,下次打开,可自动继续抓取,不用从头开始) ... 5. 目标网站根目录以及数据文件保存路径可配置 6. 内置关闭程序事件的处理方法(暂时没有启用)
  • 2019年国家行政区划5级数据 。下载时间为2020年8月4日。含爬虫代码以后可自行爬取最新年度数据。之前上传的一版存在生僻字乱码。如自行源码拉取请将GB2312改为GBK执行。此包执行结果文件已改。
  • 5级地区行政区划数据

    2019-02-26 13:32:59
    5级地区行政区划数据
  • 2016年统计用区划代码和城乡划分代码 山西2016年5级行政区划数据
  • 2016年统计用区划代码和城乡划分代码 河北2016年5级行政区划数据
  • 京东省市区街道 行政区划4SQL数据 共51701条,2021年5月20日 最新数据
  • 2016年统计用区划代码和城乡划分代码 北京市2016年5级行政区划数据
  • 通过个人开发的数据抽取工具,从国家统计局官方网站中提取出全国行政区划数据,包括省、市、县、乡(镇)、村五级行政区划数据数据包含行政区划代码、名称,级别以及上级行政区划等信息,数据文件为db格式。
  • 70w+的数据
  • 2020最新中国统计局中国省市区县乡镇 5 级行政区划代码sql数据
  • 之前我爬了datav的地图选择器中全国省市区的...index_2019_level_5.json:全国省市区县乡镇 5 12 位行政区划代码 province 文件夹是全国各省行政区划代码(文件名开头的两位数为各省行政区划代码前两位) provinc

    之前我爬了datav的地图选择器中全国省市区的geoJSON数据

    为了获取最新省市区的行政区划代码用于级联组件,又爬了国家统计局的内容

    点此查看

    index_2019_level_3.json:全国省市区 3 级 6 位行政区划代码

    index_2019_level_5.json:全国省市区县乡镇 5 级 12 位行政区划代码

    province 文件夹是全国各省行政区划代码(文件名开头的两位数为各省行政区划代码前两位)

    province/level_3 为各省 3 级 6 位行政区划代码
    province/ level_5 为各省 5 级 12 位行政区划代码

    getArea.py 为简易的爬虫脚本,需要修改爬取内容的见脚本说明

    脚本说明:

    # config #
    
    year = '2019'       # 年份,目前国家统计局官网有2009-2019年的数据
    level = 3           # 可选:3|5   获取的层级 3层为省-市-区  最多5级省-市-区-县(街道)-乡镇(居委会)
    digit = 6           # 可选:6|12  行政区划代码位数  层级为3级时通常使用6位代码 如110000,层级为5级时使用12位代码 如 110000000000
    head_url = "index"  # 可选:index|各省行政区划前两位  要从哪开始获取 index为全国所有省份  要获取单独的省份修改为省行政区划的前两位
    
    # config #
    

    按照注释修改 config 中的内容再运行脚本可以获取自己想要的结果

    展开全文
  • 最新国家统计局5级行政区划数据sql,数据库mysql
  • 最新行政区划数据5级地址 2019-01-31国家统计局发布截止20181031日止的行政区划数据: 省、市、区、街道(乡镇)、居委会 可与国家统计局数据一一对比,数据很全面的,无错误数据,无乱码,无遗漏,区划编码和名称...
  • 全国五级行政区划数据(省市区县乡镇村),共计74万多条,有需要的请下载,记得关注、点赞哦!
  • 行政区划代码,省/市/区*(县)/街道(镇)/居委会(村),国家统计局官方网站数据,cvs格式,utf-8编码,在excel中打开可能是乱码,在notepad+中可正常打开,可以加工为脚本导入数据库
  • 由于工作需要用到地址五联动,爬取了国家统计局的行政区划代码2019年的数据(暂时最新就是2019年的),包含省、市、县/区、街道/镇、社区/村,精确至社区/村。 SqlServer数据库导出csv文件,逗号分隔符,总计...
  • 最新全国5级行政区划数据抓取(国家统计局),支持多线程,速度快,C#开发的工具,如果不能运行,请先确认是否有安装.net framework4.0 ,抓取完后数据会存在同目录下的data.csv文件中,含编码、上级编码、名称、层级...
  • 全国5级数据,细化到村屯 1:省、直辖市、自治区 2:地级市 3:市辖区、县(旗)、县级市、自治县(自治旗)、特区、林区 4:镇、乡、民族乡、县辖区、街道 5级:村、居委会 三种格式: area_code_2020.csv....
  • mysql数据,中国最新行政区划数据,到乡村共5级。分享给大家 地址:https://pan.baidu.com/s/1JP2m38ETMriFJTnKjNkgcw 提取码:ccs0

    mysql数据,截止今天,国家统计局公布的中国最新行政区划数据,到乡村共5级。分享给大家

    地址:https://pan.baidu.com/s/1JP2m38ETMriFJTnKjNkgcw
    提取码:ccs0

    展开全文
  • 最全的五城市数据mysql数据库,下载直接用navicat导入即可,亲自测试过,总共767965条数据
  • 中国目前最新最全的全国5级行政区划代码,省(市)、市(区)、县(区)、街道(乡镇)、居委会(乡村),以上是MySQL脚本。数据来源:国家统计局。
  • 2019年全国行政区划数据,近70万条,包含省、市、县、镇5级,有CSV、TXT、XLSX、SQL四种格式,有开发需要的朋友可以下载使用。
  • 全国 省 市 区县 街道 村5级行政区划.txt
  • 2018年国家统计局行政区划数据,已整理为JSON格式,各级已经分好 文件列表: 2018行政区划数据_省_GBK.json 2018行政区划数据_省市_GBK.json 2018行政区划数据_省市区_GBK.json 2018行政区划数据_省市区街_GBK.json ...
  • 2020年最新行政区划数据是从国家统计局的网站上抓取而来,一共70多万条数据,以文本文件格式存放,第一列是行政区划码,第二列是名称,第三列是城乡分类代码。之前搜索的行政区划码总是不全,这也是无奈之下自己...
  • 2019年最新5级行政区划数据,包括全国乡镇村,五联动,从省到村都有。一共有70多万条数据。100M以上数据
  • 省市区级联完整版本,最新完全版本,包含区号、坐标等
  • 最新行政区划码表数据csv

    千次阅读 2020-02-11 14:23:15
    行政区划编码,使用时请更新最新链接 目标任务 产出结果1 省编码/ 市编码/ 省名称/ 市名称 示例数据 产出结果2 省编码/ 市编码/ 区县编码/ 省名称/ 市名称/ 区县名称 示例数据 实现代码 产出结果1 ...

    写在前面

    • 数据码表,脚本解析并整合
    • 目标任务
      • 产出结果1
        • 省编码/ 市编码/ 省名称/ 市名称
        • 示例数据在这里插入图片描述
      • 产出结果2
        • 省编码/ 市编码/ 区县编码/ 省名称/ 市名称/ 区县名称
        • 示例数据在这里插入图片描述

    实现代码

    • 产出结果1
    import requests
    import warnings
    import pandas as pd
    from bs4 import BeautifulSoup
    warnings.filterwarnings('ignore')
    pd.set_option('display.max_rows',5000)
    
    xzqh_html = requests.get('http://www.mca.gov.cn/article/sj/xzqh/2019/2019/201912251506.html')
    print("xzqh_html_status_code: " + str(xzqh_html.status_code))
    soup = BeautifulSoup(xzqh_html.text, 'html.parser')
    
    xzqh_codes = []
    xzqh_names = []
    
    for sp in soup.find_all(attrs={"class" : "xl7028029"}):
        ts = sp.getText().strip()
        if ts.isdigit():
            xzqh_codes.append(ts)
        else :
            xzqh_names.append(ts)
            
    xzqh_code_names = [ [xzqh_code, xzqh_name] for xzqh_code, xzqh_name in zip(xzqh_codes, xzqh_names) ]
    
    xzqh_code_names_df = pd.DataFrame(xzqh_code_names, columns=['xzqh_code','xzqh_name'])
    xzqh_code_names_df['xzqh_name'] = xzqh_code_names_df.xzqh_name.apply(lambda xzqh_name : '中国台湾省' if '台湾省' in xzqh_name else xzqh_name)
    xzqh_code_names_df.head(3)
    
    # 省份-直辖市-自治区-特别行政区处理
    sf_zxs_zzq_tbxzqs = xzqh_code_names_df[xzqh_code_names_df.xzqh_code.str.endswith('0000')]
    sf_zxs_zzq_tbxzqs['xzqh_ssq_code'] = sf_zxs_zzq_tbxzqs.xzqh_code.apply(lambda xzqh_code : xzqh_code[0:2])
    
    xss = xzqh_code_names_df[(~xzqh_code_names_df.xzqh_code.str.endswith('0000')) & xzqh_code_names_df.xzqh_code.str.endswith('00')]
    xss['xzqh_ssq_code'] = xss.xzqh_code.apply(lambda xzqh_code : xzqh_code[0:2])
    
    # 省-下属市结果合并
    union_df = pd.merge(sf_zxs_zzq_tbxzqs, xss, on='xzqh_ssq_code', how='left')
    union_df.columns = ["province_code","province_name","xzqh_ssq_code","city_code","city_name"]
    
    # 删除无效列
    union_df = union_df.drop(columns='xzqh_ssq_code')
    
    """
    空值列数据补充
    """
    from numpy import NaN
    def makeup_val(province_code,city_code):
        if city_code is NaN:
            return province_code
        else:
            return city_code
    # 补充直辖市-特别行政区等空数据
    union_df['city_code'] = union_df.apply(lambda rw: makeup_val(rw['province_code'],rw['city_code']),axis=1)
    union_df['city_name'] = union_df.apply(lambda rw: makeup_val(rw['province_name'],rw['city_name']),axis=1)
    
    # 格式化结果数据
    union_df['province_code'] = union_df.province_code.apply(lambda province_code : province_code[0:2])
    union_df['city_code'] = union_df.city_code.apply(lambda city_code : city_code[0:4])
    
    # 导出结果性文件
    union_df.to_csv("./2019年11月中华人民共和国县以上行政区划代码_省市_编码_中文名_340.csv",encoding='utf8',sep=',');
    print(len(union_df.province_code.unique()), union_df.shape)
    34 (340, 4)
    union_df.head(3)
    

    • 截至2017年12月31日,中国有34个省级行政区,包括23个省、5个自治区、4个直辖市、2个特别行政区。
      • 23个省:河北省、山西省、辽宁省、吉林省、黑龙江省、江苏省、浙江省、安徽省、福建省、江西省、山东省、河南省、湖北省、湖南省、广东省、海南省、四川省、贵州省、云南省、陕西省、甘肃省、青海省、台湾省。
      • 5个自治区:内蒙古自治区、广西壮族自治区、西藏自治区、宁夏回族自治区、新疆维吾尔自治区。
      • 4个直辖市:北京市、天津市、上海市、重庆市。
      • 2个特别行政区:香港特别行政区、澳门特别行政区。

    • 产出结果2
      • 依赖结果1
      • 省编码/ 市编码/ 区县编码/ 省名称/ 市名称/ 区县名称
    total_xzqh_codes = []
    total_xzqh_names = []
    
    for sp in soup.find_all('td', attrs={"class" : ["xl7028029","xl7128029"]}):
        if 'xl7028029' in sp.decode():
            parent = sp.getText().strip()
            if parent.isdigit():
                parent_xzqh_codes = parent
            else :
                parent_xzqh_names = parent
        else :
            child = sp.getText().strip()
            if child.isdigit():
                total_xzqh_codes.append([parent_xzqh_codes,child])
            else :
                total_xzqh_names.append([parent_xzqh_names,child])
    total_xzqh_code_names = [ xzqh_code+xzqh_name for xzqh_code,xzqh_name in zip(total_xzqh_codes, total_xzqh_names) ]
    
    # 合并结果数据
    total_xzqh_code_names_df = pd.DataFrame(total_xzqh_code_names,columns=['zxs_zzqd','ssqx','zxs_zzqd_name','ssqx_name'])
    total_xzqh_code_names_df['city_code'] = total_xzqh_code_names_df.zxs_zzqd.apply(lambda zxs_zzqd : zxs_zzqd[:4])
    total_xzqh = pd.merge(union_df,total_xzqh_code_names_df,on='city_code', how='left')
    
    # 剔除无用列
    total_xzqh = total_xzqh.drop(['zxs_zzqd','zxs_zzqd_name'],axis=1);
    
    # 导出结果性文件
    union_df.to_csv("./2019年11月中华人民共和国县以上行政区划代码_省市区县_2852.csv",encoding='utf8',sep=',');
    total_xzqh.shape
    (2852, 6)
    total_xzqh.head(3)
    

    末尾小结

    展开全文
  • 2017最新全国街道乡镇村级以上行政区划代码表,总共752233条数据
  • 2018年5级行政区划表 包含了 直辖市、省、市、县、乡镇五对应关系数据,下载数据后,可以直接在access中打开,也可以通过 数据库软件进行打开,完整齐全。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,144
精华内容 1,257
关键字:

行政区划5级数据