(2)国界、南海诸岛的矢量绝不修改,一律以国家基础地理信息2022年发布的数据为准;
(3)各地属性、统辖信息一律以民政部2019年的数据为准;
我之前写过一篇博客用来处理该数据库,具体参考:1:100w基础地理信息数据的镶嵌(zhuanlan.zhihu.com/p/458211981)
上述步骤处理完之后,数据是分块的。
进行县名称的数据融合,以消除下面的方块状组合,再最后选择中国区域,获得的行政区划数据如下所示。
写到这里,首先感谢公众号数读城事继续几年的区划数据更新,这套数据的属性信息是最全的,而且是和民政部代码相契合的。这里我直接使用了这套数据进行了基于县名称的空间连接。由此我们的区划数据初步具有了各县的属性信息。
6区划矢量修改数据修复
由于这套数据存在多处数据的矢量拓扑错误,我们首先使用arcgis自带的修复几何功能进行修复。然后不能修复的位置,我们进行空间定位,通过编辑矢量功能进行修复。
在制作过程中,也遇到了民政部有行政代码,国家基础地理信息数据无矢量的情况,比如深圳的坪山区。如果遇到这样的问题,我会首先参考天地图行政区划、民政部的矢量区划,如果没有则参考高德地图的适量区划。比如深圳的坪山区并无矢量:
另外,也遇到了民政部无代码,但有矢量的情况,比如说甘肃太子山天然林有区划矢量,但行政级别上又属于几地管辖:
又如莲花山风景保护区无行政区划代码,参考高德地图区划数据,并入康乐县:
另外比较特殊的地区是台湾省,有县级矢量,但在民政部的行政区划中只有省级代码。为保证本数据的所有属性数据以民政部为准,这里对台湾省的所有县级数据进行了合并,只保存省级矢量。
7属性数据修改
这部分也是耗时最长的步骤,即使在大部分数据有属性数据的情况下,依然问题较多。
代码、名称等错误
另外就是我国还有一些特殊的行政单位,比如省直辖市、省直辖县行政级别上属于县级单位,但又无地级单位。
比如湖北省的潜江市、天门市、仙桃市,河南的济源市,海南的临高县、东方市等,具体分布图如下所示,这部分区域统一将地级属性命名为空
还有一些比较特殊的地区,是地级市,但截止2019年末,该地区又无县级行政单位,比如海南儋州市、广东东莞市等。这部分区域统一将县级属性命名为空。
地名县级县级码县级类地级地级码地级类省级儋州市不统计0不统计儋州市460400地级市海南省东莞市不统计0不统计东莞市441900地级市广东省嘉峪关市不统计0不统计嘉峪关市620200地级市甘肃省三沙市不统计0不统计三沙市460300地级市海南省中山市不统计0不统计中山市442000地级市广东省海西蒙古族藏族自治州直辖不统计0不统计海西蒙古族藏族自治州632800自治州青海省省级为空区域
在进行检查前,首先普及一下我国大体的行政区划级别。
林区,是中国行政区划之一,行政地位与市辖区、县级市、县、自治县、旗、自治旗、特区相同,属县级行政区,现仅有一个,为湖北省直辖的神农架林区
因此:
省级行政单位有:省、直辖市、自治区、特区
市级行政单位有:地级市、自治州、地区、盟
此外,还有省直辖县、省直辖市。在民政部的行政区划等级中不属于任何地级行政区划代管。属于县级行政区,不经地级行政区代管或管辖,由省级行政区直接管辖,独立于地级行政区之外单独建制,由所在的省或自治区直接领导和管理。因此省直辖县、省直辖市无地级行政区,也属于县级行政区。
合计行政区划单位合计行政区划单位合计行政区划单位344直辖市23省5自治区2特别行政区333293地级市7地区30自治州3盟2846965市辖区387县级市1323县117自治县49旗3自治旗1特区1林区
县级数量检查
逐个省份进行县级数量检查,检查表格如下:
地区县级数量地区县级数量北京市16市辖区湖南省36市辖区18县级市61县7自治县天津市16市辖区广东省65市辖区20县级市34县3自治县河北省47市辖区21县级市94县6自治县广西壮族自治区41市辖区9县级市49县12自治县山西省26市辖区11县级市80县海南省8市辖区5县级市4县6自治县内蒙古自治区23市辖区11县级市17县49旗3自治旗重庆市26市辖区8县4自治县辽宁省59市辖区16县级市17县8自治县四川省54市辖区18县级市107县4自治县吉林省21市辖区20县级市16县3自治县贵州省15市辖区9县级市52县11自治县1特区黑龙江省54市辖区21县级市45县1自治县云南省17市辖区17县级市66县29自治县上海市16市辖区西藏自治区8市辖区66县江苏省55市辖区22县级市19县陕西省30市辖区6县级市71县浙江省37市辖区20县级市32县1自治县甘肃省17市辖区5县级市57县7自治县安徽省44市辖区9县级市52县青海省7市辖区4县级市26县7自治县福建省29市辖区12县级市44县宁夏回族自治区9市辖区2县级市11县江西省27市辖区11县级市62县新疆维吾尔自治区13市辖区26县级市61县6自治县山东省57市辖区27县级市53县香港特别行政区河南省53市辖区22县级市83县澳门特别行政区湖北省39市辖区25县级市36县2自治县1林区台湾省
在检查过程中,将错误的县级类型属性改为正确的,最后我国县级类型分布图如下所示:
这一步是在数据合并完成后进行的,是对逐个省份进行市级类型检查,主要注意几个无县级行政区的地级市,以及直辖市无地级行政单位。最后我国市级类型分布图如下所示:
在检查完矢量与属性信息之后,使用数据融合工具进行地级和省级的数据合并。
我国的市级数据如图所示:
我国的省级数据如图所示:
参考GADM属性信息,给矢量数据添加数据的英文属性,各个属性名称对应的名称如下:
中文英文属性名地名NAME县级NAME_3县级码GID_3县级类TYPE_3地级NAME_2地级码GID_2地级类TYPE_2省级NAME_1省级码GID_1省级类TYPE_1地名的中文拼音标注VAR_NAME县级的中文拼音标注VAR_NAME3地级的中文拼音标注VAR_NAME2省级的中文拼音标注VAR_NAME1
省市县的类型英文名对应为:
中文名英文名中文名英文名县County地级市PrefectureCity县级市CountyCity自治州AutonomousPrefecture自治县AutonomousCounty地区Prefecture市辖区District盟League旗Banner直辖市Municipality自治旗AutonomousBanner省Province林区ForestryArea自治区AutonomousRegion特区(县级)SpecialDistrict特区SpecialDistrict
不统计NULL
另外,考虑到汉语拼音是表述普通话语音的拼音系统,后被用作对外宣传的拼写法则,这也就是我们看到大部分省市英文为拼音的原因。也有部分地区是非拼音,使用的是邮政式拼音。例如广东、广西、福建有一部分地区的地名已经有了拉丁字母的习惯拼法,例如Amoy(厦门)、Canton(广州)、Foochow(福州)等。
但考虑到我国一直使用的拼音代表地名,联合国也于1977年起正式改用汉语拼音拼写中国大陆地名,因此本数据全部采用拼音系统代表地名。但单个字的地区,比如广西横县、山西临县等,保留县名称,再命名。带民族的,保留民族的英文名字。
自此,我们获得了完整的具有英文属性的省市县行政区划矢量数据。
2020年省市县11数据获取
12
我为什么会选做这样的事?是因为我在搭建自己的网站(landcover100.com)中,经常遇到行政区划数据的问题。到底该用哪一套行政区划数据深深困扰着我。天地图数据?不完整。中科资环数据?太旧。高德地图数据?属性不够。