基于土地利用类型数据的统计人口空间化模型研究:以福建省为例

潘颖 黄万里 叶士琳 祁新华

引用本文:
Citation:

基于土地利用类型数据的统计人口空间化模型研究:以福建省为例

    作者简介: 潘 颖(1996−),女,福建人,硕士生,主要研究方向为城市地理与城镇规划. E-mail:panying961224@163.com;
    通讯作者: 祁新华, fjqxh74@163.com
  • 中图分类号: K901;P208

Research on statistical population spatialization model based on land use type data: An case study of Fujian Province

    Corresponding author: QI Xin-hua, fjqxh74@163.com
  • CLC number: K901;P208

  • 摘要: 文章基于福建省土地利用类型数据进行县级统计人口的空间化,比较分区人口空间化模型与不分区人口空间化模型及不同格网大小的人口空间化精度,探讨基于土地利用类型数据的统计人口空间化模型合理性及合适空间化尺度. 结果表明:采用不分区建模的方法进行人口数据空间化,最适宜的格网尺度为6 km,其格网人口抽样精度为62.12%;采用分区建模的方法进行人口数据空间化,最适宜的格网尺度为3 km,其格网人口抽样精度为84.41%. 鉴于此,对于福建省当前的人口空间分布,采用分区建模后3 km格网尺度的人口空间分布,能够较精确地反映各县市真实的人口分布情况.
  • 图 1  福建省土地利用类型图(资料来源:www.fjmap.net)

    Figure 1.  Map of land use types in Fujian Province (Source: www.fjmap.net)

    图 2  福建省人口特征分区(资料来源:根据2016福建省统计年鉴绘制)

    Figure 2.  Zoning map of population characteristics in Fujian Province (Source: 2016 Fujian Statistical Yearbook)

    图 3  不分区建模下福建省格网人口汇总结果与县市统计人口误差分布柱状图

    Figure 3.  Histogram of aggregated population of Fujian Province and statistical population error distribution of counties and cities under general modeling

    图 4  分区建模下福建省格网人口与县市统计人口误差分布柱状图

    Figure 4.  Histogram of error distribution of grid population and statistical population of counties and cities in Fujian Province under partition modeling

    图 5  长乐区及仙游县部分乡镇人口误差分布柱状图

    Figure 5.  Histogram of population error distribution in some towns in Changle District and Xianyou County

    表 1  不分区建模下福建省平均相对误差分段统计表

    Table 1.  The segmentation statistics of average relative error in Fujian Province under general modeling

    尺度平均相对误差/%县数比例/%尺度平均相对误差/%县数比例/%
    5 km <20 25 29.41 7 km <20 26 30.59
    20~40 28 32.94 20~40 27 31.76
    40~60 19 22.35 40~60 18 12.18
    60~80 11 12.94 60~80 10 11.76
    >80 2 2.35 >80 4 4.71
    6 km <20 25 29.41 8 km <20 28 32.94
    20~40 31 36.47 20~40 25 29.41
    40~60 17 20 40~60 13 15.29
    60~80 10 11.76 60~80 12 14.12
    >80 2 2.35 >80 7 8.24
    下载: 导出CSV

    表 2  分区建模下福建省平均相对误差分段统计表

    Table 2.  The segmentation statistics of average relative errors in Fujian Province under partition modeling

    尺度平均相对误差/%县数比例/%尺度平均相对误差/%县数比例/%
    <20 18 21.18 <20 36 42.35
    2 km 20~40 20 23.53 4 km 20~40 28 32.94
    40~60 24 28.24 40~60 15 17.65
    60~80 13 15.29 60~80 2 2.35
    >80 10 11.76 >80 4 4.71
    <20 33 38.82 <20 30 35.29
    3 km 20~40 31 36.47 5 km 20~40 25 29.41
    40~60 17 20 40~60 22 25.88
    60~80 1 1.17 60~80 3 3.53
    >80 3 3.53 >80 5 5.88
    下载: 导出CSV
  • [1] 张车伟, 李庆红. 中国人口合理分布研究: 人口空间分布与区域协调发展[M]. 北京: 中国社会科学出版社, 2015.

    Zhang C W, Li Q H. Study on rational distribution of population in China: Spatial distribution of population and regional coordinated development[M]. Beijing: China Social Sciences Press, 2015.
    [2] 柏中强, 王卷乐, 杨飞. 人口数据空间化研究综述[J]. 地理科学进展, 2013, 32(11): 1 692-1 702. DOI:  10.11820/dlkxjz.2013.11.012. Bai Z Q, Wang J L, Yang F. Research progress in spatialization of population data[J]. Progress in Geography, 2013, 32(11): 1 692-1 702.
    [3] Tobler W, Deichmann U, Gottsegen J, et al. World population in a grid of spherical quadrilaterals[J]. International Journal of Population Geography: IJPG, 1997, 3(3): 203-225. DOI: 10.1002/(SICI)1099-1220(199709)3:3<203::AID-IJPG68>3.0.CO;2-C.
    [4] 淳锦, 张新长, 黄健锋, 等. 基于POI数据的人口分布格网化方法研究[J]. 地理与地理信息科学, 2018, 34(4): 83-89. DOI:  10.3969/j.issn.1672-0504.2018.04.013. Chun J, Zhang X C, Huang J F, et al. A gridding method of redistributing population based on POIs[J]. Geography and Geo-Information Science, 2018, 34(4): 83-89.
    [5] Zhuo L, Ichinose T, Zheng J, et al. Modelling the population density of China at the pixel level based on DMSP/OLS non-radiance-calibrated night-time light images[J]. International Journal of Remote Sensing, 2009, 30(4): 1003-1018. DOI:  10.1080/01431160802430693.
    [6] 胡云锋, 赵冠华, 张千力. 基于夜间灯光与LUC数据的川渝地区人口空间化研究[J]. 地球信息科学学报, 2018, 20(1): 68-78. DOI:  10.12082/dqxxkx.2018.170224. Hu Y F, Zhao G H, Zhang Q L. Spatial distribution of population data based on nighttime light and LUC data in the Sichuan-Chongqing Region[J]. Journal of Geoinformation Science, 2018, 20(1): 68-78.
    [7] Zeng C Q, Zhou Y, Wang S X, et al. Population spatialization in China based on night-time imagery and land use data[J]. International Journal of Remote Sensing, 2011, 32(24): 9 599-9 620. DOI:  10.1080/01431161.2011.569581.
    [8] 张秋媛, 彭明春, 王崇云, 等. 基于DMSP/OLS夜间灯光数据的贵州省人口分布及影响因子分析[J]. 云南大学学报: 自然科学版, 2019, 41(5): 992-1 000. DOI:  10.7540/j.ynu.20180815. Zhang Q Y, Peng M C, Wang C Y, et al. Population distribution of Guizhou Province based on DMSP/OLS night lighting data[J]. Journal of Yunnan University: Natural Sciences Edition, 2019, 41(5): 992-1 000.
    [9] Qiu F, Sridharan H, Chun Y W. Spatial autoregressive model for population estimation at the census block level using LIDAR-derived building volume information[J]. Cartography and Geographic Information Science, 2010, 37(3): 239-257. DOI:  10.1559/152304010792194949.
    [10] 廖顺宝, 李泽辉. 四川省人口分布与土地利用的关系及人口数据空间化试验[J]. 长江流域资源与环境, 2004, 13(6): 557-561. DOI:  10.3969/j.issn.1004-8227.2004.06.009. Liao S B, Li Z H. Relationship between population distribution and land use and spatialization of population census data in Sichuan Province[J]. Resources and Environment in the Yangtze Basin, 2004, 13(6): 557-561.
    [11] Jia P, Qiu Y L, Gaughan A E. A fine-scale spatial population distribution on the High-resolution Gridded Population Surface and application in Alachua County, Florida[J]. Applied Geography, 2014, 50: 99-107.
    [12] 王春菊, 汤小华. 基于GIS的福建省人口统计数据空间化[J]. 地理与地理信息科学, 2004, 20(4): 71-74. DOI:  10.3969/j.issn.1672-0504.2004.04.017. Wang C J, Tang X H. GIS-based specialization of population census data in Fujian Province[J]. Geography and Geo-Information Science, 2004, 20(4): 71-74.
    [13] 曹伟超, 陶和平, 谭理, 等. 基于多源空间数据的山区人口分布模拟[J]. 国土资源遥感, 2012(2): 61-67. DOI:  10.6046/gtzyyg.2012.02.12. Cao W C, Tao H P, Tan L, et al. Simulation of mountain population distribution based on multi-source spatial data[J]. Remote Sensing for Land & Resources, 2012(2): 61-67.
    [14] 黄益修. 基于夜间灯光遥感影像和社会感知数据的人口空间化研究[D] 上海: 华东师范大学, 2016.

    Huang Y X. Spatialization of population using nighttime light remote sensing images and social sensing data[D]. Shanghai: East China Normal University, 2016.
    [15] 冯甜甜, 龚健雅. 基于建筑物提取的精细尺度人口估算研究[J]. 遥感技术与应用, 2010, 25(3): 323-327. DOI:  10.11873/j.issn.1004-0323.2010.3.323. Feng T T, Gong J Y. Investigation on small-area population estimation based on building extraction[J]. Remote Sensing Technology and Application, 2010, 25(3): 323-327.
    [16] 梁发宏, 杨帆. 自发地理信息研究进展综述[J]. 测绘通报, 2015(S2): 74-78. DOI:  10.13474/j.cnki.11-2246.2015.0689. Liang F H, Yang F. Summary of developments in volunteered geographic information research[J]. Bulletin of Surveying and Mapping, 2015(S2): 74-78.
    [17] 俞政. 基于手机信令数据的上海市浦东新区常住人口估算[D] 上海: 上海社会科学院, 2018.

    Yu Z. Estimation of resident population in Pudong New Area of Shanghai based on mobile signaling data[D]. Shanghai: Shanghai Academy of Social Sciences, 2018.
    [18] 赵鑫, 宋英强, 刘轶伦, 等. 基于卫星遥感和POI数据的人口空间化研究——以广州市为例[J]. 热带地理, 2020, 40(1): 101-109. https://doi.org/10.13284/j.cnki.rddl.003179.

    Zhao X, Song Y Q, Liu Y L, et al. Population spatialization based on satellite remote sensing and POI data: Regarding Guangzhou as an example[J]. Tropical Geography: 2020, 40(1): 101-109.
    [19] 李双成, 蔡运龙. 地理尺度转换若干问题的初步探讨[J]. 地理研究, 2005, 24(1): 11-18. DOI:  10.3321/j.issn:1000-0585.2005.01.002. Li S C, Cai Y L. Some scaling issue of geography[J]. Geographical Research, 2005, 24(1): 11-18.
    [20] Patel N N, Stevens F R, Huang Z, et al. Improving large area population mapping using geotweet densities[J]. Transactions in GIS, 2016, 21(2): 317-331.
    [21] Yu S S, Zhang Z X, Liu F. Monitoring population evolution in China using time-series DMSP/OLS nightlight imagery[J]. Remote Sensing, 2018, 10(2): 194. DOI:  10.3390/rs10020194.
    [22] 李月娇, 杨小唤, 王静. 基于景观生态学的人口空间数据适宜格网尺度研究——以山东省为例[J]. 地理与地理信息科学, 2014, 30(1): 97-100. Li Y J, Yang X H, Wang J. Grid size suitability of population spatial distribution in Shandong Province based on landscape ecology[J]. Geography and Geo-Information Science, 2014, 30(1): 97-100.
    [23] 国家统计局福建调查总队. 2016年福建省国民经济和社会发展统计公报[N]. 福建日报, 2017-02-24(5).

    Fujian Surrey Team of National Bureau of Statistics.2016 statistical bulletin on Fujian Province's national economic and social development[N]. Fujian Daily, 2017-02-24(5).
    [24] 杨洪春. 福建省统计年鉴—2016[M]. 北京: 中国统计出版社, 2016.

    Yang H C. Fujian statistical yearbook—2016[M]. Beijing: China Statistics Press, 2016.
    [25] 张建辰, 王艳慧. 基于土地利用类型的村级人口空间分布模拟——以湖北鹤峰县为例[J]. 地球信息科学学报, 2014, 16(3): 435-442. Zhang J C, Wang Y H. Simulation of village-level population distribution based on land use: A case study of Hefeng County in Hubei Province[J]. Journal of Geo-Information Science, 2014, 16(3): 435-442.
    [26] 叶佳婕, 吴升. 福建县域人口与经济空间分布关系及变化[J]. 贵州大学学报: 自然科学版, 2016, 33(5): 29-35. Ye J J, Wu S. The evolution of spatial relationship between population and economy in Fujian Province[J]. Journal of Guizhou University : Natural Sciences, 2016, 33(5): 29-35.
    [27] 叶靖, 杨小唤, 江东. 乡镇级人口统计数据空间化的格网尺度效应分析——以义乌市为例[J]. 地球信息科学学报, 2010, 12(1): 40-47. Ye J, Yang X H, Jiang D. The grid scale effect analysis on town leveled population statistical data spatialization[J]. Journal of Geo-Information Science, 2010, 12(1): 40-47.
    [28] 董珍珍, 王亮, 仇阿根. 基于特征分区的人口数据格网化研究[J]. 测绘与空间地理信息, 2017, 40(12): 64-67. DOI:  10.3969/j.issn.1672-5867.2017.12.016. Dong Z Z, Wang L, Qiu A G. Research on the grid transformation of population data based on the feature partition[J]. Geomatics & Spatial Information Technology, 2017, 40(12): 64-67.
  • [1] 王刚张秋平肖荣波管东生 . 土地利用、人口密度及海拔对城市热岛的影响. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.20170584
    [2] 李灿曾和平 . 不同空间尺度下植被覆盖对土壤有机碳流失的影响研究进展. 云南大学学报(自然科学版), doi: 10.7540/j.yun.20180173
    [3] 张秋媛彭明春王崇云周长威 . 基于DMSP/OLS夜间灯光数据的贵州省人口分布及影响因子分析. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.20180815
    [4] 张雄浩甘淑袁希平王利华杨敏陈轩 . 云南小江流域泥石流堆积扇土地利用模式分析. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.20190448
    [5] 李秀花师庆东 . 基于TM影像和马尔柯夫模型的新疆精河县土地利用动态研究. 云南大学学报(自然科学版),
    [6] 王煊妮张玲 . 西双版纳4种生境下的桑寄生与寄主植物多样性及分布特点. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.20160542
    [7] 丁剑宏尹龙师小宁段兴武 . 红河流域景观格局演变特征研究. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.20160636
    [8] 谭正洪梁乃申张一平寺本宗正于贵瑞闫俊华 . 热带森林生态系统的土壤呼吸:简述和综合. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.20120596
    [9] 农定飞马友鑫李红梅刘文俊 . 西双版纳地区土地利用/覆盖变化对气温的影响. 云南大学学报(自然科学版),
    [10] 刘海军闫俊杰崔东孙国军图热妮萨·图尔贡 . 伊宁市土地利用结构变化及人文驱动因子分析. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.20180108
    [11] 赵益祯曹建农张晓栋何高波 . 陕北黄土高原生态脆弱地区土地利用变化的时空分析:以志丹县为例. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.20190414
    [12] 程智朱保林罗连升丁小俊 . 多层次降尺度方法对安徽省月降水量预测的研究. 云南大学学报(自然科学版),
    [13] 彭姣朱建青 . 时间尺度上相空间中非完整系统相对运动动力学的Lie对称性. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.20190526
    [14] 张腾飞马联翔鲁亚斌周国莲 . “20030816”云南暴雨过程的中尺度分析. 云南大学学报(自然科学版),
    [15] 赵英敏黄永东 . a尺度r重区间正交多小波的构造. 云南大学学报(自然科学版),
    [16] 张秀年段旭郭世昌 . 孟湾风暴合成分析及其中尺度特征. 云南大学学报(自然科学版),
    [17] 陶云段旭 . 尺度分离法在云南单点性暴雨诊断分析中的应用. 云南大学学报(自然科学版),
    [18] 尹丽云刘磊张腾飞张杰闵颖 . 云南西南部一次中尺度对流系统的地闪演变特征. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.20120197
    [19] 王民栋徐萍陶然杨敬文 . 滇西南中尺度对流飑线的移动路径和雷达回波特征. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.20150077
    [20] 朱莉张腾飞尹丽云闵颖赵宁坤 . 2010年云南6.25特大暴雨中尺度特征及成因的数值模拟分析. 云南大学学报(自然科学版), doi: 10.7540/j.ynu.2013b06
  • 加载中
图(5)表(2)
计量
  • 文章访问数:  1337
  • HTML全文浏览量:  808
  • PDF下载量:  15
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-11-04
  • 录用日期:  2020-01-16
  • 网络出版日期:  2020-05-30

基于土地利用类型数据的统计人口空间化模型研究:以福建省为例

    作者简介:潘 颖(1996−),女,福建人,硕士生,主要研究方向为城市地理与城镇规划. E-mail:panying961224@163.com
    通讯作者: 祁新华, fjqxh74@163.com
  • 1. 福建师范大学 地理科学学院,福建 福州  350007
  • 2. 福建师范大学 地理研究所,福建 福州  350007

摘要: 文章基于福建省土地利用类型数据进行县级统计人口的空间化,比较分区人口空间化模型与不分区人口空间化模型及不同格网大小的人口空间化精度,探讨基于土地利用类型数据的统计人口空间化模型合理性及合适空间化尺度. 结果表明:采用不分区建模的方法进行人口数据空间化,最适宜的格网尺度为6 km,其格网人口抽样精度为62.12%;采用分区建模的方法进行人口数据空间化,最适宜的格网尺度为3 km,其格网人口抽样精度为84.41%. 鉴于此,对于福建省当前的人口空间分布,采用分区建模后3 km格网尺度的人口空间分布,能够较精确地反映各县市真实的人口分布情况.

English Abstract

  • 人口合理分布是国土空间开发格局优化和区域协调发展的重要内容,关系到国家政治经济的长远发展[1]. 精准掌握人口空间分布特征是国家制定人口经济政策、灾害防治政策的关键环节与重要基础. 但常规人口统计数据多以行政区为基本单元进行数据收集与处理,因而其时空分辨率普遍偏低,难以有效地反映人口空间分布的特征与规律性,不利于人口发展趋势预测[2]. 20世纪90年代,有学者提出将统计型人口数据与空间信息相融合的思路[3-4],人口数据空间化成为人口数据挖掘与优化的重要方向.

    国内外学者对人口数据空间化的方法开展了大量研究,取得了丰硕的成果[5-9]. 早期研究多采用建模思路模拟人口变化,并探讨土地利用与人口分布的关系[10]. 其后,随着空间分析技术的发展,部分学者开始尝试高分辨率自然地理单元数据与人口统计数据的有机融合[11]. 近年来,人口空间化研究趋向于利用多源数据,以此揭示人口密度与土地利用、道路网密度、海拔高度等要素的内在关联[12-14]. 当前,伴随着移动互联网、物联网、大数据等技术及信息基础设施的完善,人口空间化建模数据源进一步拓展为各种新型空间数据(如LiDAR点云、夜间灯光、OSM开源地图数据、POI)、移动定位数据(如手机信号、出租车轨迹)与社交媒体的签到数据(如微博、推特等的用户签到)等[15-18].

    上述研究主要是根据建模因子模拟人口的空间分布,未能充分考虑不同区域人口分布特征的差异性,较少将格网尺度纳入人口空间化的考量范围. 在统计人口数据空间化的过程中,地理格网尺度的差异影响显著,已有研究表明,地理对象是尺度依存的,合适的格网能够表现出特有的时间、空间乃至时空尺度的特征[19]. 相关学者们对此做了大量探索[20-22],构建了全球或洲际尺度的格网化人口空间数据集以及国家级的格网人口数据集. 然而,由于人口分布的影响因子众多,不同数据源下的人口格网化结果精度和适用领域差异较大;且在以往的研究中,人口空间化过程多采用1 km×1 km的格网尺度[21],但对该格网尺度的适宜性程度却未能够深入探究,因此有必要根据区域特征对人口空间数据格网尺度的适应性进行全面评估.

    人类活动影响土地利用类型,同时在一定阶段土地覆盖类型反过来一定程度上限制人类活动,故土地利用数据是人口空间分布的关键因子. 同时,土地利用数据中的类型分类详细程度及其图斑的空间分辨率大小,是影响其在人口空间化中的关键属性,且不同区域其土地类型的破碎程度、人口分布的集聚度存在较大的差异,故单一的土地利用类型数据可以在多大尺度、多大精度上刻画人口的空间分布,这方面还有待进一步的研究与实证. 本研究基于土地利用类型数据,主要是考虑到其连续性、可获得性以及与人口数据的高度匹配性,基本能够达到本研究的目标. 鉴于此,本文选取福建省为研究区域,在分析人口分布与土地利用类型关系的基础上,叠加不同格网尺度,比较分区人口空间化模型与不分区人口空间化模型及不同格网大小的人口空间化精度,为福建省人口数据空间化研究选择适宜的格网尺度. 在此基础上,探讨基于土地利用类型数据的统计人口空间化模型的合理性,以期寻求人口空间化最优尺度,更好地表达人口空间分布的特征,提高人口数据的质量和精度.

    • 福建省位于北纬23°33′~28°20′、东经115°50′~120°40′之间,东西最宽约480 km,南北最长约530 km,陆域面积12.4万km2. 地势西北高,东南低,全省农用地面积109555 km2,建设用地面积7292 km2,未利用地面积7087 km2[23]. 福建省“依山傍海”,森林覆盖率达62.96%,居全国第1位,大陆海岸线长度居全国第2位,海岸地貌格局以多海湾、多半岛的曲折海岸线为主体. 省内人口稠密,分布不均,总人口为3839万人,平均人口密度为298人/ km2[24].

    • 研究使用的主要数据包括:人口统计数据、土地利用类型数据、福建省(含市、县、乡镇)行政区划图,数据具体信息如下.

      (1)人口统计数据 数据来自2016年福建省统计年鉴[24],包含福建省85个县市(29个市,12个县级市,44个县(含金门县))的2015年的常住人口信息. 精度检验使用福州市长乐区部分乡镇的统计人口数据以及莆田市仙游县部分乡镇的统计人口数据.

      (2)行政区划数据 包括全省县(市、区)级和乡(镇、街道)级行政区划.

      (3)土地利用类型数据 为2015年12月福建省第一次地理国情普查结束后发布于福建天地图上的10 m×10 m分辨率的栅格数据. 普查标准时点为2015年6月30日,其利用2015年3月1日至6月30日获取的航空航天遥感影像,对前期普查成果进行核准. 与本文人口统计数据及GDP数据为同年份,不存在时效性问题. 数据中具体包含10种土地利用类型(图1):房屋建筑、道路、硬化地表、人工堆掘地、荒漠与裸露地表、耕地、园地、草地、林地、水体,分类依据参考地理国情普查内容与指标(GDPJ01—2013).

      图  1  福建省土地利用类型图(资料来源:www.fjmap.net)

      Figure 1.  Map of land use types in Fujian Province (Source: www.fjmap.net)

      (4)GDP (Gross Domestic Product) 数据 GDP数据来自于2016年福建省统计年鉴,包含福建省85个县市(29个市,12个县级市,44个县)的GDP信息,该信息用于人口特征分区.

    • 本研究的数据类型有统计数据、栅格数据和矢量数据等,主要采用ArcGIS10.5进行空间数据处理,采用SPSS进行建模分析.

      首先,将统计人口数据与行政区划空间数据属性表关联,得到福建省行政区划空间数据与统计人口数据匹配后的行政区划图. 其次,采用CGCS2000坐标系,6度分带下的高斯-克吕格投影作为投影标准,统一对栅格数据(土地利用类型数据)和矢量数据(行政区划数据)进行投影转换. 再次,根据土地利用类型与县市级行政区划数据,通过ArcMap10.5中的面积制表工具,统计各个县市各类土地利用类型的面积,并将统计结果关联到县市级行政区划单元. 最后,利用ArcGIS中的格网生成工具建立规则大小的格网单元(2 km×2 km、3 km×3 km、4 km×4 km、5 km×5 km、6 km×6 km、7 km×7 km、8 km×8 km),统计各尺度格网单元内各类土地利用类型的面积.

    • 在数据预处理的基础上,对福建省各个县市(区)进行分区;然后分别进行分区人口空间化建模和不分区人口空间化建模,并套合各格网尺度与各县市实际人口进行比较,计算出建模误差,判断何种格网尺度为最适宜的格网尺度;最后进行精度检验,获得最适宜的空间化模型.

    • 现阶段人口空间格网化的研究大都为某一地区采用同一种模型进行构建,由于同一区域各个县(市、区)的自然生态环境以及经济发展状况各不相同,人口分布的差异性显著,造成了同一区域模拟的精度偏低,且小尺度区域人口统计不准确[25]. 福建省各地区人口经济要素特征存在差异,为了提高人口空间化的模拟精度,需要对福建省各县(市、区)进行特征分区.

      同时,考虑到GDP数据[26]和人口密度对福建省人口空间分布有一定的影响,故本文采取福建省各县(市、区)人均GDP数据及平均人口密度进行人口特征分区,特征分区采用ArcGIS中的分组分析工具进行.

      从分区结果(图2)可以看出:分区1主要包含12个县(市、区),是福建省经济、人口的密集区,城市化水平远高于其他地区;分区2主要包含15个县(市、区),人口密度和GDP处于中等水平,城市化程度也处于中等水平;分区3涵盖了福建省68%的县(市、区),人口密度、GDP以及城市化水平较低.

      图  2  福建省人口特征分区(资料来源:根据2016福建省统计年鉴绘制)

      Figure 2.  Zoning map of population characteristics in Fujian Province (Source: 2016 Fujian Statistical Yearbook)

    • 考虑到不同土地利用类型与人口分布的相关性各有差异[27]. 本研究通过散点矩阵图,选取土地利用中与人口呈线性相关的类型作为人口空间化建模的影响因子. 经过相关性分析,最终选取的土地利用类型包括房屋建筑、道路、硬化地表、人工堆掘地.

    • 基于土地利用类型的人口数据空间化建模是假定福建省各县(市、区)同一土地利用类型中的人口均匀分布,以各土地利用类型的面积为建模因子,人口统计数据为指示因子,县(市、区)为样本,建立多元回归模型. 从而得到每个土地利用类型的人口分布系数,模拟人口空间分布情况. 模型的一般形式为[28]

      $ {P}_{i}=\sum\limits_{j=1}^{n}{a}_{j}\times {S}_{ij}+b, $

      其中,$ {P}_{i} $ 为福建省 $ i $ 县(市、区)的统计人口数;$ {a}_{j} $$ j $ 类土地利用类型的人口分布初始系数(万人/km2);$ {S}_{ij} $ 为第 $ i $ 县(市、区)第 $ j $ 类土地利用类型的面积(km2);$ n=4 $ 代表有4种土地利用类型,常数项 $ b $ 值为截距,根据“无土地则无人口”的原则,$ b $ 值为0.

      以福建省县(市、区)级统计人口数据为指示因子,房屋建筑、道路、硬化地表、人工堆掘地为建模因子,建立多元线性回归模型,利用SPSS软件,求得各土地利用类型的人口分布初始系数 $ {a}_{j} $.

      该模型是以福建省内各县(市、区)同一土地利用类型的人口分布系数相同为前提条件,所以根据该模型计算的人口数必然与统计人口数之间存在一定偏差. 为了保证福建省内所有格网中的人口数据之和与统计人口数相一致,需要对福建省各县(市、区)初始人口分布系数 $ {a}_{j} $ 进行采用平差法进行校正,以获得福建省各县(市、区)校正后的人口分布系数 $ {a}_{ij} $. 校正公式为[28]

      $ {a}_{ij}=\frac{{P}_{i}}{{P}_{i}'}\times {a}_{j}, $

      其中,$ {a}_{ij} $ 表示福建省第 $ i $ 县(市、区)$ j $ 类土地利用类型的人口分布系数(万人/km2);$ \dfrac{{P}_{i}}{{P}_{i}'} $ 为校正系数($ {P}_{i} $$ i $ 县(市、区)实际统计人口数据,$ {P}_{i}' $ 为根据模型公式反演计算得出的 $ i $ 县(市、区)人口数据). 由此获得的各县(市、区)各土地利用类型的人口分布系数 $ {a}_{ij} $ 因为各县(市、区)统计人口数不同而存在差异.

      假设各县(市、区)的人口与格网人口具有相同的模型,将求得的各县(市、区)级的人口空间分布线性模型应用于不同格网尺度,以房屋建筑用地人口分布系数、房屋建筑用地面积、道路用地人口分布系数、道路用地面积、硬化地表用地人口分布系数、硬化地表用地面积、人工堆掘地用地人口分布系数、人工堆掘地用地面积来反推不同尺度各格网人口. 格网人口计算公式为[28]

      $ {p}_{i}={a}_{bi}\times {S}_{bi}+{a}_{ri}\times {S}_{ri}+{a}_{ii}\times {S}_{ii}+{a}_{ai}\times {S}_{ai}, $

      其中,$ {p}_{i} $ 为网格 $ i $ 上的人口值,$ {a}_{bi} $$ {a}_{ri} $$ {a}_{ii} $$ {a}_{ai} $ 分别为网格 $ i $ 上的房屋建筑用地人口分布系数、道路用地人口分布系数、硬化地表用地人口分布系数、人工堆掘地用地人口分布系数,$ {S}_{bi} $$ {S}_{ri} $$ {S}_{ii} $$ {S}_{ai} $ 分别为网格 $ i $ 上的房屋建筑用地面积、道路用地面积、硬化地表用地面积、人工堆掘地用地面积.

    • 对全省每个县(市、区)统一进行建模,模型结果如下:

      $ {\textit{P}} = 1.061{S_b} - 1.156{S_r} - 0.151{S_i} - 0.686{S_a}, $

      其中,P代表人口数(下同),$ {S}_{b} $$ {S}_{r} $$ {S}_{i} $$ {S}_{a} $ 分别为房屋建筑用地面积、道路用地面积、硬化地表用地面积、人工堆掘地用地面积.

    • 对全省每个县(市、区)按分区情况分别进行建模,模型结果如下.

      $\begin{split} {\text{分区1:}} \textit{P}=& 1.02{S_b} + 8.650{S_r} - \\[1.5pt] &1.104{S_i} - 7.102{S_a},\end{split} $

      $\begin{split} {\text{分区2:}}\textit{P} = &0.7{S_b} + 1.001{S_r} + \\[1.5pt] &0.376{S_i} - 0.678{S_a},\end{split} $

      $\begin{split} {\text{分区3:}}\textit{P} = &0.742{S_b} - 0.358{S_r} + \\[1.5pt] &0.085{S_i} - 0.173{S_a},\end{split} $

      其中,$ {S}_{b} $$ {S}_{r} $$ {S}_{i} $$ {S}_{a} $ 分别为房屋建筑用地面积、道路用地面积、硬化地表用地面积、人工堆掘地用地面积.

    • 对福建省85个县(市、区)整体进行多元统计回归建模,将人口空间化得到的结果汇总到县域单元与统计人口对比,并分析合适的网格尺度.

    • 不分区建模方式下虽有部分县市的空间化结果与统计结果较为相近,但大多数县市的空间化结果仍与统计结果误差较大(图3).

      图  3  不分区建模下福建省格网人口汇总结果与县市统计人口误差分布柱状图

      Figure 3.  Histogram of aggregated population of Fujian Province and statistical population error distribution of counties and cities under general modeling

    • 由于篇幅有限,仅将模型计算生成的5、6、7 km和8 km的格网人口套合县(市、区)行政区划界线,与各县(市、区)实际统计人口数据进行比较,计算各尺度格网人口与各县(市、区)统计人口的误差. 计算结果显示(图3),不分区建模下的各县(市、区)5 km尺度格网误差均值为34.24%;6 km尺度格网误差均值为33.83%;7 km尺度格网误差均值为35.96%;8 km尺度格网误差均值为37.16%.

      (1)从不分区建模下县(市、区)格网人口误差均值来看,6 km格网尺度下的平均相对误差最小,说明在该格网尺度下的模型精度相较于其他格网尺度的精度高.

      (2)从不分区建模下县(市、区)格网人口误差分布柱状图来看,8 km格网尺度的误差偏离误差0值较远,振幅较大;而6 km格网尺度的误差与误差0值接近,振幅较小.

      (3)从不分区建模下县(市、区)格网人口平均相对误差分段统计表(表1)来看,5 km和8 km格网尺度下的人口误差分布相对分散,误差分布中心略偏向于40%;6 km和7 km格网尺度下的人口误差分布相对集中,且6 km格网尺度下的人口误差分布重心相较于其他格网尺度的重心更集中于0~40%,说明6 km格网尺度下的模型精度相对较高.

      尺度平均相对误差/%县数比例/%尺度平均相对误差/%县数比例/%
      5 km <20 25 29.41 7 km <20 26 30.59
      20~40 28 32.94 20~40 27 31.76
      40~60 19 22.35 40~60 18 12.18
      60~80 11 12.94 60~80 10 11.76
      >80 2 2.35 >80 4 4.71
      6 km <20 25 29.41 8 km <20 28 32.94
      20~40 31 36.47 20~40 25 29.41
      40~60 17 20 40~60 13 15.29
      60~80 10 11.76 60~80 12 14.12
      >80 2 2.35 >80 7 8.24

      表 1  不分区建模下福建省平均相对误差分段统计表

      Table 1.  The segmentation statistics of average relative error in Fujian Province under general modeling

      (4)结合误差分布柱状图以及平均相对误差分段统计表可以看出,柘荣县、松溪县、屏南县、光泽县、武夷山市、三元区、将乐县、周宁县、政和县、明溪县、东山县、罗源县、福鼎市、寿宁县、建宁县、金门县、顺昌县、清流县的误差均超过了50%,属于误差较大地区. 这些地区多位于闽西北地区,地形崎岖,森林广布,经济发展水平低,人口稀少. 南靖县、安溪县、晋安区、同安区、龙海市、泉港区、仙游县、上杭县、永春县、福清市、新罗区、秀屿区、马尾区、洛江区、丰泽区、石狮区的误差小于20%,属于误差较小地区. 这些地区多位于东南沿海地区,地形平坦,经济发展水平较高,人口稠密.

      综上,不分区建模下获取的4种格网尺度人口中,6 km尺度的格网误差最小,为最适宜的格网尺度.

    • 对福建省85个县(市、区)进行人口特征分区,分别进行多元统计回归建模,并根据模型与土地利用数据进行人口空间化,将空间化得到的结果汇总到县域单元与统计人口对比,进行建模精度比较,并分析合适的网格尺度.

    • 分区建模方式下县市的空间化结果与统计结果较为相近,虽仍然有一定的误差,但与不分区建模方式下的空间化误差相比较小(图4).

      图  4  分区建模下福建省格网人口与县市统计人口误差分布柱状图

      Figure 4.  Histogram of error distribution of grid population and statistical population of counties and cities in Fujian Province under partition modeling

    • 由于篇幅有限,仅将根据模型计算生成的2、3、4 km和5 km的格网人口套合县(市、区)行政区划界线,与各县(市、区)实际统计人口数据进行比较,计算各尺度格网人口与统计人口的建模误差. 计算结果显示(图4),分区建模下的各县(市、区)2 km尺度格网误差均值为46.23%;3 km尺度格网误差均值为28.47%;4 km尺度格网误差均值为29.79%;5 km尺度格网误差均值为35.16%.

      (1)从分区建模下县(市、区)格网人口误差均值来看,3 km格网尺度下的平均相对误差最小,说明在该格网尺度下的模型精度相比较于其它格网尺度的精度高.

      (2)从分区建模下县(市、区)格网人口误差分布柱状图来看,2 km格网尺度下的误差值为误差最大偏离值,2 km和5 km格网尺度的误差偏离误差0值较远,振幅较大;而3 km格网尺度的误差与误差0值接近,振幅较小.

      (3)从分区建模下县市格网人口平均相对误差分段统计表(表2)来看,2 km和5 km格网尺度下的县市人口误差分布相对分散,误差分布中心略偏向于35%;3 km和4 km格网尺度下的县市人口误差分布相对集中,且3 km格网尺度下的县市人口误差分布重心相较于其他格网尺度的重心更集中于0~40%,说明3 km格网尺度下的模型精度相对较高.

      尺度平均相对误差/%县数比例/%尺度平均相对误差/%县数比例/%
      <20 18 21.18 <20 36 42.35
      2 km 20~40 20 23.53 4 km 20~40 28 32.94
      40~60 24 28.24 40~60 15 17.65
      60~80 13 15.29 60~80 2 2.35
      >80 10 11.76 >80 4 4.71
      <20 33 38.82 <20 30 35.29
      3 km 20~40 31 36.47 5 km 20~40 25 29.41
      40~60 17 20 40~60 22 25.88
      60~80 1 1.17 60~80 3 3.53
      >80 3 3.53 >80 5 5.88

      表 2  分区建模下福建省平均相对误差分段统计表

      Table 2.  The segmentation statistics of average relative errors in Fujian Province under partition modeling

      (4)从各县(市、区)平均相对误差分段统计表可以看出,在3 km格网尺度下,分区1的平均误差为32.36%,其中最小误差为丰泽区的0.16%,最大误差为梅列区的94.82%,因分区1为沿海地区,地形多样,人口分布复杂,故会造成较大误差;分区2的平均误差为30.22%,其中最小误差为东山县的14.35%,最大误差为龙文区的94.33%;分区3的平均误差为22.79%,其中最小误差为安溪县的0.77%,最大误差为柘荣县的68.62%,因分区3多为闽西北山区,土地利用多为森林,且地多人少,人口分布简单,故误差较小.

      综上,分区建模下获取的4种格网尺度人口中,3 km格网尺度的精度最高,误差最小,是最适宜的格网尺度.

    • 为进一步分析各人口数据空间化模型的精度,将人口数据空间化模型计算得到的各尺度的格网空间化结果套合各县(市、区)或乡镇级行政区划边界进行统计,并与县(市、区)或乡镇级统计人口数据进行比较,得到平均相对误差. 平均相对误差公式[20]为:

      $ EP=\frac{(p-{p}_{t})}{{p}_{t}}\times 100\%, $

      其中,$ EP $ 为人口数据误差百分比,$ p $ 为各个格网统计汇总得到的县(市、区)或乡镇人口模拟值,$ {p}_{t} $ 为统计年鉴中的各县(市、区)或乡镇人口统计数据.

      通过乡镇级行政区划界线套合2种建模方法下最适宜的格网人口数据,与乡镇实际人口统计数据进行误差检验,分析2种建模方法在更精细范围内的人口精度. 验证上述适宜尺度的格网人口数据的精度,本文以长乐区部分乡镇及仙游县部分乡镇的统计人口数据为例.

      文中将不分区建模下生成的6 km格网人口与分区建模下生成的3 km格网人口分别与乡镇级行政区划界线套合,并与乡镇级统计人口数据进行比较,计算不分区建模下生成的6 km格网和分区建模下生成的3 km格网人口空间数据的精度. 由乡镇人口误差分布柱状图(图5)可知,人口空间数据精度表现为:分区建模下生成的3 km格网人口的抽样误差均值为15.59%,即该建模方法下抽样精度为84.41%;不分区建模下生成的6 km格网人口的抽样误差均值为37.88%,即该建模方法下抽样精度为62.12%. 故分区建模下生成的3 km格网空间人口数据的精度较高.

      图  5  长乐区及仙游县部分乡镇人口误差分布柱状图

      Figure 5.  Histogram of population error distribution in some towns in Changle District and Xianyou County

    • 本文分别采用分区建模和不分区建模2种方法,生成7种尺度的格网人口数据,进行福建省人口数据空间化,评价基于土地利用类型数据的人口空间化模型的合理性,为福建省人口数据空间化研究选择适宜的格网尺度. 格网化的结果可以与其它要素的空间格网图进一步叠加分析,为相关部门对不同区域单元进行人口分析提供参考.

      (1)采用不分区建模方法进行人口数据空间化,最适宜的格网尺度为6 km;采用分区建模方法进行人口数据空间化,最适宜的格网尺度为3 km.

      (2)采用不分区建模方法下6 km尺度的格网人口抽样精度为62.12%;采用分区建模方法下3 km尺度的格网人口抽样精度为84.41%,表明人口特征分区能够明显提高人口数据空间化结果的精度. 相对于6 km格网尺度而言,3 km格网尺度更能够反映福建省人口空间分布情况,这与福建省山海兼备的地形特点有一定的关联. 总体而言,基于土地利用类型数据建模后,得到的福建省特征分区建模下3 km格网尺度的人口空间分布,能够较精确地反映各县(市、区)真实的人口分布情况,且精度检验结果良好.

    • 基于本文现有数据基础以及考虑到人口空间数据的实用性,兼顾福建省区域差异大且地形破碎的区域特征,受土地利用类型尺度大小、处理效率和行政区划范围的影响,发现分区建模方法下3 km格网是一个相对适宜的尺度,能够高效率地对福建省人口进行空间化研究,并对于区域差异较大的同类型地区有一定的参考价值. 而且,福建省人口多集中于沿海地区,西北山地多为森林,人口较少导致内部差异性较低,分区建模后的3 km格网尺度能够更加详细、真实地反映出人口在福建省各个县市的内部差异.

      虽然土地利用类型是影响人口空间分布的关键因素之一,但影响人口分布的因素众多,人口数据空间化是一个十分复杂的问题,后续的相关研究可考虑以下方面问题:①本研究考虑到建模与应用的方便性,仅采用土地利用类型数据这一关键因素作为建模因子,着重研究是否分区以及不同空间化尺度对人口空间化所产生的影响. 其中,土地利用类型数据只使用单一尺度的数据,后续有条件可以考虑利用不同详细分类类别的不同尺度数据,分析其对人口空间化的影响. ②本研究的精度检验方法是对空间网格化结果进行汇总到乡镇单元与抽样的乡镇单元统计人口进行比较验证,抽样的乡镇具有随机性与片面性,这就导致精度检验的随机性和不全面性. 另外,这种方法检验精度的尺度与空间化的尺度(网格尺度)并不一致. 在统计人口空间化的研究方面,应该进一步探讨如何建立更加完善、合理的精度检验体系,以便更加客观评价空间化模型与影响因素,以利于进一步提高统计人口数据空间化的精确性. ③随着多源数据丰富与数据获取的便捷性,在后续的研究中可进一步分析影响人口分布的各因素在区域人口空间化建模中的贡献,建立易于实现且有一定精度水平的区域人口空间化模型.

参考文献 (28)

目录

    /

    返回文章
    返回