A. 城乡辐射区数据定义和框架
城乡辐射区是对全球城乡连续体进行地图绘制的公益性全球地理空间数据集。36,37该图是以“全球人类住区层”工具21 为基础,根据人口规模和密度的梯度值来绘制城市中心。如第3章(插文2 图A)所述,由农村地区不同地点与不同规模城市中心的最短路程,得出各农村地点的梯度值。将距离城市中心1小时以内和以上路程的地点进行区分。在第4章中,国别案例研究将城乡辐射区数据集与家庭调查数据相 结合。
城乡辐射区方法起源于中心地理论。中心地理论由一系列假设和主张构成,用于说明为何经济活动较为集中的地点往往是具有层级结构的多个中心。例如,零售贸易和服务常呈现集群效应。城乡辐射区方法假设,城市规模代表着某一城市中心所提供服务和机会的数量。该方法用路程指代成本,以城市规模确定城市层级,对具体城市中心辐射范围内的农村地点进行分类。(1)根据不同规模城市中心为农村地点提供的服务和就业机会为城市中心划分层 级;(2)根据不同规模城市中心与其周边农村地区的联系来定义城乡辐射区的内容;(3)采用网格化方法,便于比较各国情况,制定全球通用的数据集。
此外,可以通过该方法计算出某行政管理单位内城乡连续体具体类别的人口占比,而不仅仅只是泛泛地观察某一领地或功能区域内的人口数量。在相关分类工作的支持下,还可对城乡连续体内的消费和生产情况进行更为细致的分析。表A4.1列出了城乡辐射区的基本城市分类方法。由该表可知,农村地区的分类方式由该地区和城市地区规模大小来共同表征,例如,距离人口规模500万以上城市1小时以内路程的农村地区。
表A4.1 按照城乡辐射区对城乡连续体进行分类的定义
![注:* 将这些地区定义为偏远地区或散落城镇,不在任何城市群辐射范围内,因此不是城乡连续体的组成部分。](../img/CC3017ZH_SOFI_tabA4-1.jpg)
资料来源:粮农组织。2021。全球城乡辐射区网格 — 2021。参见:粮农组织。[2023 年5 月4 日引用]。https://data.apps.fao.org/?share=g-3c88219e20d55c7ce70c8b3b0459001a
依据距离城市群的路程时间对城乡辐射区进行分类时,时间间隔区间为右闭区间。具体而言,相关报告中城乡辐射区分类方式为:
- 距离任何城市中心“<1小时”指的是与任何规模的城市或城镇的距离小于或等于1小时的地区:地区≤1小时。
- 距离任何城市中心“1-2小时”指的是与任何规模的城市或城镇的距离大于1小时且小于或等于2小时的地区:1小时<地区≤2小时。
- 距离任何城市中心“>2小时”指的是与任何规模的城市或城镇的距离大于2小时的地区:地区>2小时。
请注意,为了提升第4章文本和图表的可读性,采用了这种具体的分类方式,但并不对具体层面进行论述。
B. 方法论与系统性结构化文献综述工具
第3章引用了一些科研成果的实证材料,本报告根据系统性综述和元分析报告规范(PRISMA)4 对相关实证进行系统性综述,并在综述过程中运用由粮农组织数据实验室开发的“专家搜索语义富集”(Essence)综合搜索工具。
该搜索工具是一款基于网页的应用程序,可实现在多个数据资源平台(谷歌学术、世界银行、国际货币基金组织等)自动搜索科研文章,还能够进行全文存储,并通过搭载了Apache Solr搜索平台数据库的语义搜索引擎进行查看。下载时会自动标记文档特征,也可以手动添加注释,并据此对搜索结果进行汇总和筛选。
该工具运用人工智能方法学习和拓展用户挑选相关文章的做法,据此形成一套算法,对下载后的文章进行筛选,用户可于网页界面使用这项高级功能。要实现这项功能,用户须对标记为具有相关性的文章子集进行手动调整,以此作为一项实况数据来源。网页界面随后直接对文本进行预处理和初步学习,对已查看文档中的内容(即术语)与其相关性状态之间的关联功能进行估计和归纳。文本学习基于线性和逻辑回归,这是一种用于解决二元分类问题的分类算法。在这种运用了逻辑回归的分类算法中,先得出输入数据特征(TF-IDF矩阵的 术语)的加权组合,将其输入S型函数,将任何实数转化为数字0或1。然后,估计各组合的 权重,尽可能减小函数输出与用户已查看文档相关性认定之间的差距。经此步骤所得函数可运用于所有下载文档(包括尚未查看的文档),并得出所有文档的“相关度分值”。对该分值设置阈值后即可对所有已下载、但尚未手动标记为“相关”的文档进行分类。
经此迭代过程,可对少数文献段落进行修订,并使用“专家搜索语义富集”工具网页界面的特征。这是因为该工具会为用户尚未评估的文档提出相关度评分建议,且该分值建议也是一项筛选条件,用户可据此快速发现并查看最可能具有相关性的文档,还可新增示例,帮助算法更好地对文本学习环节设置的文档相关性进行识别。该迭代过程能够帮助用户筛选出相关度最高的文档,提高模型准确性,从而更好地预测文档相关性。
如需详细了解系统性综述和元分析报告规范的使用过程,以及系统性结构性文献综述的方法论,请参见de Bruin和Holleman (2023)。18