A. СГЗО – данные, определения и механизм
Сельско-городские зоны обслуживания (СГЗО) – это общедоступный набор глобальных геопространственных данных, положенных в основу картирования сельско-городского континуума36, 37. Карта построена на основе Глобального слоя населенных пунктов21 где населенные пункты с использованием цветовых градиентов ранжированы по численности и плотности населения. Как показано в главе 3 (врезка 2, рисунок A), сельские районы ранжированы по собственным градиентам на основании наименьшего времени, которое необходимо затратить, чтобы добраться до городских центров разных размеров. Таким образом, механизм СГЗО классифицирует сельские районы по ряду категорий: например, места, откуда поездка до городского центра занимает не более часа, объединяются в одну категорию, а более часа – в другую. В главе 4 в рамках страновых тематических исследований набор данных СГЗО рассматривается в сочетании с данными обследования домохозяйств.
Подход СГЗО строится на теории "центрального пункта" – наборе посылок и допущений, объясняющем, почему иерархическое распределение населенных центров привязано к определенным предпочтительным точкам экономического ландшафта. Например, розничная торговля и сфера услуг, как правило, стремятся к кластеризации. Подход СГЗО строится на допущении, согласно которому размер города определяет спектр услуг и возможностей городского центра. Время, необходимое, чтобы добраться до того или иного населенного пункта, служит показателем затрат, а иерархия городов, построенная на основании их размеров, позволяет классифицировать сельские районы по признаку привязанности к конкретному городскому центру. Рассматриваемый подход позволяет: i) отразить иерархию городов, существующую между городскими центрами разных размеров, в плане доступа к услугам и возможностей занятости для жителей сельских районов; ii) определить сельско-городские зоны обслуживания (СГЗО), сформированные за счет взаимосвязей между городскими центрами (разных размеров) и окружающими их сельскими районами; iii) реализовать сетевой подход, обеспечивающий простоту сравнения на уровне стран, что позволит получить набор данных для всего мира.
Кроме того, подход СГЗО позволяет определить, какая доля населения той или иной территориально-административной единицы попадает в специфическую категорию сельско городского континуума, не причисляя к ней все население определенной территории или функциональной зоны. Такая классификация позволяет глубже детализировать анализ потребления и производства в масштабах континуума. Таблица A4.1 иллюстрирует основные категории урбанизации СГЗО; категории сельских районов соотносятся с городскими районами того или иного размера, например: сельские районы, дорога от которых до города занимает менее часа, связанные с городом, население которого превышает пять миллионов.
таблица A4.1 СГЗО: определение категорий сельско-городского континуума
При определении категорий СГЗО по времени, необходимому, чтобы добраться до городской агломерации, используются временные интервалы, закрытые справа. В частности, в приложении к рассматриваемым в докладе категориям СГЗО:
- категория "<1 часа" до любого городского центра включает районы, откуда за час или быстрее можно добраться до города любого размера или поселка: район ≤1 часа;
- категория "1-2 часа" до любого городского центра включает районы, откуда больше, чем за час, но быстрее, чем за два часа, или ровно за два часа можно добраться до города любого размера или поселка: 1 час < район ≤2 часа;
- категория ">2 часов" до любого городского центра включает районы, из которых чтобы добраться до города любого размера или поселка потребуется больше двух часов: районы >2 часа.
Следует отметить, что для удобочитаемости текста и рисунков в главе 4 применяемая степень конкретности на данном уровне детализации не обозначается.
B. Методический подход и инструмент для проведения систематического структурного обзора литературы
Систематический обзор объективных результатов научных исследований, итоги которого использованы в главе 3, проводился в соответствии с протоколом "Предпочтительная структура отчета по результатам структурного обзора и метаанализа (PRISMA)4 с применением разработанного Лабораторией данных ФАО комплексного инструмента для проведения научных исследований Expert Search Semantic ENriChmEnt (Essence).
Инструмент Essence – это веб-приложение, позволяющие автоматически осуществлять поиск по запросам в научных статьях из множества источников (Google Scholar, Всемирный банк, Международный валютный фонд и пр.). Эти статьи, в том числе в полнотекстовом формате, сохраняются с возможностью проведения их обзора, для чего используется механизм семантического поиска, построенный на базе данных Apache Solr. Такой подход позволяет агрегировать и фильтровать результаты поиска за счет выбора значений, автоматически определяемых после скачивания документов либо по аннотациям коллективного авторства.
Для реализации передовых методик использовался веб-интерфейс инструмента, позволяющий осуществлять фильтрацию скачанных документов по алгоритму, основанному на использовании искусственного интеллекта, способному обучаться и расширять границы выбранных пользователем результатов поиска релевантных статей. В рамках этого подхода обзор небольшого набора документов, определенных как релевантные или нерелевантные, проводился вручную, то есть исходные критерии задавались самими пользователями. На следующем этапе после предварительной обработки текстов непосредственно через веб-интерфейс проводилось обучение, что позволило оценить и генерализировать функцию, связывающую содержимое документов (т.е. термины) со статусом их релевантности. Обучение строилось по модели линейной логистической регрессии, которая служит алгоритмом решения проблем, обусловленных бинарным характером классификации. Классификатор логистической регрессии использует взвешенное сочетание входных параметров (векторная матрица TF-IDF), которые по сигмоидальной функции пересчитываются в любое действительное число от 0 до 1. Затем рассчитываются весовые коэффициенты сочетаний, что позволяет свести к минимуму расхождения между значением, полученным по функции, и заданными пользователем критериями релевантности документов. По завершении этого этапа полученная функция применяется ко всем ранее скачанным документам (в том числе к тем, что еще не были подвергнуты обзору) с присвоением документам "рейтинга релевантности". Установленный порог позволяет классифицировать все документы, которые были загружены, но не были подвергнуты обзору в ручном режиме и признаны "релевантными".
Такой итерационный процесс позволяет провести обзор литературы в несколько приемов с использованием функциональных возможностей, непосредственно обеспечиваемых веб интерфейсом инструмента Essence. Таким образом, предложенный "рейтинг релевантности" для документов, не подвергшихся пользовательскому обзору, служит фильтром, позволяющим пользователям быстро выявить документы, которые с большой вероятностью могут соответствовать запросу, и провести их обзор, а также добавить новые примеры, чтобы помочь алгоритму более точно определять документы, релевантные по отношению к набору документов, использовавшихся для обучения. Итерационный процесс помогает пользователю выбрать наиболее релевантные документы и повысить точность модели, что расширяет возможности прогнозирования релевантности документа.
Полное описание работы по протоколу PRISMA и методического подхода к проведению системного структурного анализа литературы – см. de Bruin and Holleman (2023)18.