IFADUNICEFWFPWHO

ANNEXE 4: Données et définitions se rapportant au chapitre 3

A. Cadre et définitions des données URCA

L’ensemble de données géospatiales sur les zones d’influence urbaines et rurales (Urban-Rural Catchment Areas, URCA), accessible librement, offre une cartographie mondiale du continuum rural-urbain36, 37. Fondé sur la couche mondiale des établissements humains (Global Human Settlement Layer, GHSL)21, il représente les centres urbains au moyen d’un gradient en fonction de la taille et de la densité de leur population. Comme l’illustre le chapitre 3 (figure A de l’encadré 2), les zones rurales sont associées à un gradient spécifique fondé sur le temps de transport le plus court pour rejoindre des centres urbains de différentes tailles. L’ensemble de données URCA ventile les zones rurales en plusieurs catégories, par exemple en distinguant les zones qui se situent à plus d’une heure d’un centre urbain de celles qui en sont plus éloignées. Les études de cas par pays présentées au chapitre 4 associent l’ensemble de données URCA à des données issues d’enquêtes auprès des ménages.

La méthode URCA repose sur la théorie des lieux centraux – un ensemble d’hypothèses et de propositions qui expliquent pourquoi des centres formant un système hiérarchisé se trouvent dans certains lieux privilégiés dans le paysage économique. Le commerce de détail et les activités de services, par exemple, sont souvent regroupés. La méthode URCA prend pour hypothèse que la taille des villes est un indicateur supplétif de l’étendue des services et des possibilités offerts par un centre urbain. Dans cette méthode, les temps de transport sont utilisés en tant que valeur supplétive du coût, et une hiérarchie urbaine fondée sur la taille des villes permet de classer les zones rurales en considérant qu’elles gravitent autour d’un centre urbain donné. On peut ainsi: i) comprendre la hiérarchie qui existe entre les centres urbains de différentes tailles s’agissant de l’accès aux services et aux possibilités d’emploi à partir des zones rurales; ii) définir les zones URCA à partir des interconnexions entre les centres urbains (de différentes tailles) et les zones rurales environnantes; et iii) utiliser un maillage qui peut être facilement comparé d’un pays à un autre, en élaborant un ensemble de données pour le monde entier.

La méthode URCA permet en outre de déterminer la part de la population qui appartient à une catégorie donnée du continuum rural-urbain au sein d’une unité administrative, au lieu d’associer l’ensemble de la population à un seul territoire ou une même zone fonctionnelle. Grâce à ces catégories, il est possible d’analyser plus en détail la consommation et la production le long du continuum. Le tableau A4.1 décrit les catégories URCA de base pour les zones urbaines, et montre ainsi que différentes catégories de zones rurales peuvent être associées à des zones urbaines de différentes tailles (une zone rurale située à moins d’une heure d’une ville de plus de 5 millions d’habitants, par exemple).

Tableau A4.1Définition des catégories URCA le long du continuum rural-urbain

NOTE: * Arrière-pays ou petites villes isolées, qui ne se trouvent pas dans la zone d’attraction d’une agglomération urbaine, et qui ne font donc pas partie du continuum rural-urbain.
SOURCE: FAO. 2021. Global Urban Rural Catchment Areas (URCA) Grid – 2021. Dans: FAO. [Consulté le 4 mai 2023]. https://data.apps.fao.org/?share=g-3c88219e20d55c7ce70c8b3b0459001a

Lors de la définition des catégories URCA en fonction du temps de transport vers une agglomération urbaine, l’intervalle de temps doit être considéré comme un intervalle fermé à droite. Plus précisément, pour les catégories URCA utilisées dans le présent rapport, cela signifie que:

  • la catégorie «< 1 heure» d’un centre urbain comprend les zones situées à une heure ou moins d’une ville (quelle qu’en soit la taille): trajet ≤ 1 heure.
  • la catégorie «1-2 heures» d’un centre urbain comprend les zones situées à plus d’une heure mais à deux heures au plus d’une ville (quelle qu’en soit la taille): 1 heure < trajet ≤ 2 heures
  • la catégorie «> 2 heures» d’un centre urbain comprend les zones situées à plus de deux heures d’une ville (quelle qu’en soit la taille): trajet > 2 heures.

Il convient de noter que ce degré de précision s’applique aux informations fournies au chapitre 4, mais que, pour des raisons de lisibilité, le texte et les figures ne vont pas jusqu’à ce niveau de détail.

B. Approche méthodologique et outil utilisés pour réaliser un examen structurel systématique des travaux publiés

L’examen systématique des éléments factuels issus des études scientifiques qui sous-tendent le chapitre 3, conçu à partir du protocole PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-analysis)4, a été réalisé à l’aide d’un outil de recherche intégré, Essence (Expert Search Semantic ENriChmEnt), élaboré par le Laboratoire de données de la FAO.

L’outil Essence est fondé sur une application web qui permet de rechercher automatiquement des articles scientifiques provenant de sources de données multiples (Google Scholar, Banque mondiale, Fonds monétaire international, etc.). Ces articles (dans leur version intégrale) sont ensuite stockés et mis à disposition aux fins d’examen au moyen d’un moteur de recherche sémantique fondé sur la base de données Apache Solr. Ce moteur permet d’agréger et de filtrer les résultats en sélectionnant des valeurs définies automatiquement lors du téléchargement de documents ou en exploitant les annotations ajoutées dans le cadre de travaux collaboratifs.

Des méthodes avancées disponibles dans l’interface web de l’outil permettent de filtrer les documents téléchargés au moyen d’un algorithme fondé sur une méthode d’intelligence artificielle qui traite les sélections d’articles pertinents opérées par les utilisateurs à des fins d’apprentissage et d’élargissement. Cette méthode s’appuie sur l’examen manuel d’un petit sous-ensemble de documents considérés comme pertinents ou non par les utilisateurs, qui sera ensuite utilisé en tant que source de données réelles recueillies sur le terrain. Une étape préliminaire de prétraitement et d’apprentissage est ensuite lancée directement à partir de l’interface web pour estimer et généraliser la fonction de liaison entre le contenu (c’est-à-dire les termes) des documents examinés et leur pertinence. L’étape d’apprentissage repose sur une régression logistique linéaire, c’est-à-dire sur un algorithme de classification utilisé pour résoudre des problèmes de classification binaires. Le classificateur de régression logistique utilise une combinaison pondérée des fonctions d’entrée (les termes de la matrice Tf-idf) et la transmet par l’intermédiaire d’une fonction sigmoïde qui permet d’exprimer tout nombre réel en entrée sous la forme d’un nombre compris entre 0 et 1. Les pondérations des combinaisons sont ensuite estimées pour minimiser la distance entre la sortie de la fonction et la pertinence des documents examinés indiquée par les utilisateurs. Après cette étape, la fonction résultante est appliquée à tous les documents téléchargés (y compris ceux qui n’ont pas été examinés), et un «score de pertinence» leur est associé. Un seuil permet de classer tous les documents qui sont téléchargés mais qui ne sont pas définis manuellement comme «pertinents».

Grâce à ce processus itératif, il est possible d’examiner les travaux publiés en quelques passages et de s’appuyer sur les fonctionnalités directement mises à disposition dans l’interface web de l’outil Essence. En effet, le score de pertinence proposé pour les documents qui ne sont pas évalués par les utilisateurs devient un filtre qui permet à ces derniers de déterminer et d’examiner rapidement les documents qui sont probablement les plus pertinents et d’ajouter quelques nouveaux exemples qui peuvent aider l’algorithme à mieux définir la concordance avec l’ensemble de documents utilisés lors de l’étape d’apprentissage. Ce processus itératif aide les utilisateurs à filtrer les documents les plus pertinents et contribue à améliorer la précision du modèle de sorte qu’il puisse mieux prédire la pertinence.

Pour une description détaillée de la mise en œuvre du protocole PRISMA et de l’approche méthodologique utilisée pour réaliser l’examen structurel systématique des travaux publiés, veuillez vous reporter à de Bruin et Holleman (2023)18.

back to top