Partant d’un espace d’étude délimité par Luxembourg au nord, Longwy à l’ouest, Metz au Sud et Sarrebrück à l’est, cette section présente la préparation des couches géographiques et des données attributaires utiles pour l’étude :

  • Une extraction des découpages administratifs de référence au niveau européen (LAU2, NUTS3) et d’une grille kilométrique de population.
  • L’association avec deux typologies (urbain/rural, niveau d’équipement) qui serviront de données contextuelles pour les LAU2 françaises.
  • Les correspondances entre les nomenclatures d’équipement BPE et CNFG (relevés de terrain) avec OSM, afin de pouvoir comparer ces différentes bases de données entre-elles.
  • Les couches d’équipements de référence (points), BPE, OSM et relevés de terrain (15 équipements commerciaux cibles).


1 Espace d’étude

L’espace d’étude transfrontalier, appelé bounding box dans les analyses, est délimité au nord par la municipalité de Luxembourg (ymax = 2958000), à l’ouest par Longwy (xmin = 4010000), au sud par Metz (ymin = 2887000) et à l’est par Sarrebrück (xmax = 4115000).

Pour les représentations cartographiques et les analyses, un cadre de 10km autour de cette bounding box est défini.

Afin d’éviter les éventuels “effets de bords” lors des calculs de potentiel qui suivront, les données seront collectées/extraites 50km autour de la bounding box.

La projection utilisée est celle de référence pour l’Union Européenne (EPSG : 3035).


2 Maillages de référence

Cette section présente la préparation et l’extraction des maillages géographiques de référence qui seront utilisés dans l’étude à des fins de représentation cartographique ou d’habillage. A ces géométries sont aussi associées des données contextuelles utilises pour catégoriser ces objets géographiques.


2.1 LAU

Les fonds GISCO distribués par Eurostat sont utilisés pour le découpage communal. Il s’agit du millésime 2018, disponible depuis le site Web d’Eurostat

Comme tous les traitements qui suivent, la couche d’entrée mise à disposition par Eurostat est intersectée avec la bounding box de référence (10km autour de l’espace d’étude, et 50 km autour de l’espace d’étude).

2.4 L’espace d’étude

Cette représentation cartographique permet de visualiser l’emprise géographique de l’espace d’étude (délimité par quatre villes), l’espace qu’il représente 10 km autour de ces quatre villes et qui sera utilisé pour les analyses (représenté en orange) et l’espace conservé 50 kilomètres autour (utilisé pour les calculs de potentiels et éviter les effets de bords notamment).

Toutes les représentations graphiques qui sont générées dans ce site Web le sont au format .png, dont la résolution est calibrée en début de markdown avec la fonction getFigDim du package cartography. La représentation graphique est alors générée dans le dossier fig du projet grâce aux lignes png et dev.off qui encapsulent la production graphique. Pour rejouer le code et produire la figure sous R, il suffit de supprimer retirer les lignes png et dev.off().

## png 
##   2

figure A01 - Aire d’étude pour analyse (orange) et calcul (gris)


3 Données attributaires

A ces découpages géographiques sont associés des données attributaires qui seront utilisées dans les diverses analyses qui vont suivre.

3.1 Population (LAU)

Les données historiques sur la population de 1961 à 2011, produites par la DG-REGIO et distibuées par Eurostat sont importées, mises en forme et jointes à la couche LAU2 de référence produite plus haut.

Le code ci-dessous calcule la surface des LAU2 et produit une représentation cartographique qui permet d’appréciser simulatanément la population totale et la densité de population des LAU2 de l’espace d’étude. Pour la représentation cartographique des densités de population, la rupture entre la palette de bleus et de rouges se situe sur la médiane des LAU2.

# Calcul de la surface (espace élargi pour éviter les effets de bord)
lau50$SURF <- as.numeric(st_area(lau50)/1000000)
lau50$DENS <- lau50$POP_2011 / lau50$SURF

tmp <- st_set_geometry(lau50, NULL)

# Jointures avec fichier de référence
lau <- merge(lau, tmp[,c("GISCO_ID", "POP_1991","POP_2001","POP_2011", "SURF",  "DENS")],
             by = "GISCO_ID", all.x = TRUE)

# Calcul de la densité de population
options(scipen=999)
tmp$DENS <- tmp$POP_2011 / tmp$SURF

png(file = "fig/A02_POP_DENS_2011.png", width = sizes[1], height = sizes[2], res = res)

par(mar = c(0,0,1.2,0))

plot(st_geometry(fua), col = "orange", border = NA)
plot(st_geometry(lau), col = NA, border = "darkgrey", lwd = 0.2, add = TRUE)
plot(st_geometry(fua), col = NA, border = "ivory1", add = TRUE)

plot(st_geometry(nuts3), col = NA, border = "black", lwd = 1, add = T)

propSymbolsChoroLayer(x = lau, var = "POP_2011", var2 = "DENS",
  col = carto.pal(pal1 = "blue.pal", n1 = 5, pal2 = "red.pal", n2 = 5),
  inches = 0.5, 
  method = "quantile", nclass = 10, border = "grey50", lwd = 1,
  legend.var.frame = TRUE, legend.var2.frame = TRUE, 
  legend.var.values.rnd = -2,
  legend.var2.values.rnd = 0, legend.var.pos = "topright", 
  legend.var2.pos = "topleft",
  legend.var2.title.txt = "Densité de population\n 2011 (hab./km²)",
  legend.var.title.txt = "Population totale (2011)",
  legend.var.style = "c")

labelLayer(x = lau[order(lau$POP_2011, decreasing = T),][1:10,], 
           txt = "LAU_LABEL", halo=TRUE, cex = 0.6, 
           col= "#000000", bg = "#FFFFFF50", overlap = FALSE)

layoutLayer(title = "Caractéristiques démographiques de l'espace d'étude (2011)", 
            sources = "Eurostat, LAU version 2018", horiz = FALSE,
            posscale = c(4002561, 2879651),
            author = "UMS RIATE, 2020", col = "#990000")
dev.off()
## png 
##   2

figure A02 - Caractéristiques démographiques de l’espace d’étude

L’espace d’étude couvre une surface de 12806 km² et regroupe une population 2.72 millions d’habitants en 2011.

## [1] 2972708
## [1] 12806.46


3.2 Population (grille)

L’attribut principal de cette grille est la population en 2015. Les données issues de cette grille font apparaître une importante hétérogénéité entre les carreaux d’un kilomètre qui la composent. Pour cette représentation et faire ressortir les principaux pôles de concentration démographique, on applique un lissage d’une portée de 2 km suivant la technique des potentiels. Pour plus d’informations sur cette méthode, se reporter à la partie dédiée aux analyses transfrontalières.

La représentation de ces données met en évidence quatre pôles de concentration de population constitués du sillon Lorrain à l’ouest (Metz-Thionville), de la conurbation créée par plusieurs villes allemandes à l’est (Saarbrücken, Sarrlouis, Neukirchen), de l’agglomération de Trier au Nord et de Luxembourg au nord-ouest. On voit également ressortir la conurbation franco-luxembourgeoise constituée principalement de Longwy, Differdange et Esch-sur-Alzette. Le reste de l’espace d’étude, à l’exception de quelques localités qui concentrent très ponctuellement de la population, est très faiblement peuplé (moins de 2000 habitants dans un voisinage de 2 km, en vert sur la carte).

# Calcul potentiel de Stewart : Poplation totale
ncl <- parallel::detectCores(all.tests = FALSE, logical = FALSE)-1

# Points
pts <- st_centroid(grid50)

# Span = 2000m, limit = 4000m 
pot_2k <- mcpotential(x = pts, y = pts, 
                      var = "POP2015",
                     fun = "e", span = 2000, beta = 2, limit = 4000, 
                     ncl = ncl)

# Create equipotential areas
pts$pot <- pot_2k
brks <- c(0, 250, 500, 1000, 2000, 4000, 8000, 16000, 32000, max(pts$pot))
pts$X <- st_coordinates(pts)[,1]
pts$Y <- st_coordinates(pts)[,2]

equipot <- equipotential(pts, var = "pot", mask = nuts3, breaks = brks,
                         xcoords = "X", ycoords = "Y")


# Cartographie
png(file = "fig/A03_pot_2k_pop.png",width = sizes[1], height = sizes[2], res = res)

par(mar = c(0,0,1.2,0))
cols <- carto.pal(pal1 = "green.pal", pal2 = "red.pal",  n1 = 4, n2 = 5)
plot(st_geometry(nuts3), col = NA, border = "ivory1", lwd = 0.2)

choroLayer(x = equipot,
           var = "center",
           breaks = brks,
           col = cols,
           border = NA,
           legend.pos = "n",
           add = TRUE)

plot(st_geometry(nuts3), col = NA, border = "ivory1", lwd = 1, add = TRUE)

top <- lau[order(lau$POP_2011, decreasing = TRUE),][1:10,]
labelLayer(top, txt = "LAU_LABEL", halo = TRUE, cex = 0.6, col= "#000000", 
           bg = "#FFFFFF50", overlap = FALSE)

legendChoro(pos = "topleft", title.cex = 0.8, values.cex = 0.6, nodata = FALSE,
            title.txt = "Population totale\nvoisinage = 2 km\nbeta = 2",
            breaks = brks, values.rnd =0, frame = TRUE, horiz = FALSE, col = cols)

layoutLayer(title = "Caractéristiques démographiques de l'espace d'étude, 2015", 
            sources = "Global Human Settlement, 2019", frame= FALSE, 
            posscale = c(4002561, 2879651), horiz = FALSE, 
            author = "UMS RIATE, 2020", col = "#990000")

dev.off()

figure A03 - Caractéristiques démographiques de l’espace d’étude


3.3 Zonages

Deux zonages seront utilisés à différents stades de l’étude pour caractériser d’une part le contexte de peuplement (zonage urbain/rural), d’autre part le niveau d’équipement de chaque commune française de l’espace d’étude. Malheureusement, ils ne couvrent que la partie française de la zone d’étude.

3.3.1 Zonage urbain/rural

Cette classification repose essentiellement sur le zonage en unités urbaines de 2010 l’INSEE et distingue :

  • C : Les communes centres d’unités urbaines.
  • B : Banlieue d’unités urbaines.
  • I : Ville isolée.
  • R : Rural (hors influence urbaine).
  • P : Périurbain.

Cette dernière classe (périurbain) est obtenue en désagrégeant la catégorie du rural grâce à la classification en aires urbaines : toute commune rurale selon le zonage en unités urbaines et qui est par ailleurs considérée comme appartenant à la couronne d’un petit pôle ou un grand pôle (classes 222 et 112) est considérée non plus comme rurale mais périurbaine.

La typologie categ qui en résulte est jointe à la couche de communes de référence lau.

## png 
##   2

figure A04 - Classification communale Aires urbaines / unités urbaines


3.3.2 Niveaux de centralité

Cette typologie est un des résultats de l’étude "Centralités : comment les identifier et quels rôles dans les dynamiques locales et intercommunales ? (Hilal, Le Bris, Toutin, Barbier coord., 2019). Cette typologie repose sur l’analyse (présence/absence) des 185 équipements de la BPE, sans a priori sur les niveaux. La méthode utilisée repose sur une classification mixte : une première classification est obtenue par une partition construite par l’algorithme des centre mobiles autour de 100 centres tirés au hasard. Les 100 classes stables ainsi formées sont ensuite agrégées par une classification ascendante hiérarchique suivie d’une consolidation à l’aide de la méthode des nuées dynamiques.

La meilleure partition identifiée distingue 5 classes d’équipements :

  • Le niveau 0 ou communes “non pôles”, composé de 24423 communes françaises.
  • Le niveau 1, “centre local”, se caractérise par la présence simultanée de services et équipements du quotidien (médecin, boulangerie, salon de coiffure, pharmacie, école élémentaire…). Ce niveau regroupe 7033 communes.
  • Le niveau 2, “centre intermédiaire”, se distinque par la présence simultanée de services et d’équipements intermédiaires (magasin d’optique, collège, école de conduite, podologue, banque, supermarché, dentiste, station service, bureau de poste, fleuriste). Ce niveau regroupe 2887 communes.
  • Le niveau 3, “centre structurant”, se caractérise par la présence simultanée de services et équipements liés à la santé et à la médecine de ville spécialisée mais aussi par des équipements de niveau supérieur (lycée, pôle emploi, cinéma, parfumerie, magasin de chaussures, etc.). Ce niveau est composé de 743 communes.

Cette classification (nom de colonne NIV_P5CLA) est jointe aux géométries lau de référence.

Pour la zone d’étude, Metz et Sarreguemines apparaissent au niveau 4. 13 communes apparaissent au niveau 3 dont Forbach, Pont-à-Mousson, Creuzwald, Longwy (+ banlieue), Thionville (+ banlieue).

figure A05 - Classification niveaux de centralités


4 Équipements : 3 sources de données

Nous visons ici à rappeler les spécificités des trois bases de données de référence utilisés dans l’étude : la BPE, OpenStreetMap et des relevés de terrain (effectués dans plusieurs localités de l’espace d’étude par le LOTERR). Cela nécessite tout d’abord d’identifier des correspondances entre ces bases de données qui reposent sur des concepts différents.

Pour cette étude, 15 équipements sont sélectionnés. Ils représentent des équipements “marqueurs” de différents niveaux de centralité (étude rétraction, étude Jousseaume/Talandier, étude petites centralités de l’ANCT).

4.1 OSM, BPE et CNFG : trois nomenclatures

Chacune des trois bases de données de référence utilisées ici (BPE, OSM, Terrain) décrivent les points d’intérêt à partir de concepts et des nomenclatures différentes. Il est donc nécessaire au préalable, à partir d’équipement identifiés, trouver des correspondances entre ces nomenclatures. Si pour certains types d’équipement c’est relativement simple car l’équipement est relativement bien défini dans toutes les nomenclatures (boulangeries, pharmacies, coiffeurs, par exemple) ; pour d’autres le concept est flou entre les nomenclatures et nécessite donc des recherches approfondies pour capter correctement les équipements souhaités entre les nomenclatures (magasins d’alimentation, électronique, ameublement, par exemple).

Les équipements BPE regroupent 110 équipements pour l’édition 2018, qui se répartissent en trois gammes : proximité (27 équipements), intermédiaire (36 équipements) et supérieure (47 équipements). La documentation rattachée à cette nomenclature décrit plutôt précisément les équipements associés à cette base de donnée géoréférencée. Néanmoins et dans une optique de mise en correspondance entre les bases de données, la classification de certains équipements rend difficile la comparaison avec d’autres bases de données. On peut par exemple citer les magasins d’alimentation, définis sur les bases de la surface du commerce, qui n’est pas du tout un critère applicable pour des contributions OpenStreetMap. C’est aussi vrai pour les cafés-restaurants, qui auront tendance à être distingués par les contributeurs OpenSteeetMap.

Ceci étant dit, la BPE constitue une ressource inégalée en Europe, puisqu’elle représente à notre connaissance la seule base de données institutionnelle géoréférencée et mise à jour régulièrement (et depuis longtemps) qui porte sur la localisation d’équipements. Dans cette étude, elle sera utilisée comme une référence institutionnelle pour évaluer le degré de complétude de la base de données OpenStreetMap sur une sélection d’équipements en France.

Dans un contexte international, on comprendra alors que l’usage d’OpenStreetMap est la seule solution libre (hors Google, par exemple) qui permette d’extraire des équipements dans un contexte international.

Le projet OpenStreetMap (OSM) est initié en 2004 par Steve Coast au Royaume-Uni (University College de Londres), notamment encouragé par le manque de données accessibles ou réutilisables. C’est un projet communautaire et sans but lucratif qui vise à permettre la diffusion de données géographiques sous licence libre et il s’inscrit à ce titre dans le courant du libre et dans celui du web 2.0. OpenStreetMap stocke des informations spatialisées (noeuds, chemins, relations) renseignée par des utilisateurs. Ces contributions peuvent être de différentes nature : issues de relevés de terrain (un utilisateur va contribuer un point observé sur le terrain suivant un protocole conseillé par les groupes d’utilisateurs OSM), ou parfois des imports de données massives, comme c’est le cas avec le cadastre qui utilise des fonds de référence de l’IGN. De part la nature géométrique des objets extraits d’OpenStreetMap (points, lignes, surfaces), un travail nécessaire d’appariement des géométries est donc à concevoir (transformer les polygones en points, par exemple).

A chaque objet OSM est associé une paire de clés-valeurs qui permet son identification (et son extraction) dans OpenStreetMap. OSM propose 26 tags principaux, qui peuvent aussi être combiné à d’autres tags pour fournir des informations plus précises sur l’élément. OSM suggère aux utilisateurs qui renseignent des objets l’usage de clés-valeurs spécifiques. Confronté à la réalité et avec toutes les possibilités offertes pour renseigner des objets OSM, certains objets peuvent être caractérisés par un tag très cohérent (shop = bakery, par exemple) et d’autres être caractérisés par plusieurs tags dont le sens est leur combinaison (shop=food, shop=convenience, shop=alcohol par exemple). Pour extraire correctement des équipements d’intérêt, il est donc absolument nécessaire d’identifier toutes les paires de clés-valeurs qui répondent à la thématique de l’équipement ciblé. Un outil utile est le wiki OpenStreetMap qui décrit ce qui est attendu pour un grand nombre de paires clé-valeur renseignées dans OpenStreetMap. Ce wiki rappelle les bonnes et mauvaises pratiques de contribution. Dans notre cas, ces pages fournissent des informations importantes comme les tags similaires (Similar Tags et See also dans le wiki), qui suggèrent des paires de clé-valeur liées à d’autres.

Prenant l’exemple de magasins d’électroniques (clé-valeur dans OSM: shop=electronics), le wiki OSM suggère ainsi aussi pour une couverture optimale des contributions OSM de regarder aussi les clés-valeurs shop=hifi, shop=computer, shop=camera, shop=electrical et shop=mobile_phone.

Dans un contexte international, il est aussi important de noter que certains équipements peuvent être caractérisés des clés spécifiques qui permet de préciser leurs attributs. Ainsi pour un objet caractérisé par la clé amenity=school, il serait possible pour la France d’y associé une clé FR=maternelle (ou élémentaire, primaire, collège, lycée) en France alors qu’en Allemagne ce sera davantage le niveau isced qui sera renseigné (isced:level=xx). Il est par ailleurs important de rappeler l’ampleur des contributions, très variable en quantité et qualité d’un pays à l’autre et d’un type d’espace à l’autre (urbain/rural).

Les données collectées sur le terrain par l’équipe du LOTERR reposent sur la nomenclature du CNFG. La nomenclature officielle de 2014 est proposée sur le site cnfg. Il s’agit d’une nomenclature, qui a évolué, et qui sert de support pour étudier la localisation des activités commerciales depuis près de 40 ans. De cette nomenclature, découle une abondante littérature scientifique (150 publications d’une quarantaine d’auteurs). C’est aussi la nomenclature utilisée par l’équipe du LOTERR pour étudier depuis plusieurs années les rétractions commerciales dans la région Grand Est.

Un préalable à la comparaison des bases repose donc sur la construction d’une nomenclature commune pour extraire les équipements d’intérêt en fonction des attributs spécifiques de chacune des bases de données.


4.2 Catégories consolidées

Cette partie vise à créer des catégories consolidées d’équipements, qui servira de pivot (table de correspondance) pour capter les équipements en fonction des spécificités des trois bases de données mobilisées dans l’étude.

Les catégories consolidées sont les suivantes : banques, cinémas, opticiens, restaurants, stations-service, théâtre, alimentation, magasins d’ameublement, magasins de vêtements, boucheries, magasins de chaussures, coiffeur, magasins d’électronique, pharmacies, magasins d’alimentation.

4.2.1 Correspondance BPE

Le code type des équipements cible est extrait à partir d’une lecture attentive de la documentation associée à la BPE. Voici les correspondances entre les catégories consolidées et les codes BPE correspondants.

Globalement, à chaque équipement cible correspond une catégorie cible BPE, exception faite des commerces d’alimentation où sont retenues les catégories B201 et B202 (supérette et épicerie). D’après le descriptif proposé par l’INSEE, cela inclut les commerces d’une taille de 120 à 400 m² (B201) et d’une taille inférieure à 120 m² (B202).

Correspondance BPE / Catégories consolidées
code_bpe nom
B203 boulangerie
B204 boucherie
D301 pharmacie
B302 vetements
B304 chaussures
B201 alimentation
B202 alimentation
B305 electronique
B306 ameublement
A504 restaurant
F303 cinema
B313 opticien
A203 banque
B316 station_service
F306 theatre
A501 coiffeur


4.2.2 Correspondance OSM

Une recherche fine basée sur le Wiki OpenStreetMap a permis d’identifier les paires clé/valeur les plus usuelles (et conseillées par la communauté) pour les 15 équipements d’intérêt de l’étude :

  • Restaurant : amenity=restaurant, amenity=fast_food, amenity = cafe, amenity = pub, amenity = bar, amenity = biergarten
  • Stations service : amenity=fuel
  • Pharmacie : amenity=pharmacy
  • Théâtre : amenity=theatre
  • Cinéma : amenity=cinema
  • Banque : amenity=bank
  • Boucherie : shop=butcher
  • Boulangerie : shop=bakery
  • Coiffeur : shop=hairdresser
  • Opticien : shop=optician, craft=optician
  • Magasin vêtements : shop=clothes, shop=fashion
  • Magasin d’alimentation : shop=convenience, shop=greengrocer, shop=alcohol, shop=farm, shop=dairy, shop=cheese, shop=frozen_food
  • Magasin d’électronique : shop=electronics, shop=hifi, shop=computer, shop=mobile_phone
  • Magasin de chaussures : shop=shoes
  • Magasin d’ameublement : shop=furniture, shop=bathroom_furnishing, shop=kitchen, shop=lamps, shop=bed, shop=kitchen, shop=antiques

La table de correspondance qui sera utilisée retiendra alors les valeurs OSM suivantes :

Correspondance valeurs OSM / Catégories consolidées
categorie categorieOK
bank banque
restaurant restaurant
fast_food restaurant
theatre theatre
fuel station_service
cinema cinema
bakery boulangerie
butcher boucherie
clothes vetements
convenience alimentation
electronics electronique
hairdresser coiffeur
optician opticien
shoes chaussures
chemist pharmacie
pharmacy pharmacie
fashion vetements
greengrocer alimentation
alcohol alimentation
farm alimentation
appliance electronique
computer electronique
hifi electronique
furniture ameublement
bathroom_furnishing ameublement
lamps ameublement
bed ameublement
kitchen ameublement
dairy alimentation
cheese alimentation
frozen_food alimentation
cafe restaurant
pub restaurant
bar restaurant
biergarten restaurant
mobile_phone electronique
antiques ameublement

Ainsi, avec les restaurants sont inclus cafés et biergartens. Pour les magasins d’ameublement, il faut rassembler pas moins de 7 paires clé/valeur pour reconstituer une catégorie équivalente.


4.2.3 Correspondance CNFG

C’est le troisième niveau de description de la nomenclature CNFG, le plus précis, qui est retenu pour apparier nos catégories consolidées avec les équipements classées avec cette nomenclature.

Correspondance spécialités CNFG / Catégories consolidées
specialite categorie
Alimentation biologique alimentation
Alimentation diététique alimentation
Alimentation générale alimentation
Champignons alimentation
Crèmerie-fromages alimentation
Epicerie alimentation
Fruits-légumes/Primeurs alimentation
Spécialités étrangères alimentation
Supérette alimentation
Surgelés alimentation
Ameublement ameublement
Antiquités-Brocante ameublement
Equipements sanitaires ameublement
Meubles ameublement
Meubles de bureau ameublement
Meubles de cuisine ameublement
Meubles de jardin ameublement
Meubles pour enfants ameublement
Banque banque
Caisse d’épargne banque
Boucherie-charcuterie boucherie
Charcuterie/comestibles boucherie
Volailles-Gibiers boucherie
Boulangerie-Pâtisserie boulangerie
id- avec salon /consommation boulangerie
Chaussures chaussures
Cinéma cinema
Appareils électro-ménagers electronique
Audiovisuel electronique
DVD et jeux vidéo electronique
Élecroménager electronique
Informatique (réparation, pièces) electronique
Jeux électroniques electronique
Matériel audiovisuel, chaînes hifi electronique
Matériel informatique electronique
Café restaurant
Cafés-Thés restaurant
Confiserie-Chocolats alimentation
Cravates-Echarpes-Foulards vetements
Dépôt-vente ameublement
Literie ameublement
Location de vêtements vetements
Poissonnerie alimentation
Salon de thé restaurant
Salons de coiffure coiffeur
Stoppage de vêtements vetements
Téléphonie mobile electronique
Textiles d’ameublement ameublement
Vins et alcools alimentation
Optique opticien
Parapharmacie pharmacie
Pharmacie pharmacie
Café-restaurant restaurant
Cafétéria restaurant
Friterie restaurant
Glacier avec salon consomm. restaurant
Magasin gaufres restaurant
Restaurant restaurant
Restaurant rapide (Fast food) restaurant
Sandwichs à emporter restaurant
Snack-bar restaurant
Stations-services station_service
Théâtre theatre
Articles future maman vetements
Bas, collants, chaussettes vetements
Chemiserie-Bonneterie vetements
Confection enfant vetements
Confection femme vetements
Confection générale (HFE) vetements
Confection homme vetements
Fourrures-Cuirs vetements
Lingerie vetements
Pantalons-Jeans vetements
Solderie vetements
Vêtements de travail vetements
Vêtements sport vetements


4.2.4 Synthèse

Voici la synthèse du nombre de catégories retenues dans chacune des nomenclatures pour constituer notre base de données consolidée assurant le passage entre les différentes nomenclatures. Si pour les magasins de chaussures, les cinémas ou encore les coiffeurs les définitions sont sans équivoque (une seule clé-valeur OSM, une seule spécialité CNFG, un seul type BPE), pour d’autres équipements ce n’est absolument pas le cas : 11 spécialités et 6 tags OSM pour identifier le concept d’équipement d’ameublement par exemple.

Nombre d’occurences pour chaque catégorie
Bpe Cnfg Osm
alimentation 2 13 7
ameublement 1 11 6
banque 1 2 1
boucherie 1 3 1
boulangerie 1 2 1
chaussures 1 1 1
cinema 1 1 1
coiffeur 1 1 1
electronique 1 9 5
opticien 1 1 1
pharmacie 1 2 2
restaurant 1 12 6
station_service 1 1 1
theatre 1 1 1
vetements 1 16 2


5 Equipements : extraction et mise en forme

Pour les équipements BPE, OSM et CNFG, cette partie vise à montrer comment les équipements sont extraits, préparés et organisés au sein d’un seul et même fichier qui sera utilisé pour l’ensemble de l’étude.

5.1 BPE

La base de données de référence (BPE ensemble 2018) mise à disposition par l’INSEE est importée. Ne sont conservés que les équipements compris dans l’espace d’étude (sélection par le code communal).

Ne sont ensuite conservés que les 15 équipements d’intérêt. Sur les 36778 équipements renseignés dans notre espace d’étude, cela réduit la sélection à 9054 équipements

Ce fichier de données est spatialisé et transformé dans le système de coordonnées de référence européen (crs = 3035). Les équipements non géolocalisés sont retirés (cela ne concerne en fait aucun équipement pour cette sélection)

L’analyse du champ précisant la qualité du géocodage rappelle que pour ces 9000 équipements le géocodage est dans son immense majorité bonne (plus de 90 %).

## png 
##   2

figure A06 - Qualité de géologicalisation renseignée dans la BPE sur cet espace d’étude

L’analyse par type d’équipement révèle néanmoins des disparités : 10 % des restaurants et 17 % des théâtres sont caractérisés par une mauvaise géolocalisation, d’apèrs l’INSEE.

Mauvaise Acceptable Bonne Sum
alimentation 4 1 94 100
ameublement 8 2 90 100
banque 2 0 97 100
boucherie 6 2 92 100
boulangerie 7 2 92 100
chaussures 4 3 93 100
cinema 9 5 86 100
coiffeur 8 1 91 100
electronique 7 2 91 100
opticien 6 1 92 100
pharmacie 6 3 90 100
restaurant 10 2 87 100
station_service 0 0 100 100
theatre 17 17 67 100
vetements 4 1 95 100
Sum 7 2 91 100

Le code ci-dessous permet d’apprécier l’emprise spatiale des points extraits durant cette opération.

## png 
##   2

figure A07 - Sélection d’équipement BPE


5.2 OpenStreetMap

Ce programme décrit les opérations liées à l’intégration des données OSM dans une base postgis afin de pouvoir, in fine, utiliser les données dans R.

La procédure générale ici suivie est résumée dans la figure A08. Les données sont d’abord téléchargées depuis le site Geofabrik par région administrative recouvrant l’espace d’étude (6 fichiers). Ces données sont ensuite intégrées dans une base de données PostGIS. Les données sont alors consolidées : extraction des centroïdes des points d’intérêts présent sous forme de polygones (relations dans OSM) puis sélection des points d’intérêt répondant à la paire clé-valeur identifiée plus haut. Ces informations ont dans un OSM un identifiant unique qui permet durant une phase de post-traitement d’être manipulée pour identifier les doublons. A la fin, ces données sont exportées au format Geopackage sous forme de points et sont associés à la table de passage équipements consolidés / catégories OSM.

figure A08 - Traitement des données OSM

L’extraction des données OSM, au vu de leur volume et du format spécifique du fichier, nécessite l’utilisation d’une base de données Postgis.

Les scripts ci-dessous utilisent les outils en ligne de commande linux suivants :

  • outils gdal : ogr2ogr et ogrinfo
  • outils en ligne d’import osm : osmium extract, osmium merge, osm2pgsql, imposm
  • SQL
  • script bash (routines)

5.2.1 Import des données OSM : osmium extract et merge

Les couches OSM ont été téléchargées en octobre 2019 depuis le serveur interne de la société Geofabrik, qui met à disposition des extractions de la base OSM dans le périmètre des régions administratives, avec toutes les métadonnées associées aux objets OSM (nom d’utilisateur, historique des modifications).

6 fichiers sont récupérés, couvrant l’espace d’étude :
germany/saarland-latest.osm.pbf,
germany/rheinland-pfalz-latest.osm.pbf,
europe/belgium-latest.osm.pbf,
france/lorraine-latest.osm.pbf,
alsace-latest.osm.pbf,
europe/luxembourg-latest.osm.pbf

On ne conserve que les objets inclus dans la zone d’étude (50km autour de la bounding box). L’extraction des géométries et de leurs attributs est effectuée sur chacun des 6 fichiers tour à tour d’où l’utilisation d’une routine pour réaliser la manipulation.

Après sélection des objets compris dans la zone d’étude, le fichier total fait 272,5 Mo.


5.2.2 Intégration dans la base de données Postgis : osm2pgsql

Afin de pouvoir utiliser les données OSM dans R, il faut le convertir en fichier de formes .gpkg. L’outil utilisé ici est la base de données postgis.

Le fichier tag.style contient les 3 clés OSM dont nous avons besoin : amenity, shop et craft. Nous avons choisi également de retenir la clé name pouvant permettre des vérifications. Par exemple, retenir la clé name (nom de l’enseigne commerciale) peut permettre des vérifications sur la nature de l’équipement sélectionné. Les métadonnées sont inscrites dans les clés osm_uid (utilisateur), et osm_timestamp (date saisie).

L’extraction génère 3 tables de géométries dans la base : points, lignes, polygones.

Une fois dans la base, afin d’obtenir les points, il s’agit d’extraire les centroïdes des tables lignes et polygones et de concaténer les tables.

Cette opération permet de sélectionner uniquement les 37 valeurs définies plus haut. On observe bien ici la paire de clé-valeurs décrite plus haut. Certains équipements sont identifiés avec la clé amenity (restaurant, pharmacies, théâtres), d’autres avec la clé shop (boucheries, boulangeries) et d’autres avec la clé craft (optician).


5.2.3 Post-traitements : élimination des doublons et ogr2ogr

3 doublons repérés correspondant aux 6 premières lignes de la table.

Export de la table dans un fichier de forme .gpkg OSM dans le système de coordonnées de référence européen (3035).

Voici la couche résultante de cette opération. Pour notre espace d’étude transfrontalier étendu 50 km autour de Luxembourg, Sarrebrück, Metz et Longwy, les 15 équipements retenus représentent 24320 points.


5.2.4 Catégories consolidées

Il s’agit ici d’affecter aux équipements d’intérêt OSM le nom des catégories consolidées. Il arrive parfois qu’un même point soit caractérisé à la fois par deux paires clé/valeur. Par exemple une station service peut être décrite à la fois par la paire amenity=fuel et shop=bakery. Dans ce cas de figure on décide que la clé amenity prend le pas sur shop pour déterminer la catégorie.

Pour le cas particulier des opticiens (3 observations), le choix est fait de modifier l’extraction. On rectifie la saisie sur osm en rajoutant le tag “shop = optician”, ceci permet de supprimer le champs “craft”.

Cette consolidation des termes OSM étant réalisée, on peut alors joindre la table de passage qui renvoie vers les catégories consolidées d’équipement, identique à celle utilisée dans la BPE plus haut.

Voici l’emprise géographique de ces points. Nous avons bien une couverture transfrontalière de ces équipements d’intérêt dans OpenStreetMap.

figure A09 - Sélection d’équipement OSM


5.2.5 Occurences (valeurs)

Voici pour notre espace d’étude les catégories (valeurs OSM) les plus représentées pour la clé amenity. Dans la catégorie consolidée “restaurant”, on retrouve ainsi 6133 valeurs tagée restaurant dans OSM, 1837 fast_food, 1536 comme pub, 1306 comme cafe, 197 comme bier_garten. Ce tableau reflète bien l’hétérogénéité de contribution en fonction des équipements, les différentes réalités dont ils relèvent pour des contributeurs OpenStreetMap (quelle différence faire entre un bar, un café, un restaurant, un pub ?) mais aussi des habitudes de contribution en fonction des lieux (peu de chance qu’un contributeur français ait renseigné un bar comme un bier_garten dans OSM).

categorie nb d’équipements
restaurant 6133
fast_food 1837
bank 1621
pub 1536
cafe 1306
pharmacy 1192
fuel 1092
bar 661
biergarten 197
theatre 145
cinema 104
post_office 5
internet_cafe 2
atm 1
social_facility 1
vending_machine 1

Une fois consolidée avec la table de passage réalisée, voici le nombre d’occurences par catégories d’équipements sur l’ensemble de l’espace d’étude. Les cafés-bars-restaurants sont de loin la catégorie la plus contribuée sur notre espace d’étude du côté d’OSM.

categorie nb d’équipements
restaurant 11670
boulangerie 1746
vetements 1721
banque 1621
coiffeur 1559
pharmacie 1192
station_service 1092
alimentation 974
ameublement 579
boucherie 552
electronique 552
opticien 410
chaussures 403
theatre 145
cinema 104


5.3 Relevés de terrain

Les relevés de terrains ont été effectués par le LOTERR entre fin 2019 et mi-2020. La première campagne de relevés a été effectuée sur Forbach et Volklingen dans le cadre des travaux de thèse de Frédérique Morel-Doridat.

Les autres relevés ont été initiés dans le cadre de ce projet. Ces relevés reposent sur la classification des commerces du CNFG, qui se déclinent en trois niveaux (catégories, sous-catégories et spécialités), Les relevés effectués portent sur l’ensemble des équipements mais aussi sur la vacance commerciale. Nous n’utiliserons de fait pour les analyses suivantes qu’une petite partie des données collectées par le LOTERR.

Au final, les zones d’études sont situées dans 3 communes Metz, Forbach, Volklingen et utilisent une nomenclature spécifique, celle du CNFG.

Chacune des sources utilise une nomenclature spécifique : les tags pour OSM, les catégories pour la BPE et enfin les spécialités de la nomenclature du CNFG pour les données terrain. Une table de correspondance a été établie pour tenter de rendre comparables les classifications de nos 3 bases de données de référence. La comparaison entre tags et catégories est consignée ci-dessus. Les équivalences sont nommées catégories harmonisées. Le lien entre les spécialités et catégories harmonisées est présenté ci-dessous.

Notons bien que les terrains enquêtés couvrent des quartiers spécifiques de 3 communes, qui présentent des spécificités de concentration de commerce.

Une fois mise en place la table d’équivalence, toutes les données d’équipement seront regroupées dans une couche géographique unique.

5.3.5 Catégories harmonisées

Cette phase de nettoyage étant réalisée, on peut procéder à la jointure avec la table de passage vers les équipements harmonisés, identique à celle utilisée pour la BPE et OSM.

Une phase de consolidation manuelle doit être réalisée préalablement. Des éléments de la base de donnée ayant été mal référencés (catégories inexistantes, quelques erreurs orthographiques). Mais c’est le propre de relevés de terrains que nous ne détaillerons pas ici.

## 
##    alimentation     ameublement          banque       boucherie     boulangerie 
##              73              63              40              11              28 
##      chaussures          cinema        coiffeur    electronique        opticien 
##              28               2              76              41              20 
##       pharmacie      restaurant station_service         theatre       vetements 
##              15             222               5               1             147


5.4 OSM, BPE, Terrain : un seul fichier

5.4.1 Union des couches et des attributs

Pour la gestion des données au sein du projet, le choix a été fait de regrouper l’ensemble des équipements extraits dans cette partie au sein d’un même fichier.

Cette base de points contiendra uniquement comme informations : la catégorie harmonisée, la géométrie du point, et le type de la donnée (OSM, BPE ou terrain).

On y rajoute ensuite la gamme et la localisation (pour les cas d’étude).

L’union des trois couches, qui portent les mêmes noms de colonne est d’abord réalisé.

5.4.3 Niveaux de gamme

Afin de pouvoir travailler ultérieurement sur des agrégats, on utilise également la notion de gamme (catégorisation INSEE), qui définit trois niveaux de gamme pour chaque équipement de la BPE. Appliqué à nos 15 équipements, voici comment ceux-ci se répartissent dans cette classification :

  • Gamme de proximité : coiffure, restaurant-restaurant rapide (y compris cafés), boulangerie, boucherie-charcuterie, épicerie-supérette, pharmacie
  • Gamme intermédiaire : banque-caisse d’épargne, station service, magasin de chaussures, magasin d’optique, magasin de meubles, magasin de vêtements, magasin d’électroménager et de matériel audio-vidéo.
  • Gamme supérieure : théâtre-art de rue-cirque, cinéma.

Le code ci-dessous crée la table de passage et l’exporte dans le dossier de préparation des données.

Pour l’ensemble des équipements consolidés (et quelle que soit la source de donnée de référence), nous aurons alors un niveau de gamme associé à chaque point.


5.4.4 Contenu du fichier d’équipement

## Reading layer `equipements' from data source `C:\GitLab\centralite\data\geom.gpkg' using driver `GPKG'
## Simple feature collection with 34146 features and 4 fields
## geometry type:  POINT
## dimension:      XY
## bbox:           xmin: 3959945 ymin: 2836197 xmax: 4164969 ymax: 3007764
## projected CRS:  ETRS89-extended / LAEA Europe

L’union des trois couches (BPE, OSM, terrain) comporte 34 205 points représentant les 15 équipements sur cet espace frontalier. Il est structuré en 5 champs :

  • Le champ categorie délivre le nom de la catégorie consolidée.
  • Le champ type fournit la source des données (BPE, OSM ou Terrain).
  • Le champ localisation s’il s’agit de points recouvrant des espaces d’étude comprenant plusieurs communes (Les deux espaces commerciaux Actisud et Metz et les deux doublons franco-allemands Forbach / Volklingen et Creutzwald / Uberherrn).
  • Le champ gamme les trois niveaux de gamme INSEE auxquels se rattachent ces équipements.
  • Le champ LAU2, pour les points dans la zone d’étude (la bounding box), indique la commune.
## [1] "BPE"     "OSM"     "Terrain"
## [1] "intermediaire" "proximite"     "superieur"
## [1] 679
## 
## FALSE  TRUE 
## 23068 11078






UMS 2414 RIATE (CNRS - Université de Paris)