METHODOLOGIE

Cetta page a pour but de présenter la méthodologie développée dans le cadre du projet TLI.

SCORE

Lignes étudiées



Carte 1 : Localisation des 17 lignes étudiées



Sélection des points kilométriques sur l’Etoile de Saint-Pol

Carte 2 : Localisation des points kilométriques sur l’Etoile de Saint-Pol
if (!requireNamespace("pacman", quietly = TRUE)) install.packages("pacman")
pacman::p_load(sf, dplyr, mapview, tmap, knitr)
mapview(points_kms_decoup)



Calcul des isochrones



Carte 3 : Buffers isochrones sur l’Etoile de Saint-Pol




Tableau des variables calculées pour chaque buffer

knitr::kable(donnees) # caption = "Informations et leurs fournisseurs"
Variables Fournisseurs
Nombre d’habitants (données carroyées) INSEE
Total population active (données communales) INSEE
Lits, emplacements dans les campings et chambres d’hôtels Fichier communal du tourisme (INSEE)
Arrêts de transport en commun Point d’Accès National (données GTFS)
Aménités : loisirs, santé, commerces, restauration, sport SIRENE
Nombre d’élèves (collèges, lycées, BTS) (données communales) Ministère de l’Education nationale
Pistes cyclables (longueur kilométrique) OpenStreetMap
Réseau pédestre (longueur kilométrique) IGN BD TOPO
Routes (longueur kilométrique) IGN BD TOPO
Nombre d’intersections de routes IGN BD TOPO
Ronds-points OpenStreetMap
Nombre de place de parking (données estimées) IGN BD TOPO
Passage à niveau SNCF
Zones artificialisées (données reconstruites) IGN BD TOPO
Pente (pour le vélo) IGN RGE ALTI
Tableau 1 : Liste des variables




Normalisation Min-Max
La normalisation Min-Max redimensionne les données dans un intervalle fixe, souvent [0, 1], en ajustant chaque valeur selon les valeurs minimales et maximales de l’ensemble de données, ce qui est utile pour les modèles sensibles aux variations d’échelle entre les variables. Elle est particulièrement utile pour les algorithmes sensibles aux échelles des variables, comme les algorithmes basés sur les distances. La normalisation Min-Max est souvent utilisée dans les contextes où l’uniformité de l’échelle entre les variables est cruciale.

 normalized_data <- as.data.frame(lapply(dt, function(x) {
   (x - min(x, na.rm = TRUE)) / (max(x, na.rm = TRUE) - min(x, na.rm = TRUE))
 }))




Analyse en composantes principales

Nous disposions de 15 variables pour la voiture et de 16 variables pour la marche et le vélo. Afin de réduire leur nombre nous avons procédé à une ACP sur les données issues des isochrones. Pour commencer, nous observons les variances cumulées des trois ACP. Nous mettons également en évidence les graphiques des variables composants les premières dimensions des axes et nous sélectionnons un ensemble de variables pour chaque mode de déplacement. Cette démarche nous permet d’identifier et de réduire le nombre de variables initialement sélectionnées.

L’ACP à partir des données pédestres révèle que les deux premiers axes cumulent 58% de la variance totale, offrant ainsi une représentation significative des données originales. De cette première analyse nous conservons les valeurs suivantes, qui permettent d’accumuler plus de 50% de la variance expliquée pour chaque dimension : la population, la longueur des routes carrossables, le nombre d’arrêts de transport en commun, le nombre de commerces, le nombre de loisirs, le nombre de restaurants, la surface artificialisée et le nombre de passages à niveau.

gridExtra::grid.arrange(plot1, plot2, 
                        # plot3, 
                        ncol = 2)


Tableau des variables retenues

knitr::kable(donnees) # caption = "Informations et leurs fournisseurs"
Thématiques Variables Fournisseur Intérêts
Démographie Nombre d’habitants (données carroyées 200m) INSEE Indique la densité de population autour des gares, reflétant potentiellement un besoin élevé de services de transport.
Transport Longueurs du réseau routier carrossable IGN BD TOPO Indique l’accessibilité de la gare : un réseau routier plus dense et étendu peut faciliter l’accès
Transport Arrêts de transport en commun Point d’Accès National (données GTFS) Permet de comprendre l’intégration et la connectivité de la gare au sein du réseau de transport local et régional.
Économie locale Aménités : commerces, santé, loisirs, sports, restauration BD SIRENE Donne une idée de la vitalité économique et de l’accessibilité des services autour des gares.
Éducation Nombre d’élèves (collèges, lycées, BTS) (données communales) Ministère de l’Education nationale Indique la présence d’institutions éducatives, suggérant des flux réguliers d’élèves nécessitant des services de transport.
Sécurité et infrastructure Passage à niveau SNCF Souligne les points potentiels de conflit entre le transport ferroviaire et routier, importants pour la planification de la sécurité et l’aménagement urbain.
Urbanisme Zones artificialisées IGN BD TOPO Montre les possibilités de d’aménagement des espaces fonciers.
Topographie Pente (pour la marche et le vélo) IGN RGE ALTI Important pour évaluer l’accessibilité à vélo des gares, influençant la mobilité douce et les choix de transport multimodal.
Tableau 2 : Liste des variables sélectionnées





Somme des variables pour la création d’un score

all_data$total_sum_allegee <-
  all_data$sum_population_carreau+
  all_data$longueur_route+
  all_data$nombre_loisirs+
  all_data$nombre_arrets+
  all_data$nombre_commerces+
  all_data$nombre_restauration+
  all_data$nombre_sports+
  all_data$nombre_sante+
  all_data$nombre_loisirs+
  all_data$ZA+
  all_data$passage_niveau-
  all_data$pente_moyenne

Cartographie du score pour chaque point kilométrique


Carte 4 : Cartographie de l’Etoile de Saint-Pol avec les points sélectionnés – résultats du modèle 10 minutes à pied


Pour plus de détails sur la cartographie vous pouvez consulter ce lien.



ISOCHRONES

tmap_mode('view')
tm_basemap(c(leaflet::providers$Esri.WorldTopoMap,
             leaflet::providers$OpenStreetMap, 
             leaflet::providers$Esri.WorldImageryiders, 
             leaflet::providers$GeoportailFrance.orthos)) + 
  
  tm_shape(isochrones_foot_osrm) + tm_fill('#e77148') + 
  tm_shape(isochrones_foot_geofer) + tm_fill('#75a993') + 
  tm_shape(isochrones_foot_r5r) + tm_fill('#e5b636') + 
  tm_shape(isochrones_OTP) + tm_fill('cornflowerblue') + 
  tm_shape(isochrones_ORS_TOOLS) + tm_fill('brown2') + 
  
  tm_shape(gares_st_pol) + tm_dots()
sup_osrm <- st_area(isochrones_foot_osrm) 
sup_geofer <- st_area(isochrones_foot_geofer) 
sup_r5r <- st_area(isochrones_foot_r5r) 
sup_OTP <- st_area(isochrones_OTP) 
sup_ORSTOOLS <- st_area(isochrones_ORS_TOOLS) 
# Affichage du tableau final
print(total_df_sup)
##          OSRM     GeoFer        R5R        OTP    ORS_Tools
## 1   1301222.8   817358.9  1402476.6  1413534.4 2.627185e+06
## 2    963162.0  1671378.0   654716.2  1767125.5 2.627185e+06
## 3   1635508.9  1216875.2  1890295.8  1675161.8 1.899020e+06
## 4   1546948.5  1004533.7  1405527.9  1772783.4 1.899020e+06
## 5   1359716.6   997720.6  1452324.5  1599670.6 2.488645e+06
## 6   1481211.5  1471163.1  1251927.8   657654.3 2.488645e+06
## 7   1340876.3  1142564.9  1733130.6  1548406.7 2.204523e+06
## 8   1125438.6  1107989.4  1080463.4  1551556.7 2.204523e+06
## 9   1897253.7   989006.7  1978419.7  1831937.7 2.369811e+06
## 10  1424314.3  1249952.5  1363379.8  1570571.0 2.369811e+06
## 11  1541528.6   798649.4  1875319.6  1932814.9 1.972898e+06
## 12  1565308.9  1023062.7  1233608.6  1570571.0 1.972898e+06
## 13  1625501.5   880936.9  1304231.8  1835030.7 1.771767e+06
## 14  1730707.4  1023062.7  1708250.8   995113.5 1.771767e+06
## 15  1610468.0  1358245.0  1809129.0  1441914.9 2.924069e+06
## 16  1722988.0  1530825.4  1890295.8  1551733.7 3.015802e+06
## 17  1635508.9  1360043.7  2895376.6  1912115.5 2.361438e+06
## 18  2577515.8  1483750.7  1087108.5  1550268.8 2.361438e+06
## 19  1036679.1   493971.3  1715659.7  1570571.0 2.364815e+06
## 20  1462742.3  1068565.1  1765202.2  1083763.0 2.364815e+06
## 21  2599206.5   930983.2  1055199.3  1331193.7 2.243323e+06
## 22  1221425.1   879670.4  1890295.8  1671352.8 2.243323e+06
## 23  1635508.9   998850.2  2276807.0  1413534.4 5.377787e+03
## 24  1381397.9   440961.0  2057955.4  1767125.5 5.377787e+03
## 25  1635799.9  1023062.7   721922.3  1675161.8 2.338455e+06
## 26   770438.8  1753109.3  1742870.6  1772783.4 2.338455e+06
## 27  1452460.2  1118685.2  1402476.6  1599670.6 2.488645e+06
## 28  1301222.8   817358.9   654716.2   657654.3 2.488645e+06
## 29   963162.0  1671378.0  1890295.8  1548406.7 3.965363e+06
## 30  1635508.9  1216875.2  1405527.9  1551556.7 3.965363e+06
## 31  1546948.5  1004533.7  1452324.5  1831937.7 6.726445e+03
## 32  1359716.6   997720.6  1251927.8  1570571.0 6.726445e+03
## 33  1481211.5  1471163.1  1733130.6  1932814.9 5.975208e+03
## 34  1340876.3  1142564.9  1080463.4  1570571.0 5.975208e+03
## 35  1125438.6  1107989.4  1978419.7  1835030.7 4.138729e+06
## 36  1897253.7   989006.7  1363379.8   995113.5 4.138729e+06
## 37  1424314.3  1249952.5  1875319.6  1441914.9 2.074481e+06
## 38  1541528.6   798649.4  1233608.6  1551733.7 2.074481e+06
## 39  1565308.9  1023062.7  1304231.8  1912115.5 2.488645e+06
## 40  1625501.5   880936.9  1708250.8  1550268.8 2.488645e+06
## 41  1730707.4  1023062.7  1809129.0  1570571.0 2.548840e+06
## 42  1610468.0  1358245.0  1890295.8  1083763.0 2.548840e+06
## 43  1722988.0  1530825.4  2895376.6  1331193.7 2.479157e+06
## 44  1635508.9  1360043.7  1087108.5  1671352.8 2.479157e+06
## 45  2577515.8  1483750.7  1715659.7  1413534.4 1.320903e+06
## 46  1036679.1   493971.3  1765202.2  1767125.5 1.320903e+06
## 47  1462742.3  1068565.1  1055199.3  1675161.8 2.886865e+06
## 48  2599206.5   930983.2  1890295.8  1772783.4 2.886865e+06
## 49 74464646.9 53455617.1 75684235.7 74298296.7 1.040430e+08

Buffer vs. Iso

# Packages ----
pacman::p_load(sf, mapview, tmap, dplyr, GGally)

# Chargement de la couche des régions de la France métropolitaine
regions_FR_2154 <- sf::st_read("C:/Users/otheureaux/Documents/OT/DECOUPAGES_FR/REGION.shp")
## Reading layer `REGION' from data source 
##   `C:\Users\otheureaux\Documents\OT\DECOUPAGES_FR\REGION.shp' 
##   using driver `ESRI Shapefile'
## Simple feature collection with 13 features and 4 fields
## Geometry type: MULTIPOLYGON
## Dimension:     XY
## Bounding box:  xmin: 99040 ymin: 6046546 xmax: 1242443 ymax: 7110479
## Projected CRS: RGF93 Lambert 93
# Filter sur la région des Hauts-de-France
hauts_de_france <- regions_FR_2154 %>%   filter(INSEE_REG == 32)
zone_etude <- hauts_de_france

# Chargement des gares
gares <- sf::st_read("C:/Users/otheureaux/Documents/OT/RAILENIUM/BDD_TELLI/GEOFER/gares_2154.gpkg")
## Reading layer `gares' from data source 
##   `C:\Users\otheureaux\Documents\OT\RAILENIUM\BDD_TELLI\GEOFER\gares_2154.gpkg' 
##   using driver `GPKG'
## Simple feature collection with 3489 features and 65 fields
## Geometry type: POINT
## Dimension:     XY
## Bounding box:  xmin: 147139.3 ymin: 6147218 xmax: 1079190 ymax: 7108435
## Projected CRS: RGF93 v1 / Lambert-93
gares_select <- gares %>% 
  select(nom_gare, voy_2022)

# Découpage gares HDF
gares_HDR <- sf::st_intersection(gares_select, zone_etude)
## Warning: attribute variables are assumed to be spatially constant throughout
## all geometries
mapview(gares_HDR)
# Création des buffers
buffers_gares_HDR <- st_buffer(gares_HDR, 1000)
buffers_gares_HDR$superficie <- st_area(buffers_gares_HDR)

# Création des isochones
all_isochrones <- sf::st_read('C:/Users/otheureaux/Documents/OT/6T/R/database_sf/processed_data/isochrones_gares_HDF_foot_15min_20240206.geojson')
## Reading layer `isochrones_gares_HDF_foot_15min_20240206' from data source 
##   `C:\Users\otheureaux\Documents\OT\6T\R\database_sf\processed_data\isochrones_gares_HDF_foot_15min_20240206.geojson' 
##   using driver `GeoJSON'
## Warning in CPL_read_ogr(dsn, layer, query, as.character(options), quiet, : GDAL
## Message 1: Several features with id = 1 have been found. Altering it to be
## unique. This warning will not be emitted anymore for this layer
## Simple feature collection with 393 features and 4 fields
## Geometry type: MULTIPOLYGON
## Dimension:     XY
## Bounding box:  xmin: 1.523141 ymin: 48.96067 xmax: 4.149771 ymax: 51.07936
## Geodetic CRS:  WGS 84
all_isochrones <- st_transform(all_isochrones, 2154)
all_isochrones$superficie <- st_area(all_isochrones)

# Carto des buffers et des iso
mapview(buffers_gares_HDR) + mapview(all_isochrones)
# Dataframe des superficies
dt <- data.frame(
  buffers_gares_HDR$superficie,
  all_isochrones$superficie
)

dt$rapport <-all_isochrones$superficie / buffers_gares_HDR$superficie*100


all_isochrones$rapport <- dt$rapport
all_isochrones$rapport <- as.numeric(all_isochrones$rapport)
str(all_isochrones)
## Classes 'sf' and 'data.frame':   393 obs. of  7 variables:
##  $ id            : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ isomin        : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ isomax        : num  15 15 15 15 15 15 15 15 15 15 ...
##  $ point.nom_gare: chr  "Pont de la Deûle" "Outreau" "Sous le Bois" "Les Bons-Pères" ...
##  $ geometry      :sfc_MULTIPOLYGON of length 393; first list element: List of 2
##   ..$ :List of 2
##   .. ..$ : num [1:91, 1:2] 705919 705911 705905 705902 705999 ...
##   .. ..$ : num [1:7, 1:2] 706330 706318 706330 706440 706463 ...
##   ..$ :List of 1
##   .. ..$ : num [1:5, 1:2] 706588 706552 706515 706552 706588 ...
##   ..- attr(*, "class")= chr [1:3] "XY" "MULTIPOLYGON" "sfg"
##  $ superficie    : Units: [m^2] num  1303139 401835 1247953 1236118 1557454 ...
##  $ rapport       : num  41.5 12.8 39.7 39.4 49.6 ...
##  - attr(*, "sf_column")= chr "geometry"
##  - attr(*, "agr")= Factor w/ 3 levels "constant","aggregate",..: NA NA NA NA NA NA
##   ..- attr(*, "names")= chr [1:6] "id" "isomin" "isomax" "point.nom_gare" ...
all_isochrones_filter <- all_isochrones %>% 
  filter(rapport < 45)
mapview(all_isochrones_filter) + mapview(buffers_gares_HDR)
---
title: ""
output: html_document
---

```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE, 
                      message = F, 
                      out.width = '100%')
```

# METHODOLOGIE {.tabset .unnumbered}

Cetta page  a pour but de présenter la méthodologie développée dans le cadre du projet TLI.  


## SCORE

**Lignes étudiées**

<br>
<center>
![](images/lignes_TELLI_FR.png)  
*Carte 1 : Localisation des 17 lignes étudiées*  
</center>
<br>
<br>

**Sélection des points kilométriques sur l'Etoile de Saint-Pol**

```{r, echo = F, include=FALSE}
pacman::p_load(sf, dplyr, mapview, tmap, knitr )
# Chargement des lignes CEREMA ----
lignes_CEREMA <- sf::st_read('C:/Users/otheureaux/Documents/OT/RAILENIUM/BDD_TELLI/GEOFER/lignes-par-statut_queEdC_modifOT.gpkg')
lignes_CEREMA_2154 <- sf::st_transform(lignes_CEREMA, 2154)

# sélection de la ligne de travail
ligne_filter <- lignes_CEREMA_2154 %>% 
  filter(étude.de.cas == 'étoile St Pol') # ICI inscrire le nom de la ligne à étudier

# Création de l'emprise de la zone d'étude ----
ligne_filter_union <- sf::st_union(ligne_filter)
zone_etude <- sf::st_buffer(ligne_filter_union, 5000)
zone_etude <- st_as_sf(zone_etude)

# Chargement de la couche des points kilométriques ----
points_kms <- sf::st_read('C:/Users/otheureaux/Documents/OT/RAILENIUM/DONNEES_CARTO/data/liste-des-pks.geojson')
points_kms <- points_kms %>% mutate(ID_number = row_number())

# Création de l'emprise pour le découpage des points ----
zone_etude_buffer <- st_as_sf(st_buffer(st_union(ligne_filter), 50))

# Découpage des pks sur la ligne sélectionnée
points_kms_2154 <- sf::st_transform(points_kms, 2154)
points_kms_2154_inter <- sf::st_intersection(points_kms_2154, zone_etude_buffer) %>% 
  select(pk, ID_number)
points_kms <- points_kms_2154_inter

# Convertir les valeurs de 'pk' en numérique
pk_num <- as.numeric(points_kms$pk)

# Créer un vecteur logique pour filtrer les pk entiers et ceux se terminant par ,5
filter_condition <- pk_num %% 1 == 0

# Filtrer la collection de fonctions simples en utilisant la condition
filtered_points_kms <- points_kms[filter_condition, ]

points_kms <- st_transform(filtered_points_kms, 2154)
points_kms_decoup <- points_kms
```
<center>
*Carte 2 : Localisation des points kilométriques sur l'Etoile de Saint-Pol*  
</center>
```{r}
if (!requireNamespace("pacman", quietly = TRUE)) install.packages("pacman")
pacman::p_load(sf, dplyr, mapview, tmap, knitr)
```


```{r, out.width='100%'}
mapview(points_kms_decoup)
```

<br>
<br>


**Calcul des isochrones**

<br>
<center>
![](images/saint_pol_carte_isochrones_v2.png)  
*Carte 3 : Buffers isochrones sur l'Etoile de Saint-Pol*  
</center>
<br>
<br>
<br>
**Tableau des variables calculées pour chaque buffer**  


```{r, echo=FALSE}
donnees <- data.frame(
  "Variables" = c("Nombre d’habitants (données carroyées)", 
                  "Total population active (données communales)",
                  "Lits, emplacements dans les campings et chambres d'hôtels", 
                  "Arrêts de transport en commun", 
                  "Aménités : loisirs, santé, commerces, restauration, sport", 
                  "Nombre d’élèves (collèges, lycées, BTS) (données communales)",
                  "Pistes cyclables (longueur kilométrique)",
                  "Réseau pédestre (longueur kilométrique)",
                  "Routes (longueur kilométrique)",
                  "Nombre d’intersections de routes",
                  "Ronds-points",
                  "Nombre de place de parking (données estimées)",
                  "Passage à niveau", 
                  "Zones artificialisées (données reconstruites)", 
                  "Pente (pour le vélo)"
                  ),
  
  "Fournisseurs" = c("INSEE", 
                    "INSEE",
                    "Fichier communal du tourisme (INSEE)", 
                    "Point d’Accès National (données GTFS)", 
                    "SIRENE", 
                    "Ministère de l’Education nationale", 
                    "OpenStreetMap",
                    "IGN BD TOPO", 
                    "IGN BD TOPO", 
                    "IGN BD TOPO", 
                    "OpenStreetMap",
                    "IGN BD TOPO", 
                    "SNCF",
                    "IGN BD TOPO", 
                    "IGN RGE ALTI"
                    )
)
```


```{r}
knitr::kable(donnees) # caption = "Informations et leurs fournisseurs"
```
<center>
<!-- ![](images/data_table.png)   -->
*Tableau 1 : Liste des variables*  
</center>
<br>
<br>
<br>
**Normalisation Min-Max**  
La normalisation Min-Max redimensionne les données dans un intervalle fixe, souvent [0, 1], en ajustant chaque valeur selon les valeurs minimales et maximales de l’ensemble de données, ce qui est utile pour les modèles sensibles aux variations d’échelle entre les variables. Elle est particulièrement utile pour les algorithmes sensibles aux échelles des variables, comme les algorithmes basés sur les distances. La normalisation Min-Max est souvent utilisée dans les contextes où l’uniformité de l’échelle entre les variables est cruciale.

```{r, eval = F}
 normalized_data <- as.data.frame(lapply(dt, function(x) {
   (x - min(x, na.rm = TRUE)) / (max(x, na.rm = TRUE) - min(x, na.rm = TRUE))
 }))
```
<br>
<br>
<br>

**Analyse en composantes principales**  


Nous disposions de 15 variables pour la voiture et de 16 variables pour la marche et le vélo. Afin de réduire leur nombre nous avons procédé à une ACP sur les données issues des isochrones. Pour commencer, nous observons les variances cumulées des trois ACP. Nous mettons également en évidence les graphiques des variables composants les premières dimensions des axes et nous sélectionnons un ensemble de variables pour chaque mode de déplacement. Cette démarche nous permet d’identifier et de réduire le nombre de variables initialement sélectionnées.  
<br>

```{r, out.width='100%', echo=FALSE, include = F}
# Packages
pacman::p_load(sf, dplyr, FactoMineR, factoextra, ggplot2, tidyr,gt)

# data loading
data_foot_beziers <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_beziers_foot_10min_20240530.gpkg')
data_foot_chamonix <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_chamonix_foot_10min_20240530.gpkg')
data_foot_bayonne <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_bayonne_foot_10min_20240530.gpkg')
data_foot_besancon <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_besancon_foot_10min_20240530.gpkg')
data_foot_bordeaux <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_bordeaux_foot_10min_20240530.gpkg')
data_foot_colmar <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_colmar_foot_10min_20240530.gpkg')
data_foot_clermont <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_clermont_foot_10min_20240530.gpkg')
data_foot_deauville <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_deauville_foot_10min_20240530.gpkg')
data_foot_limoges <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_limoges_foot_10min_20240530.gpkg')
data_foot_marseille <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_marseille_foot_10min_20240530.gpkg')
data_foot_reims <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_reims_foot_10min_20240530.gpkg')
data_foot_nantes <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_nantes_foot_10min_20240530.gpkg')
data_foot_nimes <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_nimes_foot_10min_20240530.gpkg')
data_foot_paimpol <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_paimpol_foot_10min_20240530.gpkg')
data_foot_rennes <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_rennes_foot_10min_20240530.gpkg')
data_foot_stpol <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_stpol_foot_10min_20240530.gpkg')
data_foot_tours <- sf::st_read('processed_data/ALL_DATA_NORMALIZED/all_data_normalized_tours_foot_10min_20240530.gpkg')
names(data_foot_chamonix)

# détail score Saint Pol
data_foot_stpol$total_sum_allegee
summary(data_foot_stpol$total_sum_allegee)
names(data_foot_bayonne)

data_foot_beziers <-  data_foot_beziers %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v3, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_chamonix <- data_foot_chamonix %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_bayonne <- data_foot_bayonne %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_besancon <- data_foot_besancon %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_bordeaux <- data_foot_bordeaux %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_colmar <- data_foot_colmar %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_clermont <- data_foot_clermont %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_deauville <- data_foot_deauville %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_limoges <- data_foot_limoges %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_marseille <- data_foot_marseille %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_reims <- data_foot_reims %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_nantes <- data_foot_nantes %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_nimes <- data_foot_nimes %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_paimpol <- data_foot_paimpol %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_rennes <- data_foot_rennes %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_stpol <- data_foot_stpol %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)
data_foot_tours <- data_foot_tours %>% 
  select(sum_lits, longueur_route,longueur_pistes_cyclables, nombre_arrets = nombre_arrets_v2, nombre_parkings, nombre_commerces, nombre_loisirs, nombre_sante,nombre_restauration,  nombre_sports, nombre_ronds_points, nombre_eleves,passage_niveau, ZA,sum_population_carreau_decoup, pente_moyenne)

data_all<- rbind(
  data_foot_beziers,
  data_foot_chamonix,
  data_foot_bayonne,
  data_foot_besancon,
  data_foot_bordeaux, 
  data_foot_colmar ,
  data_foot_clermont ,
  data_foot_deauville, 
  data_foot_limoges ,
  data_foot_marseille, 
  data_foot_reims,
  data_foot_nantes ,
  data_foot_nimes ,
  data_foot_paimpol, 
  data_foot_rennes,
  data_foot_stpol, 
  data_foot_tours)

names(data_all)
data_select <- data_all %>%
  select(
    pop_carreau = sum_population_carreau_decoup,
    sum_lits,
    longueur_route,
    longueur_pistes_cyclables,
    nombre_arrets,
    nombre_parkings,
    nombre_ronds_points,
    nombre_commerces,
    nombre_loisirs,
    nombre_restauration,
    nombre_sports,
    nombre_sante,
    nombre_eleves,
    ZA,
    passage_niveau,
    pente_moyenne
  ) %>% 
  st_drop_geometry()
glimpse(data_select)

# Calcule la corrélation de Pearson entre le score et chaque variable explicative
correlations <- cor(data_select)

# Affiche les corrélations
print(correlations)

# Assurez-vous que correlations est un dataframe
correlations_df <- as.data.frame(correlations)
names(correlations_df)

# Correlations est la matrice de corrélation
correlations_df_long <- pivot_longer(correlations_df,  
                                     cols = everything(),  # Pivoter toutes les colonnes
                                     names_to = "Variable", 
                                     values_to = "Correlation")

# Création du tableau
gt_table <- gt(correlations_df_long) %>%
  cols_label(
    Variable = "Variable",
    Correlation = "Correlation"
  )

gt_table

# Lancement de l'ACP
PCA <- PCA(data_select, scale.unit = T)

# Affichage des valeurs propres
print("Valeurs propres (variance expliquée par chaque composante) :")
print(PCA$eig)

# Contributions des variables aux composantes principales
contrib <- as.data.frame(PCA$var$contrib)
print(contrib)

threshold <- quantile(contrib$Dim.1, 
                      0.50)

# Sélection des variables importantes
# Par exemple, vous pouvez sélectionner les variables avec une contribution élevée à la première composante principale
selected_vars_foot_dim1 <- rownames(contrib[contrib$Dim.1 > threshold, ])
print(selected_vars_foot_dim1)
selected_vars_foot_dim2 <- rownames(contrib[contrib$Dim.2 > threshold, ])
print(selected_vars_foot_dim2)

selected_vars_cor <- data_select %>%
  select(pop_carreau,
    longueur_route,
    nombre_arrets ,
    nombre_commerces,
    nombre_loisirs,
    nombre_restauration,
    ZA, passage_niveau, pente_moyenne  )

# Calcule la corrélation de Pearson entre le score et chaque variable explicative
selected_vars_correlations <- cor(selected_vars_cor)

# Affiche les corrélations
print(selected_vars_correlations)

# Identification des composantes dont la valeur propre est supérieure à 1 (critère de Kaiser)
composantes_utiles <- PCA$eig[PCA$eig[,1] > 1, , 
                              drop = FALSE]
print("Composantes avec une variance > 1 :")
print(composantes_utiles)

# Visualisation des valeurs propres
fviz_eig(PCA, addlabels = TRUE, ylim = c(0, 50))

# Cercle des corrélations
fviz_pca_var(PCA, col.var="contrib", 
             gradient.cols = c("#00AFBB", 
                               "#E7B800", 
                               "#FC4E07"),
             repel = TRUE)

# Graphique des individus
fviz_pca_ind(PCA, col.ind = "cos2", 
             gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
             repel = TRUE)

# Contribution de chaque variable aux deux premiers axes
fviz_contrib(PCA, choice = "var", axes = 1) # axe 1
fviz_contrib(PCA, choice = "var", axes = 2) # axe 2
fviz_contrib(PCA, choice = "var", axes = 3) # axe 3

# Contribution de chaque variable aux trois premiers axes
plot1 <- fviz_contrib(PCA, choice = "var", axes = 1, fill = 'lightslategrey')
# ?fviz_contrib
plot2 <- fviz_contrib(PCA, choice = "var", axes = 2, fill = 'lightslategrey') # axe 2
plot3 <- fviz_contrib(PCA, choice = "var", axes = 3, fill = 'lightslategrey') # axe 3

```

L'ACP à partir des données pédestres révèle que les deux premiers axes cumulent 58% de la variance totale, offrant ainsi une représentation significative des données originales. De cette première analyse nous conservons les valeurs suivantes, qui permettent d’accumuler plus de 50% de la variance expliquée pour chaque dimension : la population, la longueur des routes carrossables,  le nombre d’arrêts de transport en commun,  le nombre de commerces, le nombre de loisirs, le nombre de restaurants, la surface artificialisée et le nombre de passages à niveau.  

```{r, out.width='100%'}
gridExtra::grid.arrange(plot1, plot2, 
                        # plot3, 
                        ncol = 2)

```


*** 
**Tableau des variables retenues**  

<!-- <center> -->
<!-- ![](images/data_table_allegee.png)   -->
<!-- *Tableau 2 : Liste des variables sélectionnées*   -->
<!-- </center> -->

<!-- | Variables                                                     | Fournisseur                            | -->
<!-- |---------------------------------------------------------------|----------------------------------------| -->
<!-- | Nombre d’habitants (données carroyées 200m)                       | INSEE                                  | -->
<!-- | Lits, emplacements dans les campings et chambres d'hôtels     | Fichier communal du tourisme (INSEE)   | -->
<!-- | Arrêts de transport en commun                                 | Point d'Accès National                 | -->
<!-- | Aménités : commerces                                          | SIRENE                                 | -->
<!-- | Nombre d’élèves (collèges, lycées, BTS) (données communales)  | Ministère de l’Education nationale     | -->
<!-- | Passage à niveau                                              | SNCF                                   | -->
<!-- | Zones artificialisées (données reconstruites)                 | IGN BD TOPO                            | -->
<!-- | Pente (pour le vélo)                                          | IGN RGE                                | -->

```{r, echo=FALSE}
donnees <- data.frame(
  "Thématiques" = c("Démographie",
                    "Transport",
                    "Transport",
                    "Économie locale",
                    "Éducation",
                    "Sécurité et infrastructure",
                    "Urbanisme",
                    "Topographie"),
  "Variables" = c("Nombre d’habitants (données carroyées 200m)", 
                  "Longueurs du réseau routier carrossable",
                  "Arrêts de transport en commun", 
                  "Aménités : commerces, santé, loisirs, sports, restauration", 
                  "Nombre d’élèves (collèges, lycées, BTS) (données communales)", 
                  "Passage à niveau", 
                  "Zones artificialisées",
                  "Pente (pour la marche et le vélo)"),
  "Fournisseur" = c("INSEE", 
                    "IGN BD TOPO",
                    "Point d’Accès National (données GTFS)", 
                    "BD SIRENE", 
                    "Ministère de l’Education nationale", 
                    "SNCF", 
                    "IGN BD TOPO",
                    "IGN RGE ALTI"),
  "Intérêts" = c("Indique la densité de population autour des gares, reflétant potentiellement un besoin élevé de services de transport.", 
                 "Indique l'accessibilité de la gare : un réseau routier plus dense et étendu peut faciliter l'accès",
                 "Permet de comprendre l'intégration et la connectivité de la gare au sein du réseau de transport local et régional.",
                 "Donne une idée de la vitalité économique et de l'accessibilité des services autour des gares.",
                 "Indique la présence d'institutions éducatives, suggérant des flux réguliers d'élèves nécessitant des services de transport.",
                 "Souligne les points potentiels de conflit entre le transport ferroviaire et routier, importants pour la planification de la sécurité et l'aménagement urbain.",
                 "Montre les possibilités de d'aménagement des espaces fonciers.",
                "Important pour évaluer l'accessibilité à vélo des gares, influençant la mobilité douce et les choix de transport multimodal.")
)
```


```{r}
knitr::kable(donnees) # caption = "Informations et leurs fournisseurs"
```
<center>
*Tableau 2 : Liste des variables sélectionnées*
</center>
<br>
<br>
<br>

***

**Somme des variables pour la création d'un score**

```{r, eval = F}
all_data$total_sum_allegee <-
  all_data$sum_population_carreau+
  all_data$longueur_route+
  all_data$nombre_loisirs+
  all_data$nombre_arrets+
  all_data$nombre_commerces+
  all_data$nombre_restauration+
  all_data$nombre_sports+
  all_data$nombre_sante+
  all_data$nombre_loisirs+
  all_data$ZA+
  all_data$passage_niveau-
  all_data$pente_moyenne

```

**Cartographie du score pour chaque point kilométrique**

<center>
![](images/points_optimaux_stpol_foot.png)  
*Carte 4 : Cartographie de l’Etoile de Saint-Pol avec les points sélectionnés – résultats du modèle 10 minutes à pied *
</center>

<br>
Pour plus de détails sur la cartographie vous pouvez consulter ce 
<a href="https://carto-tli-otheureaux-97ed8a9cdcbcca25715e51d0bca4025fd538e03b10.gitpages.huma-num.fr/saint-pol.html" target="_blank">lien.
</a>

<br>
<br>

## ISOCHRONES


```{r, include=FALSE}
pacman::p_load(r5r, sf, data.table, ggplot2, tmap, janitor)

# Chargement des lignes CEREMA ----
lignes_CEREMA <- sf::st_read('C:/Users/otheureaux/Documents/OT/RAILENIUM/BDD_TELLI/GEOFER/lignes-par-statut_queEdC_modifOT.gpkg')
lignes_CEREMA_2154 <- sf::st_transform(lignes_CEREMA, 2154)
ligne_filter <- lignes_CEREMA_2154 %>%  
  filter(étude.de.cas == 'étoile St Pol') %>% 
  st_buffer(2000)

isochrones_foot_osrm <- sf::st_read('processed_data/isochrones_gares_HDF_foot_15min_20240206.geojson')
isochrones_foot_osrm <- sf::st_make_valid(isochrones_foot_osrm) %>% 
  st_transform(2154)
isochrones_foot_osrm <- st_intersection(isochrones_foot_osrm,ligne_filter)
mapview(isochrones_foot_osrm)
isochrones_foot_geofer <- sf::st_read('data/isochrones_geofer_p15_st_pol.geojson')
isochrones_foot_geofer <- sf::st_make_valid(isochrones_foot_geofer) %>% 
  st_intersection(ligne_filter)
```


```{r, include = F, cache = T}
gares_st_pol <- sf::st_read('data/gares_saintpol_etaples.gpkg')
gares_st_pol <- sf::st_transform(gares_st_pol, 4326)
# Extraire les coordonnées et créer des colonnes 'lat' et 'lon'
gares_st_pol$lat <- st_coordinates(gares_st_pol)[, "Y"]
gares_st_pol$lon <- st_coordinates(gares_st_pol)[, "X"]
# Ajouter une colonne 'id' à vos points d'origine
gares_st_pol$id <- 1:nrow(gares_st_pol)

options(java.parameters = "-Xmx2G")

# Configurer le dossier où se trouve les éléments
r5r_core <- setup_r5(data_path = "C:/Users/otheureaux/Documents/OT/RAILENIUM/BDD_TELLI/OSM_PBF", verbose = FALSE)
# data_path est le chemin vers le dossier contenant vos données de réseau.

# routing inputs
mode <- c("WALK")
max_trip_duration <- 15      # in minutes

# Calcul des isochrones
isochrones_foot_r5r <- r5r::isochrone(r5r_core,
                       origins = gares_st_pol,
                       mode = mode,
                       sample_size = 1, # 100% du réseau
                       max_trip_duration = max_trip_duration,
                       walk_speed = 5,
                       progress = FALSE)
isochrones_foot_r5r <- isochrones_foot_r5r %>% 
  filter(isochrone == 15)
isochrones_foot_r5r <- sf::st_make_valid(isochrones_foot_r5r) %>% st_transform(2154)
isochrones_foot_r5r <- st_intersection(isochrones_foot_r5r,ligne_filter)

```


```{r, include=FALSE}
isochrones_OTP <- sf::st_read('processed_data/isochrones_st_pol_foot_15min_OTP.gpkg') %>% st_transform(2154) %>% st_intersection(ligne_filter)
```

```{r, include=FALSE}
isochrones_ORS_TOOLS <- sf::st_read('processed_data/isochrones_st_pol_foot_15min_QGIS_ORS_TOOLS.gpkg')  %>% st_transform(2154) %>% st_intersection(ligne_filter)
```


```{r}
tmap_mode('view')
tm_basemap(c(leaflet::providers$Esri.WorldTopoMap,
             leaflet::providers$OpenStreetMap, 
             leaflet::providers$Esri.WorldImageryiders, 
             leaflet::providers$GeoportailFrance.orthos)) + 
  
  tm_shape(isochrones_foot_osrm) + tm_fill('#e77148') + 
  tm_shape(isochrones_foot_geofer) + tm_fill('#75a993') + 
  tm_shape(isochrones_foot_r5r) + tm_fill('#e5b636') + 
  tm_shape(isochrones_OTP) + tm_fill('cornflowerblue') + 
  tm_shape(isochrones_ORS_TOOLS) + tm_fill('brown2') + 
  
  tm_shape(gares_st_pol) + tm_dots()

```

```{r}
sup_osrm <- st_area(isochrones_foot_osrm) 
sup_geofer <- st_area(isochrones_foot_geofer) 
sup_r5r <- st_area(isochrones_foot_r5r) 
sup_OTP <- st_area(isochrones_OTP) 
sup_ORSTOOLS <- st_area(isochrones_ORS_TOOLS) 
```

```{r, include=FALSE}
superficies_osrm <- as.numeric(sup_osrm)
superficies_geofer <- as.numeric(sup_geofer)
superficies_r5r <- as.numeric(sup_r5r)
superficies_otp <- as.numeric(sup_OTP)
superficies_ors_tools <- as.numeric(sup_ORSTOOLS)

superficies_df <- cbind(OSRM = superficies_osrm,
                             GeoFer = superficies_geofer,
                             R5R = superficies_r5r,
                             OTP = superficies_otp,
                             ORS_Tools = superficies_ors_tools)

# Calcul du total des superficies pour chaque service
total_superficies <- colSums(superficies_df, na.rm = TRUE)

# Ajouter la ligne du total au data frame
total_df <- data.frame(superficies_df)
total_df_sup <- rbind(total_df, total_superficies)

```


```{r}
# Affichage du tableau final
print(total_df_sup)
```


## Buffer vs. Iso

```{r, out.width='100%'}
# Packages ----
pacman::p_load(sf, mapview, tmap, dplyr, GGally)

# Chargement de la couche des régions de la France métropolitaine
regions_FR_2154 <- sf::st_read("C:/Users/otheureaux/Documents/OT/DECOUPAGES_FR/REGION.shp")

# Filter sur la région des Hauts-de-France
hauts_de_france <- regions_FR_2154 %>%   filter(INSEE_REG == 32)
zone_etude <- hauts_de_france

# Chargement des gares
gares <- sf::st_read("C:/Users/otheureaux/Documents/OT/RAILENIUM/BDD_TELLI/GEOFER/gares_2154.gpkg")
gares_select <- gares %>% 
  select(nom_gare, voy_2022)

# Découpage gares HDF
gares_HDR <- sf::st_intersection(gares_select, zone_etude)
mapview(gares_HDR)

# Création des buffers
buffers_gares_HDR <- st_buffer(gares_HDR, 1000)
buffers_gares_HDR$superficie <- st_area(buffers_gares_HDR)

# Création des isochones
all_isochrones <- sf::st_read('C:/Users/otheureaux/Documents/OT/6T/R/database_sf/processed_data/isochrones_gares_HDF_foot_15min_20240206.geojson')
all_isochrones <- st_transform(all_isochrones, 2154)
all_isochrones$superficie <- st_area(all_isochrones)

# Carto des buffers et des iso
mapview(buffers_gares_HDR) + mapview(all_isochrones)

# Dataframe des superficies
dt <- data.frame(
  buffers_gares_HDR$superficie,
  all_isochrones$superficie
)

dt$rapport <-all_isochrones$superficie / buffers_gares_HDR$superficie*100


all_isochrones$rapport <- dt$rapport
all_isochrones$rapport <- as.numeric(all_isochrones$rapport)
str(all_isochrones)
all_isochrones_filter <- all_isochrones %>% 
  filter(rapport < 45)
mapview(all_isochrones_filter) + mapview(buffers_gares_HDR)
```

