Régression géographiquement pondérée
La régression géographiquement pondérée (« Geographically Weighted Regression » ou « GWR ») est une régression adaptée au domaine de l'analyse spatiale et tenant compte de la dépendance géographique [1],[2]. Alors que dans la régression classique il est présupposé que le phénomène est stationnaire dans l'espace étudié, dès que l'analyste géographe observe une dépendance entre l'observation et le lieu géographique, il doit employer un modèle non stationnaire tels que GWR, CAR ou SAR.
Pour les articles homonymes, voir GWR.
Description
Formellement, le modèle peut s'écrire, en tout point (i,j) de l'espace géographique étudié :
La matrice où chaque est porteur de la dépendance spatiale locale et s'exprime à l'aide d'une fonction noyau (« kernel ») du type gaussienne comme par exemple où est une mesure de la distance entre la observation et le point de coordonnées spatiales (i,j), h est largeur de bande[2].
Utilisation
L'utilisation de cette régression est conseillée dès que le résidu est géographiquement dépendant[3]. On l'utilise donc dans la fouille de données spatiales.
La distance utilisée pour décrire la diminution du poids avec l'éloignement peut être la distance euclidienne quand les points sont repérés en coordonnées cartésienne ou bien la distance du grand cercle quand les coordonnées sphériques sont employées[2].
Notes et références
Notes
Références
- Shashi Shekhar, Michael R. Evans, James M. Kang, Pradeep Mohan, « « Identifying patterns in spatial information: A survey of methods » », (consulté le )
- [PDF](en) Martin Charlton, A Stewart Fotheringham, « « Geographically Weighted Regression White Paper » », (consulté le )
- [PDF](en) Christopher S. Fowler, « « Geographically Weighted Regression » », (consulté le )
Voir aussi
Bibliographie
- (en) Harvey Miller et Jiawei Han, Geographic Data Mining and Knowledge Discovery, Boca Raton, CRC Press, , 458 p. (ISBN 978-1-4200-7397-3).
- (en) Yee Leung, Knowledge Discovery in Spatial Data, Heidelberg, Springer, , 360 p. (ISBN 978-3-6420-2664-5)
- (en) Hillol Kargupta, Jiawei Han, Philip Yu, Rajeev Motwani et Vipin Kumar, Next Generation of Data Mining, CRC Press, , 3e éd., 605 p. (ISBN 978-1-4200-8586-0)
- Franck Guarnieri et Emmanuel Garbolino, Systèmes d'information et risques naturels, Paris, Presses des MINES, , 251 p. (ISBN 978-2-911762-52-9)
Articles connexes
- Régression linéaire
- Régression linéaire multiple
- Régression logistique
- Modèle linéaire généralisé
- Régression non paramétrique
- Modèles de régression multiple postulés et non postulés
- Auto-régression simultanée
- Auto-régression conditionnelle
- Champ aléatoire de Markov
Liens externes
- Hans-Peter Kriegel, Spatial Data Mining
- Portail des probabilités et de la statistique
- Portail de la géographie