Prévision du prix de l’immobilier parisien à l’aide de DVF &Co
Projet Python 2ème année de l’ENSAE
En collaboration avec :
Sommaire
But
La direction générale des finances publiques publie tous les semestres le dataset Demandes de valeurs foncières qui fournit sur les 5 dernières années l’ensemble des transactions immobilières à partir des actes notariés sur le territoire métropolitain (hors Alsace, Moselle et Mayotte). Ce dataset contient la valeur à laquelle le bien a été vendu, le type de transaction, les caractéristiques des biens (surface, localisation, nombre de pièce) etc. Les données sont accessibles ici;
Nous nous sommes concentrés sur Paris (en dépit d’avoir 64 go de RAM ) pour prédire la valeur d’un bien (en fonction de ses caractéristiques) en enrichissant le dataset avec :
- les données FiLoSoFi publié par l’INSEE qui fournissent des informations sur les caractéristiques des ménages au sein d’un carroyage (de 200m pour notre part), disponible ici.
- les critères d’appréciation et les notes de Paris par arrondissement (noté par les habitants). Ces informations ont été scrappé sur le site Ville-idéale. Le script qui permet de scrapper est disponilbe ici
- les données sur les équipements à proximité des logements. Le dataset est disponible ici. Un gros travail a été nécessaire pour rattacher ces données à la table DVF que vous retrouverez ici.
Dashboard
Nous avons développé dans le cadre de ce projet un dashboard intéractif pour mettre en avant les principales variables disponibles dans notre dataset :