DVF, DPE, BDNB, BAN, BPE, IRIS, Cadastre — et leurs identifiants clés. Les définitions de référence pour maîtriser les 7 référentiels publics de l'immobilier français.
Les données immobilières publiques françaises reposent sur 7 référentiels distincts, chacun avec sa propre terminologie, ses identifiants et sa fréquence de mise à jour. Ce glossaire recense les termes essentiels — sources, colonnes clés, identifiants de croisement — pour naviguer sans se perdre.
Source : DGFiP. Licence : Ouverte Étalab 2.0. Mise à jour : 2×/an.
Registre de toutes les mutations immobilières à titre onéreux depuis 2014. Colonnes clés : date_mutation, valeur_fonciere, surface_reelle_bati, type_local, code_commune. Identifiant de croisement : adresse normalisée via BAN.
→ Guide dédié : DVF complet
Source : ADEME. Licence : ODbL. Mise à jour : continue.
14,9 M de diagnostics énergétiques depuis 2013. Classe A à G sur deux axes : énergie primaire (kWh/m²/an) et GES (kgCO₂eq/m²/an). Colonnes clés : numero_dpe, classe_consommation_energie, consommation_energie, classe_estimation_ges. Identifiant de croisement : ban_id (via géocodage BAN).
→ Guide dédié : Lire un DPE
Source : CSTB (Centre Scientifique et Technique du Bâtiment). Licence : ODbL. Mise à jour : annuelle.
32,2 M de bâtiments décrits : année de construction, matériaux, hauteur, emprise au sol, nombre de logements, type de chauffage. Colonnes clés : id_bdnb, annee_construction, materiaux_mur, nb_logements, type_chauffage_collection. Identifiant de croisement : ban_id, id_parcelle_cadastrale.
Source : IGN / DINUM. Licence : ODbL. Mise à jour : hebdomadaire.
Référentiel national de toutes les adresses postales françaises avec géocodage. Identifiant pérenne : ban_id. Colonnes clés : ban_id, lon, lat, numero, nom_voie, code_postal, code_commune. Rôle central : clé de pivot pour croiser DVF, DPE, BDNB.
Source : INSEE. Licence : Ouverte. Mise à jour : annuelle.
Recensement de 2,4 M d'équipements et services sur le territoire français : commerces, écoles, médecins, transports, sports, culture. Colonnes clés : depcom (code commune), typequ (type d'équipement), lambert_x, lambert_y. Utilisation : calcul de score de proximité des services autour d'une adresse.
Source : INSEE. Licence : Ouverte. Mise à jour : lors des recensements.
Découpage infra-communal de la France en ~50 000 zones de 1 800 à 5 000 habitants. Utilisé pour les données Filosofi (revenus, pauvreté), les statistiques de population, les agrégats DPE. Identifiant : code_iris (9 chiffres : 5 code commune + 4 IRIS). Limite : les communes < 5 000 hab. forment un IRIS unique.
Source : DGFiP / IGN. Licence : Ouverte. Mise à jour : continue (IGN PCI).
Plan parcellaire officiel de la France : géométrie des parcelles, sections, numéros de lot. Identifiant de parcelle : id_parcelle (14 caractères : code département + code commune + préfixe + section + numéro). Utilisation : croisement DVF (mutations) ↔ BDNB (bâtiments).
| Identifiant | Longueur | Source | Rôle |
|---|---|---|---|
ban_id | Variable (~20 car.) | BAN | Pivot universel entre DVF, DPE, BDNB |
code_insee | 5 chiffres | INSEE | Code commune (aussi : code_commune dans DVF) |
code_iris | 9 chiffres | INSEE | Zone infra-communale (5 commune + 4 IRIS) |
id_parcelle | 14 caractères | DGFiP | Lien DVF ↔ Cadastre ↔ BDNB |
numero_dpe | Alphanumérique | ADEME | Identifiant unique d'un diagnostic énergétique |
id_bdnb | Alphanumérique | CSTB | Identifiant unique d'un bâtiment |
Acte de transfert de propriété enregistré par la publicité foncière. Terme légal pour "vente". Une mutation peut porter sur un seul bien ou sur plusieurs lots groupés.
Prix de vente total inscrit dans l'acte notarié. Peut inclure des annexes (parking, cave) sans les distinguer. Ne contient pas les frais de notaire ni les droits de mutation.
Surface habitable déclarée dans l'acte de mutation. Pour les appartements : surface loi Carrez. Pour les maisons : surface déclarée. Hors parkings et caves vendus séparément.
Lettre de A (très performant) à G (passoire thermique) résultant de la méthode 3CL depuis 2021. Déterminée par le pire des deux indicateurs : énergie primaire et GES.
Logement classé F ou G. Interdit à la location (classe G depuis 2025, F depuis 2028). Sujet à décote de 10–20 % à la vente. Voir le guide passoires thermiques.
Score de qualité du géocodage BAN calculé par Intent Analytics pour chaque enregistrement. De 100 (exact) à 20 (faible). Stocké aux côtés de ban_match_method et ban_match_scored_at. Voir la méthodologie de croisement.
Niveau de fiabilité d'un croisement entre deux référentiels (exact / high / good / medium / low / weak). Dépend de la qualité du géocodage et de la cohérence des données.
Période d'observation mobile utilisée pour le calcul de médianes de prix (ex : 24 mois glissants = les 24 derniers mois à la date de calcul). Permet de lisser les effets saisonniers.
Vente d'un bien immobilier neuf avant sa livraison. Apparaît dans DVF mais avec un prix/m² systématiquement plus élevé que l'ancien. À exclure pour les analyses de marché de l'ancien.
Méthode de calcul du DPE obligatoire depuis le 1er juillet 2021. Calcul théorique basé sur les caractéristiques du bâti (isolation, chauffage, ventilation), indépendant des habitudes de l'occupant.
Fichier de localisation sociale fiscale de l'INSEE. Source de données de revenus et de pauvreté à l'échelle IRIS. Utilisé par Intent Analytics pour enrichir le contexte socio-économique des communes et IRIS.
Licence open data permettant la réutilisation libre (y compris commerciale) d'une base de données, à condition de partager sous la même licence les bases dérivées. Utilisée par BAN, BDNB, DPE.
Licence open data française de la DINUM, permettant la réutilisation libre (y compris commerciale) avec simple attribution. Utilisée par DVF, BPE, INSEE.
Le ban_id est l'identifiant pérenne d'une adresse dans la Base Adresse Nationale. C'est la clé de pivot qui permet de croiser DVF (transactions), DPE (diagnostics) et BDNB (bâtiments) sur une même adresse. Sans ban_id, le croisement doit se faire par matching géographique ou textuel — moins fiable. Intent Analytics géocode 99,9 % de ses enregistrements avec un ban_id, ce qui garantit des croisements traçables et reproductibles.
Le code INSEE est l'identifiant officiel d'une commune, sur 5 chiffres (2 département + 3 commune). Le code postal est attribué par La Poste — plusieurs communes peuvent partager le même code postal. Pour les croisements de données publiques, le code INSEE est la référence. Le code postal est pratique pour l'affichage mais ne doit pas servir d'identifiant d'agrégation.
L'ancienne méthode de calcul (sur factures) était peu fiable car dépendante des comportements de l'occupant. La réforme 2021 a introduit la méthode 3CL, plus objective et opposable juridiquement. Les anciens DPE ont été invalidés progressivement : ceux d'avant 2018 ont expiré au 1er janvier 2023, ceux entre 2018 et juin 2021 au 1er janvier 2025.
Le catalogue complet des sources, colonnes, fréquences et usages — avec exemples de croisements.