Data Warehouse Immobilier

Pipeline de données complet pour l'analyse du marché immobilier français. Ingestion, transformation et interprétation des données avec une architecture moderne et performante.

Contributeurs

Boris TAKOU KENNE

Compétences

Python

DuckDB

Data Engineering

SQL

ETL

Publié

10 Décembre 2025

Liens importants

GitHub

Architecture du projet

Zone 1 : Raw Data (L'Ingestion)

Récupération des fichiers CSV bruts (dvf_stat_mensuelle, dvf_stat_geographique_globale). C'est l'entrée du "Data Lake".

Zone 2 : Staging & Curated (La Transformation)

Le point technique : Nettoyage des données (script_clean_staging) et d'agrégation (script_curated_BI). Le résultat : Des fichiers prêts pour l'analyse comme france_mensuel ou des classements par prix et volume (top_dep_prix, top_dep_volume).

Data Warehouse Immobilier

Architecture du projet

Zone 1 : Raw Data (L'Ingestion)

Zone 2 : Staging & Curated (La Transformation)

Zone 3 : Data Warehouse & Analytics

Étapes du projet

Ingestion des données

Transformation & modélisation

Pipeline ETL

Interpretation

Data Warehouse Immobilier

Architecture du projet

Zone 1 : Raw Data (L'Ingestion)

Zone 2 : Staging & Curated (La Transformation)

Zone 3 : Data Warehouse & Analytics

Étapes du projet

Ingestion des données

Transformation & modélisation

Pipeline ETL

Interpretation

Échangeons ensemble