Session

Fabric à l’épreuve du réel : le retour du Warehouse avec dbt

Le Lakehouse a-t-il vraiment gagné la bataille face au Data Warehouse ?
Avec Microsoft Fabric, le choix de Spark et d'une architecture Lakehouse est souvent privilégié.
Pourtant, de nombreux projets en production racontent une autre histoire : consommations qui s'envolent, capacités surchargées et solutions difficiles à industrialiser.

Et si les Warehouses associés à la polyvalence de dbt étaient aujourd'hui l'approche la plus simple et robuste pour traiter des données structurées dans Fabric ?
L’arrivée récente de l’item dbt Job, et demain de dbt Fusion, ouvre la voie à des transformations plus maitrisées et efficaces.

À partir d'un retour d'expérience sur une plateforme traitant plusieurs dizaines de téraoctets de données, nous verrons :
- la maturité de l'intégration de dbt dans Fabric et les implémentations qui fonctionnent
- pourquoi le Warehouse est compétitif sur les données structurées
- comment ingérer massivement des fichiers à faible coût en SQL
- les avantages de dbt dans un projet de transformation : modularité, gestion des dépendances, tests, documentation, notamment par rapport aux procédures stockées classiques ou aux notebooks Spark
- les pièges fréquents qui impactent fortement la consommation

Prenons ensemble du recul sur la hype Spark pour voir ce qui fonctionne efficacement dans Fabric.

Matthieu Roy

Paris, France

Actions

Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.

Jump to top