Skip to Content

Data lake

Définition courte

En data engineering et business intelligence, un data lake est un espace de stockage qui conserve une grande quantité de données brutes dans leur format d’origine jusqu’à ce qu’on en ait besoin.

Les data lakes peuvent contenir des centaines de téraoctets ou même de pétaoctets, et stocker des données répliquées provenant de sources multiples.

Les data lakes sont souvent utilisés pour rassembler toutes les données d’une organisation en un seul endroit central, où elles peuvent être sauvegardées « telles quelles », sans qu’il soit nécessaire de leur imposer un schéma ou une structure au préalable. 

Le terme décrit une stratégie de stockage de données, et non une technologie spécifique, bien qu’il soit fréquemment utilisé en conjonction avec une technologie spécifique (Hadoop). On peut en dire autant du terme  » data warehouse  » qui, bien qu’il fasse souvent référence à une technologie spécifique (base de données relationnelle), décrit en fait une stratégie générale de gestion des données.

Consultez aussi…

GLOSSAIRE

Recherchez les définitions qui vous manquent !

BUSINESS CASES

Les cas d’étude de nos clients !

BLOG

L’actu data, par BORYL !

Travaillons ensemble dès maintenant !
CONTACTEZ-NOUS
Back to top