Skip to Content

Data lake

Définition courte

En data engineering et business intelligence, un data lake est un espace de stockage qui conserve une grande quantité de données brutes dans leur format d’origine jusqu’à ce qu’on en ait besoin.

 

Les data lakes peuvent contenir des centaines de téraoctets ou même de pétaoctets, et stocker des données répliquées provenant de sources multiples.

 

Les data lakes sont souvent utilisés pour rassembler toutes les données d’une organisation en un seul endroit central, où elles peuvent être sauvegardées « telles quelles », sans qu’il soit nécessaire de leur imposer un schéma ou une structure au préalable. 

 

Le terme décrit une stratégie de stockage de données, et non une technologie spécifique, bien qu’il soit fréquemment utilisé en conjonction avec une technologie spécifique (Hadoop). On peut en dire autant du terme  » data warehouse  » qui, bien qu’il fasse souvent référence à une technologie spécifique (base de données relationnelle), décrit en fait une stratégie générale de gestion des données.

Définitions similaires

Consultez aussi…

GLOSSAIRE

Pour ceux qui souhaitent améliorer leurs connaissances en Web et Mobile Analytics (Pratiques & outils)

BUSINESS CASES

Pour ceux qui souhaitent améliorer leurs connaissances en Web et Mobile Analytics (Pratiques & outils)

Travaillons ensemble dès maintenant !
CONTACTEZ-NOUS
Back to top