Skip to Content

Data cleaning (nettoyages de données)

Nicolas Belhamri
< 1 min

Définition courte

Les datasets contiennent généralement de grandes quantités de données qui peuvent être stockées dans des formats qui ne sont pas faciles à utiliser. Les data engineers doivent donc vérifier au préalable que les données soient correctement formatées et conformes à l’ensemble des règles préétablies.

En data engineering, le data cleaning (nettoyage des données) est le processus de préparation des données en vue de leur analyse en supprimant ou en modifiant les données qui sont incorrectes, incomplètes, non pertinentes, dupliquées ou mal formatées.

Le nettoyage des données n’est pas seulement fait pour rendre l’ensemble des données beau et attrayant pour les analystes, mais pour corriger et éviter les problèmes qui peuvent survenir à partir de données non fiables.

Les data engineer passent 60 % de leur temps à organiser et à nettoyer les données !

Téléchargez nos maps des KPIs SaaS et e-commerce
Télécharger
Téléchargez 3 exemples de plan de taggage web GA4/GTM (SaaS, e-commerce, lead generation)
Télécharger
Téléchargez notre formation sur Google Analytics 4 (version longue)
Télécharger

Consultez aussi…

GLOSSAIRE

Recherchez les définitions qui vous manquent !

CAS CLIENTS

Nos cas clients par industrie, type de business et type de mission !

BLOG

L’actu data, par BORYL !

Recevez chaque mois des ressources pour garder une longueur d’avance sur les sujets Data Marketing & Analytics !
S'INSCRIRE À LA NEWSLETTER
Back to top
🍪 La fin des cookies tiers sur Google : Le guide complet pour les marketeurs/annonceurs !  👉 TÉLÉCHARGER 👈