Définition courte
Les datasets contiennent généralement de grandes quantités de données qui peuvent être stockées dans des formats qui ne sont pas faciles à utiliser. Les data engineers doivent donc vérifier au préalable que les données soient correctement formatées et conformes à l’ensemble des règles préétablies.
En data engineering, le data cleaning (nettoyage des données) est le processus de préparation des données en vue de leur analyse en supprimant ou en modifiant les données qui sont incorrectes, incomplètes, non pertinentes, dupliquées ou mal formatées.
Le nettoyage des données n’est pas seulement fait pour rendre l’ensemble des données beau et attrayant pour les analystes, mais pour corriger et éviter les problèmes qui peuvent survenir à partir de données non fiables.
Les data engineer passent 60 % de leur temps à organiser et à nettoyer les données !
10 ressources data marketing à forte valeur ajoutée
1. Formation sur Google Analytics 4
2. Formation sur Google Tag Manager
3. Formation sur les paramètres UTM
4. Formation sur le plan de taggage
5. Formation sur Looker Studio
7. Formation sur Google Tag Manager Server-Side
8. Formation sur l’attribution marketing