Définition courte
Comme le nom le laisse entendre, en data engineering, les données non structurées ne sont pas organisées ou formatées. Elles peuvent être textuelles ou non textuelles. Elles peuvent être générées par l’homme ou par une machine.
Elles ne sont conformes à aucun modèle prédéfini, elles sont donc stockées dans des bases de données non relationnelles et sont interrogées à l’aide de NoSQL.
Les données non structurées sont très diverses, de sorte que les exemples peuvent constituer une longue liste. Parmi les exemples de données non structurées les plus courants, on trouve :
Les médias : Fichiers audio et vidéo, images, etc.
Les fichiers texte : Documents Word, présentations PowerPoint, etc.
Les mails : Il y a une certaine structure interne de métadonnées, donc parfois appelée semi-structurée, mais le corps du message est non structuré et difficile à analyser.
Les médias sociaux : Données provenant de sites de réseaux sociaux comme Facebook, Twitter et LinkedIn, etc.
Les communications : Chat, enregistrements d’appels, SMS, etc.
Avec l’augmentation des informations disponibles sur le web, dont la plupart sont non structurées, trouver des moyens de les utiliser est devenu un enjeu stratégique pour de nombreuses entreprises.
10 ressources data marketing à forte valeur ajoutée
1. Formation sur Google Analytics 4
2. Formation sur Google Tag Manager
3. Formation sur les paramètres UTM
4. Formation sur le plan de taggage
5. Formation sur Looker Studio
7. Formation sur Google Tag Manager Server-Side
8. Formation sur l’attribution marketing