Domicile > Gestion de contenu d'entreprise > Données Semi-Structurées

Données semi-structurées

Les données semi-structurées sont des données qui n'ont pas été organisées dans un référentiel spécialisé, comme une base de données, mais qui possèdent néanmoins des informations associées, comme des métadonnées, qui les rendent plus faciles à traiter que les données brutes.

La différence entre données structurées, données non structurées et données semi-structurées :
Les données non structurées n'ont pas été organisées dans un format qui en facilite l'accès et le traitement. En réalité, très peu de données sont totalement non structurées. Même les choses qui sont souvent considérées comme des données non structurées, comme les documents et les images, sont structurées dans une certaine mesure. Les données structurées sont fondamentalement l'opposé des données non structurées : Elles ont été reformatées et leurs éléments ont été organisés dans une structure de données afin que les éléments puissent être adressés, organisés et accessibles dans diverses combinaisons pour mieux utiliser les informations. Les données semi-structurées se situent quelque part entre les deux. Elles ne sont pas organisées d'une manière complexe qui rende possible un accès et une analyse sophistiqués ; cependant, elles peuvent avoir des informations associées, comme le balisage des métadonnées, qui permettent d'adresser les éléments contenus.

Voici un exemple : Un document Word est généralement considéré comme une donnée non structurée. Cependant, vous pouvez ajouter des balises de métadonnées sous forme de mots-clés et d'autres métadonnées qui représentent le contenu du document et permettent de trouver plus facilement ce document lorsque les gens recherchent ces termes -- les données sont maintenant semi-structurées. Néanmoins, le document n'a toujours pas l'organisation complexe de la base de données, et n'est donc pas une donnée entièrement structurée.

En réalité, il existe un chevauchement considérable entre les limites de ces trois catégories, qui sont parfois décrites collectivement comme le continuum des données.

Par Prissie

Moteur de recommandation :: LCD (Liquid Crystal Display)
Liens utiles