ADDRESS

Church Road
St Annes, Lancashire.

PHONE

07812575833

Modèle de données eav

En examinant si votre système opérationnel doit ou non utiliser le modèle EAV, il est important d`examiner le grand nombre de technologies modernes pour les données éparses. Aujourd`hui, les bases de données de magasins de lignes modernes développent la gestion native des matrices non structurées ou éparses. Par exemple, Postgres a une prise en charge étendue de la paire valeur clé. À la fin du livre de Jon Bentley “Ecrire des programmes efficaces”, l`auteur avertit que rendre le code plus efficace en général rend également plus difficile à comprendre et à entretenir, et donc on ne se précipite pas et Tweak code à moins que l`on a d`abord déterminé qu`il ya un problème de performance, et des mesures telles que le profilage de code ont mis en évidence l`emplacement exact du goulot d`étranglement. Une fois que vous l`avez fait, vous modifiez uniquement le code spécifique qui doit s`exécuter plus rapidement. Des considérations similaires s`appliquent à la modélisation EAV: vous l`appliquez uniquement au sous-système où la modélisation relationnelle traditionnelle est connue a priori pour être lourde (comme dans le domaine des données cliniques), ou est découverte, au cours de l`évolution du système, de poser un entretien significatif Défis. Base de données Guru (et actuellement vice-président de Core Technologies chez Oracle Corporation) Tom Kyte [13], par exemple, souligne correctement les inconvénients de l`emploi d`EAV dans les scénarios d`affaires traditionnels, et fait remarquer que la simple «souplesse» n`est pas un critère suffisant pour l`emploi de l`EAV. (Cependant, il fait l`affirmation que l`EAV devrait être évitée en toutes circonstances, même si la Division sciences de la santé d`Oracle lui-même emploie EAV pour modéliser des attributs de données cliniques dans ses systèmes commerciaux ClinTrial [14] et Oracle Clinical. [15]) Outre la manière dont les données sont explicitement modélisées (UDM utilise simplement des vues relationnelles pour intercéder entre l`utilisateur et le schéma de base de données), EAV diffère des modèles de données universels en ce qu`elle s`applique également aux systèmes transactionnels, non seulement orientés vers les requêtes ( en lecture seule) comme dans UDM. En outre, lorsqu`il est utilisé comme base pour les systèmes de requête de données cliniques, les implémentations EAV ne protègent pas nécessairement l`utilisateur de devoir spécifier la classe d`un objet d`intérêt.

Dans le Data Mart clinique i2b2 basé sur EAV [21], par exemple, lorsque l`utilisateur recherche un terme, elle a la possibilité de spécifier la catégorie de données à laquelle l`utilisateur est intéressé. Par exemple, l`expression «lithium» peut désigner soit le médicament (qui est utilisé pour traiter le trouble bipolaire), soit un test de laboratoire pour le niveau de lithium dans le sang du patient. (Le niveau sanguin du lithium doit être surveillé avec précaution: une trop grande partie du médicament provoque des effets secondaires sévères, alors que trop peu est inefficace.) Une grande partie des données du monde est stockée dans un modèle de valeur d`attribut d`entité (EAV). Le modèle de l`EAV est un modèle de valeur clé couramment utilisé dans la recherche scientifique, la médecine, les soins de santé, et populaire open source et les plates-formes logicielles commerciales telles que Magento et Drupal. L`avantage principal du modèle EAV est que les schémas d`ER traditionnels ne peuvent pas gérer une faible rareté et la volatilité des données. Il a été conçu dans le but d`obtenir des données, avec le compromis d`être difficile d`obtenir des données de retour. Pour surmonter ces inconvénients, cet article couvrira comment analyser efficacement les données EAV. Initialement postulé par Maier, Ullman et Vardi [19], le “Universal Data Model” (UDM) cherche à simplifier la requête d`un schéma relationnel complexe par des utilisateurs naïfs, en créant l`illusion que tout est stocké dans un seul géant “table universelle”. Il le fait en utilisant des relations inter-tables, de sorte que l`utilisateur n`a pas besoin de se préoccuper de ce que la table contient quel attribut. C.J. date, cependant, [20] a souligné que dans les circonstances où un tableau est multiplié par rapport à un autre (comme dans les bases de données généalogiques, où le père et la mère d`un individu sont également des individus, ou dans certaines bases de données d`affaires où toutes les adresses sont stockées centralement, et qu`une organisation peut avoir différentes adresses de bureau et adresses d`expédition), il n`y a pas suffisamment de métadonnées dans le schéma de base de données pour spécifier des jointures non ambiguës.