Data Vault 2.0

Data Vault ist ein Architektur- und Modellierungsansatz für ein Enterprise Data Warehouse.

Für die Data-Vault-Modellierung verwenden Sie folgende Modellelemente:

  • Data-Vault-Diagramm

    Mit seinen einfachen und verständlichen Modellierungsparadigmen sowie Namenskonventionen ermöglicht Data Vault ein schnelles Verständnis der Daten. Das Data-Warehouse erhält durch Data Vault quasi seine eigene Sprache mit einfacher Grammatik und einheitlichen Vokabeln.

    Die Notation beruht auf dem Entity-Relationship-Modell und nutzt spezifische Entitäten (Hub, Satellit, Link).

    Innovator bietet für Data-Vault-Diagramme folgende Diagrammnotationen an:

    • Chen

      Notation nach Peter Pin-Shan Chen mit (min,max)-Kardinalitäten

    • DSA

      Notation gemäß Datenstrukturanalyse

    • James Martin

      Notation nach James Martin, Bachmann und Odell (auch "Krähenfußnotation" genannt)

    • SERM

      Notation gemäß der Strukturierten Entity-Relationship-Modellierung von Prof. Dr. Elmar J. Sinz

    • UML

      Notation gemäß der Unified Modeling Language

    • IDEF1X

      Notation gemäß IDEF1X-Standard (U.S.-Behördenstandard FIPS 184)

    Der Hauptunterschied dieser Notationen ist die Darstellung der Beziehungen, deren Kardinalitäten mit unterschiedlichen Grafiksymbolen oder formalen Texten an unterschiedlichen Positionen abgebildet werden.

  • Hub

    Mit einem Hub werden Informationen, die ein Geschäftsobjekt eindeutig beschreiben, d. h. seine Identität, modelliert.

    Eine Hubentität beschreibt ein Kernobjekt der Geschäftslogik (z.B. Produkt), das in der Regel sehr stabil ist, was zur Langlebigkeit des Datenmodells beiträgt.

  • Link

    Mit einem Link wird eine Beziehung zwischen zwei Geschäftsobjekten (Geschäftsbeziehung) modelliert, z.B. zwischen Kunde und Produkt.

  • Satellit

    Mit einem Satelliten werden die Attribute modelliert, die ein Objekt beschreiben.

    In der Satellitenentität werden alle Informationen gespeichert, die die Hubentität oder die Linkentität beschreiben.

Für die Modellierung von Datenintegration und Datenbereitstellung im Data-Warehouse verwenden Sie vor allem folgenden Diagrammtyp.