Headerbild zu Data Vault

Data Vault als Modellierungsansatz von Data Warehouse

Profitieren Sie von Data Vault als Modellierungstechnik für Data Warehouses, das für ein schnelles Verständnis der Daten, mehr Flexibilität, Historisierung und parallele Datenladeprozesse sorgt.

Herausforderungen klassischer Data Warehouses

Im Data Warehouse-Umfeld gibt es zwei bekannte Modellierungsansätze nach Kimball und Inmon, die seit unzähligen Jahren verwendet werden, wenn es um die Speicherung von Daten geht. Diese müssen sich jedoch immer mehr den wachsenden Herausforderungen stellen:

Neue Anforderungen

Anforderungen an Technologien, Konzepten und Best Practices im Arbeitsumfeld haben sich stetig weiterentwickelt.

Größere Datenmengen

Oftmals stellen größere Datenmengen und die geforderte Flexibilität an die heutigen Systeme große Probleme für diese Ansätze dar.

Wachsende IT-Kosten

Einer der wesentlichen Vorteile dieses Modellierungsansatzes liegt in der Flexibilität gegenüber Änderungen, was sich natürlich auch bei den Kosten bemerkbar macht.

Es ist daher fraglich, ob diese Ansätze bei allen modernen Fragestellungen und Anforderungen der heutigen Zeit noch angemessen sind. Aus dieser Überlegung heraus entstand der Data Vault-Modellierungsansatz.

Was ist Data Vault?

Data Vault ist eine Modellierungstechnik, die insbesondere für agile Data Warehouses geeignet ist. Sie bietet eine hohe Flexibilität bei Erweiterungen, eine vollständige Historisierung der Daten und erlaubt eine Parallelisierung der Datenladeprozesse.

Dieser hybride Ansatz vereint alle Vorteile der dritten Normalform mit dem Sternschema. Gerade in der heutigen Zeit müssen Unternehmen in immer kürzeren Zyklen ihre Geschäfte transformieren und diese Transformationen im Data Warehouse abbilden. Data Vault unterstützt genau diese Anforderungen, ohne die Komplexität des Data Warehouses im Laufe der Zeit wesentlich zu erhöhen. Anders als bei Kimball und Inmon entfallen dadurch die immer stärker wachsenden IT Kosten für die umfangreichen Implementierungs- und Testzyklen sowie eine lange Liste von möglichen Abhängigkeiten.

Vorgehensweise bei Data Vault

Die Datenintegrationsarchitektur des Data Vault-Ansatzes verfügt über robuste Standards und Definitionsmethoden, die Informationen zusammenführen, um sie sinnvoll zu nutzen. Das Modell besteht aus drei grundlegenden Tabellentypen:

Schaubild zur Veranschaulichung der Datenintegrationsarchitektur des Data Vault Ansatzes
  • Hub (blau)
    Enthält eine Liste eindeutiger Geschäftsschlüssel, wie z.B. Kundennummern

  • Link (orange)
    Stellt Beziehungen zwischen den Geschäftsschlüsseln her. Links werden häufig verwendet, um Änderungen in der Datengranularität zu behandeln und die Auswirkungen des Hinzufügens eines neuen Geschäftsschlüssels zu einem verknüpften Hub zu reduzieren.

  • Satellit (türkis)
    Enthält beschreibende Attribute, die sich im Laufe der Zeit ändern können. Wo Hubs und Links die Struktur des Datenmodells bilden, enthalten die Satelliten zeitliche und beschreibende Attribute einschließlich Metadaten, die sie mit ihrem übergeordneten Hub oder den Link-Tabellen verknüpfen. 

Vorteile von Data Vault

Auf Grund der Struktur und den definierten Standards ergeben sich viele Vorteile für den Data Vault-Ansatz:

  • Massive Reduzierung von Entwicklungszeit bei der Implementierung von Business-Anforderungen
  • Früherer Return of Investment (ROI)
  • Skalierbares Data Warehouse
  • Nachvollziehbarkeit aller Daten bis zum Quellsystem
  • Near-Real-Time Beladung (neben klassischem Batch Lauf)
  • Big Data Processing (>Terabytes)
  • Iterative, agile Entwicklungszyklen mit inkrementellem Ausbau des DWHs
  • Wenige, automatisierbare ETL Patterns

Nehmen Sie jetzt Kontakt zu uns auf!

Gerne beraten wir Sie in einem unverbindlichen Gespräch und zeigen Ihnen die Potenziale und Möglichkeiten von Data Vault auf. Hinterlassen Sie einfach Ihre Kontaktdaten und wir melden uns dann schnellstmöglich bei Ihnen.

* Pflichtfelder

Wir verwenden die von Ihnen an uns gesendeten Angaben nur, um auf Ihren Wunsch hin mit Ihnen Kontakt im Zusammenhang mit Ihrer Anfrage aufzunehmen. Alle weiteren Informationen können Sie unseren Datenschutzhinweisen entnehmen.

Bitte Captcha lösen!

captcha image
Marc Bastien
Software Architect TIMETOACT Software & Consulting GmbH
Boxhandschuhe als Symbol für Entscheidung zwischen Data Lake und Data Warehouse
Blog 15.02.22

Data Lake vs Data Warehouse: Welche Lösung ist die Richtige?

Geht es um die Speicherung großer Datenmengen, kommt man um die Begriffe Data Lake und Data Warehouse kaum herum. Vielen Unternehmen stellt sich früher oder später die Frage, welche der beiden Lösungen für welchen Anwendungsfall geeignet ist.

Referenz

vdek führt neue Data Warehouse Lösung ein

Mit der Lösung Cloud Pak for Data mit PostgreSQL als direkter Nachfolger von PDA setzt die vdek künftig auf dasselbe Datenbanksystem nur eine Generation weiter.

Referenz 29.03.21

vdek führt neue Data-Warehouse-Lösung ein

Die TIMETOACT GROUP unterstützt den Verband der Ersatzkassen e. V. bei der Umstellung einer Systemumgebung auf neueste IBM-Technologie.

Headerbild zu Big Data, Data Lake und Data Warehouse
Service

Data Lake & Data Warehousing zur Speicherung von Big Data

Für die optimale Lösung – unter besonderer Berücksichtigung der fachlichen Anforderungen – kombinieren wir unterschiedliche Funktionalitäten.

Leistung

Mit Data und Data Science Potentiale heben

Von Business Intelligence, Reporting oder Dashboarding-Projekt bis hin zu Machine Learning: Unser am Standard CRISP-DM orientiertes und an agilen Methoden angelehntes Vorgehensmodell ist speziell auf Daten- und Machine-Learning Projekte zugeschnitten.

Headerbild Data Insights
Service

Data Insights

Mit Data Insights helfen wir Ihnen Schritt für Schritt mit der passenden Architektur neue Technologien zu nutzen und eine datengetriebene Unternehmenskultur zu entwickeln

Easy Cloud Solution
Produkt

Big Data

Aus Daten wertvolle Informationen gewinnen - Die Vorteile serverloser, integrierter End-to-End-Datenanalysedienste nutzen, um herkömmliche Beschränkungen hinter sich zu lassen.

Navigationsbild zu Data Science
Service

AI & Data Science

Wir bieten umfassende Lösungen im Bereich Data Science, Machine Learning und AI, die auf Ihre spezifischen Herausforderungen und Ziele zugeschnitten sind.

Blog 24.07.23

Data Stewardship Council

Die Optimierung von Angeboten und der Verzahnung von Prozessen im Rahmen der Digitalisierung wird ein immer wichtigeres Thema. Verschiedene Geschäftsbereiche verwenden oft spezialisierte Lösungen, die über Schnittstellen miteinander verbunden sind. Dabei werden häufig dieselben Informationen von unterschiedlichen Zuständigen in verschiedenen Systemen eingepflegt. Im folgenden Blogbeitrag erfährst du, wie du den Überblick über die Daten behältst, was die Bedeutung einer guten Datenvernetzung ausmacht und wie du das Innovationspotenzial deines Unternehmens nutzt.

Teaserbild Deployment Atlassian Data Center
Technologie 12.09.22

Atlassian Data Center

Data Center ist die selbstverwaltete Enterprise-Lösung, die Unternehmen durch die hohe Skalierungsfähigkeit unterstützt.

Technologie 08.08.22

Atlassian Data Center

Data Center ist die selbstverwaltete Enterprise-Lösung, die Unternehmen durch die hohe Skalierungsfähigkeit unterstützt.

Headerbild Talend Data Integration
Technologie

Talend Data Integration

Talend Data Integration bietet eine hochskalierbare Architektur für nahezu jede Anwendung und jede Datenquelle – mit gut 900 Konnektoren von der Cloud Lösung wie Salesforce über klassische On-Premises Systeme.

Headerbild zu Talend Data Fabric
Technologie

Talend Data Fabric

Die ultimative Lösung für Ihre Datenbedürfnisse – Talend Data Fabric beinhaltet alles was das (Datenintegrations-) Herz begehrt und bedient sämtliche Integrationsanforderungen rund um Anwendungen, Systeme und Daten.

Kompetenz

Artificial Intelligence & Data Strategy

Jedes Unternehmen erfasst und verwaltet Unmengen an Daten, z. B. aus Produktionsprozessen oder Geschäftstransaktionen.

Event 06.05.20

Webcast: Versicherung und Data Science

Marc Bastian zeigt Ihnen ein Beispiel einer analytischen Infrastruktur für KI Anwendungsfälle, praktische Projekterfahrung und Erfolgsfaktoren.

Articifial Intelligence & Data Science
Service

Artificial Intelligence & Data Science

Aus strukturierten und unstrukturierten Daten wertvolle Informationen extrahieren — das verbirgt sich hinter Data Science.

Wissen

So verändert Data Analytics die Industrie

Mit dem Einsatz von Data Analytics in der Industrie tun sich für Unternehmen zahlreiche neue Möglichkeiten auf.

Headerbild zu Operationalisierung von Data Science (MLOps)
Service

Operationalisierung von Data Science (MLOps)

Daten und Künstliche Intelligenz (KI) bzw. Artificial Intelligence (AI) können fast jeden Geschäftsprozesses basierend auf Fakten unterstützen.

Training

Insight Essentials (Data Center)

In dem Training „Insight Essentials“ erlernen die Teilnehmer:innen wie Sie Ihren Jira Service Management-Workflow mit den Asset-Management-Funktionen von Insight erweitern können.

Training

Confluence Administration (Data Center)

Im Kurs "Confluence Administration (Data Center)" lernen die Teilnehmenden die wichtigsten Confluence Administrationsaufgaben kennen.

Bleiben Sie mit dem TIMETOACT GROUP Newsletter auf dem Laufenden!