Data Lake & Advanced Analytics

Konsolidierung und Analyse von komplexen Unternehmens- und Kundendaten.

Projektsteckbrief

Ziel
Aufbau eines Data Lakes zur Konsolidierung und Bereinigung von Produktstammdaten und zur Analyse von Kundenbewegungsdaten

Dauer
12 Monate

System
IBM Cloud, Watson Services, Spark

Branche
Electronic​

Typ
B2B

Onboarding
2018 - 2019

Künstliche Intelligenz nutzen: Durch Datenanalyse Mehrwerte generieren

Der Kunde ist eine Kooperation von mittelständischen Elektrofachgroßhändlern mit mehr als 200 Verkaufsstellen in Deutschland und Österreich.

Die Herausforderung: Zusammenführung und Konsolidierung der Daten der Gesellschafter sowie die analytische Nutzung zur Optimierung von Einkauf, Logistik und Verkauf; dies unter besonderer Berücksichtigung der Datenhoheit der Gesellschafter sowie der DSGVO.

Die Lösung: Aufbau eines Systems zur Anbindung der verschiedenen datentragenden Systeme der Gesellschafter sowie zur Bereinigung, Klassifizierung und Verknüpfung der unterschiedlichen Datenbestände unter Einbeziehung spezialisierter Machine Learning-Algorithmen.

Entwicklung und Training von KI-Modellen und -Algorithmen in den Feldern Data Cleansing und Data Classification, Textmining und Image Analysis, Predictions und Recommendations, Forecasting und Reporting.

Der Mehrwert

Die Nutzbarmachung der Daten aller ermöglicht es dem einzelnen Gesellschafter, tiefere und genauere Einblicke in das Nutzer- und Käuferverhalten zu bekommen, als er sie aus seinen eigenen Daten gewinnen könnte. Predictions und Forecasts gewinnen durch die breitere Datenbasis an Genauigkeit und fördern den Absatz über die verschiedenen Kanäle von der Fläche bis zum Online-Shop.

Die Konsolidierung der Daten aller Gesellschafter erhöht die Datenqualität und reduziert Redundanzen und Dubletten zwischen den Systemen. Die offene und primär auf Opensource-Produkten realisierte Architektur ermöglicht die notwendige Flexibilität und Skalierbarkeit in der Anbindung und Verarbeitung verschiedenster Datenquellen.

Ein zentraler “Single-Point-of-Truth” zur Konsolidierung und Speicherung aller unternehmens- und kundenrelevanten Daten.

Die Technik

  • Zur Anbindung der verschiedenen Gesellschaftersysteme sowie der Steuerung der Data Cleansing und Data Mapping Prozesse wird eine Java-basierte Online-Applikation eingesetzt. Sie integriert zudem die notwendigen Data Governance-Regeln und übernimmt die Anonymisierung und Deanonymisierung der Gesellschafter- und Kundendaten.
  • Der performante und skalierbare “Data Lake” wird mittels MongoDB-Instanzen umgesetzt.
  • Advanced Analytics und die Entwicklung der KI-Modelle und -Algorithmen wird mittels Apache Spark realisiert.
  • Das gesamte System läuft innerhalb einer Private Cloud der IBM Cloud in Deutschland.
Übersicht der Funktionsweise: Zentrale Datenverarbeitung (nach DSGVO) mit Anbindung der Gesellschaftersysteme und Kunden - Zentraler Data Lake als Datenpool  - Advanced Analytics und KI-Modell & Algorithmen Entwicklung  mit Apache Spark - gehostet auf der IBM Cloud

Kontakt

Headerbild zu Big Data, Data Lake und Data Warehouse
Service

Data Lake & Data Warehousing zur Speicherung von Big Data

Für die optimale Lösung – unter besonderer Berücksichtigung der fachlichen Anforderungen – kombinieren wir unterschiedliche Funktionalitäten.

Headerbild zu Talend Real-Time Big Data Platform
Technologie

Talend Real-Time Big Data Platform

Talend Big Data Platform vereinfacht komplexe Integrationen, sodass Sie große Datenmengen mit Apache Spark, Databricks, AWS, IBM Watson, Microsoft Azure, Snowflake, Google Cloud Platform und NoSQL erfolgreich nutzen können.

Boxhandschuhe als Symbol für Entscheidung zwischen Data Lake und Data Warehouse
Blog 15.02.22

Data Lake vs Data Warehouse: Welche Lösung ist die Richtige?

Geht es um die Speicherung großer Datenmengen, kommt man um die Begriffe Data Lake und Data Warehouse kaum herum. Vielen Unternehmen stellt sich früher oder später die Frage, welche der beiden Lösungen für welchen Anwendungsfall geeignet ist.

Navigationsbild zu Business Intelligence
Service

Analytics & Business Intelligence

Business Intelligence (BI) ist ein technologiegetriebener Prozess zur Analyse von Daten und zur Darstellung von verwertbaren Informationen. Dies bildet die Basis dafür, dass Entscheidungen auf fundierten Informationen getroffen werden können.

Technologie

Microsoft Azure Synapse Analytics

Mit Synapse hat Microsoft in der Azure Cloud eine Plattform für alle Aspekte von Analytics bereitgestellt. Synapse umfasst innerhalb der Plattform Dienste für die Datenintegration, Datenhaltung in jeglicher Größe und Big Data Analytics. Zusammen mit existierenden Architekturtemplates entsteht in kurzer Zeit für jeden analytischen Anwendungsfall eine Lösung.

Predictive Analytics
Kompetenz 03.09.20

Predictive Analytics

Mit Predictive Analytics hilft X-INTEGRATE Unternehmen, aus vorhandenen Daten genaue Vorhersagen für die Zukunft zu treffen und damit einen entscheidenden Wettbewerbsvorteil zu erlangen.

Blog 20.05.22

In 6 Schritten zur passenden Data Analytics-Lösung

Um Innovation im Unternehmen voranzutreiben, braucht es eine state-of-the-art Data Analytics-Lösung. Oftmals ist hier eine Modernisierung von Nöten. Erfahren Sie in sechs Schritten, wie Sie die für Sie passende Lösung finden!

Headerbild IBM Cloud Pak for Data
Technologie

IBM Cloud Pak for Data

Das Cloud Pak for Data fungiert als zentrale, modulare Plattform für analytischen Anwendungsfälle. Es integriert Funktionen für die physikalische und virtuelle Integration von Daten in einen zentralen Datenpool – einen Data Lake oder ein Data Warehouse, einen umfassenden Datenkatalog und zahlreicher Möglichkeiten der (AI-) Analyse bis zur operativen Nutzung derselben.

Headerbild Talend Data Integration
Technologie

Talend Data Integration

Talend Data Integration bietet eine hochskalierbare Architektur für nahezu jede Anwendung und jede Datenquelle – mit gut 900 Konnektoren von der Cloud Lösung wie Salesforce über klassische On-Premises Systeme.

Easy Cloud Solution
Produkt

Big Data

Aus Daten wertvolle Informationen gewinnen - Die Vorteile serverloser, integrierter End-to-End-Datenanalysedienste nutzen, um herkömmliche Beschränkungen hinter sich zu lassen.

Service

Analytics, BI & Planning

Leistungsstarke und flexible Lösungen, damit Sie mit Analytics, BI & Planning bessere Entscheidungen treffen, Kundenbedürfnisse erfüllen & Chancen erkennen

Teaserbild zu Data Integration Service und Consulting
Service

Data Integration Service und Consulting für Ihr Unternehmen

Legen Sie eine optimale Basis für die Nutzung Ihrer Daten – indem Sie diese in ein einheitliches und einfach abfragbares Schema bringen.

Wissen

So verändert Data Analytics die Industrie

Mit dem Einsatz von Data Analytics in der Industrie tun sich für Unternehmen zahlreiche neue Möglichkeiten auf.

Risiko Management im Bereich der Governance immer wichtiger
Referenz

Einführung eines Identity Management Systems (IDM)

Einführung eines Identity Management Systems (IDM) in einem Konzernbereich mit dem Schwerpunkt, die Joiner-/Mover-/Leaver-Prozesse zu automatisieren. Zusätzlich sollte eine Datenbereinigung im Bereich Benutzer erfolgen, um auch eine Reduzierung der Lizenzkosten zu ermöglichen.

Articifial Intelligence & Data Science
Service

Artificial Intelligence & Data Science

Aus strukturierten und unstrukturierten Daten wertvolle Informationen extrahieren — das verbirgt sich hinter Data Science.

Referenz 01.10.24

Data Fabric im Krankenhaus - Agaplesion

Die Implementierung einer Data Fabric auf Basis des IBM Cloud Pak for Data System ermöglicht AGAPLESION, komplexe Analysen durchzuführen. Dadurch wird die Kosten- und Leistungstransparenz in der Patientenversorgung erhöht und die Grundlage für zukünftige KI-Anwendungen geschaffen.

Navigationsbild zu Business Intelligence
Service

Analytics & Business Intelligence

Business Intelligence (BI) ist ein technologiegetriebener Prozess zur Analyse von Daten und zur Darstellung von verwertbaren Informationen.

Headerbild Industrial Internet of Things (IIoT)
Kompetenz 16.09.20

Industrial Internet of Things

Ob in Industrie, Stadtplanung oder im Privaten: Das Internet of Things macht unser Leben einfacher. Insbesondere die Digitalisierung der industriellen Produktion spart Ihr Unternehmen Zeit und Kosten.

Referenz

vdek führt neue Data Warehouse Lösung ein

Mit der Lösung Cloud Pak for Data mit PostgreSQL als direkter Nachfolger von PDA setzt die vdek künftig auf dasselbe Datenbanksystem nur eine Generation weiter.

Headerbild zu Talend Data Fabric
Technologie

Talend Data Fabric

Die ultimative Lösung für Ihre Datenbedürfnisse – Talend Data Fabric beinhaltet alles was das (Datenintegrations-) Herz begehrt und bedient sämtliche Integrationsanforderungen rund um Anwendungen, Systeme und Daten.

Bleiben Sie mit dem TIMETOACT GROUP Newsletter auf dem Laufenden!