Verbesserte Performance und Stabilität von Atlassian-Umgebungen durch catworkx Root-Cause-Analysen

Root-Cause-Analysen, kurz RCA (zu deutsch: Fehler-Ursachen-Analyse) gehen Problemen auf den Grund. Richtig eingesetzt, verbessern sie nicht nur die Sicherheit von IT-Infrastrukturen (z.B. Atlassian-Umgebungen) in Unternehmen, auch werden Fehler eliminiert und dadurch steigt die Performance. Gerade in großen Unternehmen und Konzernen mit komplexen Strukturen ist die Suche nach der Ursache von Performance-Problemen sehr anspruchsvoll. Sie hängt entscheidend von einer guten Kommunikation zwischen den beteiligten Mitarbeitern sowie einer guten Koordination der Stakeholder ab.

Das Projekt im Überblick

Die Anforderungen

  • Unterstützung bei einer Root Cause Ananlyse (RCA) in der gesamten Atlassian-Infrastruktur und den peripheren Abhängigkeiten

Die Lösung

  • Analysierung der Atlassian-Umgebung des Kunden, Erarbeitung von Handlungsempfehlungen sowie gemeinsame Umsetzung mit dem Kunden
  • Aufbau einer Monitoringumgebung und Durchführung von Last-Simulationen (Ramp-up, Stress-Tests, Last-Tests, Funktionale Tests)

Der Nutzen

  • Zielgerichtete und effiziente Kommunikation in alle Richtungen durch Einbindung aller Stakeholder bei der Lösungsfindung
  • Bündelung der Kompetenzen

catworkx verfügt über viele Jahre Erfahrung in der Einführung und im Betrieb von Atlassian-Produkten und vielschichtigen Infrastrukturarchitekturen. Zudem bewegt sich catworkx sicher in komplexen Konzernstrukturen und bringt ein hohes Maß an Kompetenz in der Projektleitung sowie in der Zusammenarbeit mit unterschiedlichsten Stakeholdern mit.

Ursachenanalyse zu Projektbeginn

Ein Anbieter aus der Telekommunikationsbranche fragte bei catworkx die Unterstützung für eine Root-Cause-Analyse (RCA) an, mit der Zielsetzung die interne Systemperformance zu verbessern. catworkx nahm die Herausforderung an und startete zu Projektbeginn mit der Analyse des Problems.

Im ersten Schritt geht es um die Eingrenzung möglicher Fehlerquellen (technische Analyse). In der Folge werden Probleme oder Fehlerquellen systematisch eruiert und Maßnahmen ergriffen, die zur dauerhaften Beseitigung des Problems führen.

Als außenstehender Dienstleister wirft catworkx einen Blick aus der Vogelperspektive auf die Problemstellung und übernimmt die Koordination zwischen Atlassian, den internen Fachbereichen, der IT, den ausgegliederten Infrastruktur-Teams für die Datenbank, die Netzwerke, den Server-Betrieb, den App-Herstellern, externen Beratern, Dienstleistern und/oder Betreibern.

Daten als Grundlage für die faktenbasierte Ergründung von Problemen

Neben der Analyse, welche Kennzahlen für das Unternehmen wichtig sind und welche nicht und der Definition einer klaren Begrifflichkeit – z. B. „was bedeutet besser, was schneller“ – bilden die unternehmensinternen Daten die nötige Grundlage für die faktenbasierte Ergründung von Problemen. Einmal festgelegt, nach welcher Kennzahl bzw. von welchem Wert ausgegangen werden soll (Bezugsgröße), können später Veränderungen und Abweichungen – im positiven wie negativen Sinne – nachgewiesen werden: Alle weiteren Messungen stehen von nun an in Relation zu diesem Wert. Aber nicht immer liegen alle relevanten Daten vor, die zur
Lösung eines Vorfalls (Incidents) benötigt werden. Manchmal müssen Daten erst mittel- oder langfristig gesammelt werden, um davon später Ableitungen treffen zu können oder um zu sehen, wie es z. B. der jeweiligen Applikation, den einzelnen Komponenten geht: gut oder eben nicht. Hier wertet catworkx mittels Monitoring – idealerweise beim Kunden – relevante Daten aus.

Das Ziel, welches catworkx dabei zusammen mit dem Kunden verfolgt: Das Ergebnis ist immer eine fundierte Aufarbeitung und Darstellung der IST-Situation sowie der Potenziale. Dies ist nicht zu pauschalisieren: So gibt es bei dem einen Kunden mehr und bei dem anderen Kunden weniger Potenzial zur Optimierung.

Fakten durch den Aufbau von Messumgebungen

Ist es nicht möglich auf eine ausgebaute Monitoringumgebung beim jeweiligen Kunden zurückzugreifen, kann der sogenannte „Vitalitätszustand“ von Applikationen – und allen zugehörigen Komponenten – durch den Aufbau von Messumgebungen durchgeführt werden. Das bedeutet einen Mehraufwand – doch der kann sich lohnen: Durch die daraus gewonnenen Daten lassen sich – schwarz auf weiß – z. B. bestimmte Verhaltensweisen aufzeigen und Korrelationen herleiten: etwa zwischen Tag und Nacht, speziellen Wochentagen oder Arbeitszeiten. Auch können Engpässe und Reaktionszeiten der Applikationen aufgezeigt werden. All das sind wichtige Informationen, die es dem Unternehmen ermöglichen, zielgerichtet tätig zu werden und an der nachhaltigen Behebung und damit Steigerung seiner Performance sowie seiner Wertschöpfung, zu arbeiten.

Die Alternative: Lastsimulationen richtig aufsetzen und optimal auswerten

Eine weitere Möglichkeit besteht darin, Lastsimulationen durchzuführen: In diesem Fall wird die Umgebung des Unternehmens so detailgetreu nachgebaut, wie eben möglich. Lastsimulationen können bestimmte Incident-Kategorien reproduzieren und so zur Lösungsfindung beitragen. Das Ergebnis sollte immer – egal auf welche Weise – eine fundierte Aufarbeitung der IST-Situation und der Potenziale sein.

Gute Performance = mehr Gewinn für ein Unternehmen

Im Falle des Kunden aus der Telekommunikationsbranche wurden alle zum Betrieb notwendigen Komponenten und Infrastrukturabschnitte bewertet. Danach wurden konkrete Handlungsempfehlungen ausgearbeitet, eine grobe Einschätzung der Machbarkeit und der Aufwände aufgezeigt, die dann in der Folge und innerhalb der zyklischen Meetings beim Kunden vorgestellt und diskutiert wurden. Die Umsetzung der Maßnahmen erfolgte während des laufenden Projekts als auch in einem Folgeprojekt mit zuvor spezifizierten Bestandteilen.

Fazit:

Fakt ist, dass sich Unternehmen Fehler und Ausfälle in Prozessen und Systemen auf Dauer nicht leisten können, denn schlechte Performance ist kostenintensiv. Root-Cause-Analysen sind ein wirksames Mittel, wenn es darum geht, Probleme zu identifizieren. In der Retrospektive erlauben sie Rückschlüsse und liefern wichtiges Zahlenmaterial. Eine gute Performance hingegen bedeutet mehr Effizienz, mehr Produktivität und letztendlich mehr Gewinn für das Unternehmen – das hat auch der Kunde aus der Telekommunikationsbranche erkannt.

Kontaktieren Sie uns!

Wir beraten Sie zum gesamten Atlassian Ecosystem und unterstützen Sie gerne hinsichtlich der Optimierung von Lizenzmodellen und -kosten.
 
Leistung

Performance-Audit

Gute Performance ist der essenzielle Bestandteil deines Erfolges. Mit unserem Performance-Audit erfährst du, wo ihre Grenzen liegen und wie du den nächsten Schritt machen kannst.

Schulung

Webseiten Performance

Schulung

Webseiten Performance

Referenz

Warum Performance ausschlaggebend ist

Um die Leistungsfähigkeit einer Atlassian Toolchain messbar machen zu können, müssen individuelle Untersuchungen durchgeführt werden. catworkx setzt beim Controlling von Performance-Werten auf die Paarung von Open-Source-Software und eigenen, internen Werkzeugen, z.B. catworkx SPIN (Stress-App).

Network Performance Management
Kompetenz

Network Performance Management

Mit Network Performance Management überwachen Sie die Leistung komplexer IT-Landschaften. So erkennen Sie frühzeitig Kapazitätsengpässe, unerwartete Abweichungen vom Normalbetrieb sowie Störungen und können diese umgehend beheben.

Blog 05.08.23

NextJS - der Gamechanger für deine Web Performance

In diesem Blogbeitrag erfährst du, wie du mit NextJS das Maximum aus deiner Web Plattform herausholen kannst. Entdecke, warum diese Technologie die Web-Performance revolutioniert und was du tun kannst, um die Nutzererfahrung zu verbessern, deine Absprungraten zu reduzieren und deine Konversionsrate zu erhöhen.

Headerbild zu IBM Netezza Performance Server
Technologie

IBM Netezza Performance Server

Die IBM bietet Datenbanktechnologie für spezifische Zwecke auch in Form von Appliance Lösungen an. Im Data Warehouse Umfeld bekannt ist vor allem die Netezza Technologie, später unter dem Namen „IBM PureData for Analytics“ vermarktet.

Bannerbild zu Application Performance Monitoring Service
Kompetenz

Application Performance Monitoring Service

Application Performance Monitoring automatisiert die IT-Überwachung Ihrer Anwendungen, erkennt drohende Ausfälle bereits im Vorfeld und reduziert manuelle Tätigkeiten auf ein Minimum.

Blog 07.07.23

Amazon EC2: Performance richtig messen und optimieren!

Im Blog zeigen wir Ansätze zum Messen und Verwalten der Leistung von EC2-Instanzen. Zudem erfahren Sie, wie Sie mit IBM Turbonomic die Performance der darauf betriebenen Anwendungen optimieren.

Blog 20.07.23

Elastic Block Storage: Performance und Kosten optimieren

Wir geben Ihnen einen Überblick zu EBS. Und: zeigen Ihnen, wie IBM Turbonomic Sie bei Performance und Kosten unterstützt.

Blog 29.01.25

Globale Performance, lokale Stärke: OVHcloud macht’s möglich

OVHcloud unterstützt den deutschen Mittelstand mit globalem Mesh-Netzwerk und Visualisierungen, um Datenverfügbarkeit, Disaster Recovery und internationale Expansion zu sichern.

News

IBM übergibt “Trusted AI” Projekte an Linux Foundation AI

Wir begrüßen es sehr, dass die Linux Foundation drei besonders leistungsfähige SW-Komponenten der IBM (z.T. bereits Open Source) in ihren Linux Foundation AI Canon aufgenommen hat.

News

ARS Event: KI meets Finance & Insurance

Am 20.11.2019 versammeln sich CxOs, Innovation Manager und Risk Manager zum ARS Event: KI meets Finance & Insurance 2019 in Nürnberg, um über die Zukunft der Finanzbranche zu diskutieren.

Logo von IPG - Experts in IAM
Unternehmen 26.01.21

IPG Information Process Group Holding AG

Die IPG-Gruppe ist auf die Konzeption, Integration, den Betrieb und die Ausbildung von IAM-Lösungen spezialisiert.

Standort

Winterthur

Finden Sie u.a. catworkx AG und IPG Information Process Group AG in Winterthur: Theaterstrasse 17, 8400 Winterthur

Standort

Dresden

Finden Sie u.a. IPG Information Process Group GmbH Deutschland in Dresden: Gertrud-Caspari-Str. 13; 01109 Dresden; +49 7531 957 3020; info@ipg-group.com

Standort

Berlin

Finden Sie u.a. IPG Information Process Group AG GmbH Deutschland und CLOUDPILOTS Software & Consulting GmbH in Berlin

News 06.08.21

Intelligent Document Processing ab sofort noch effizienter!

Wir verbessern unsere Leistung aus diesen Gründen im Gebiet Intelligent Document Processing stetig und haben nun mit den Experten der PLANET artificial intelligence GmbH aus Rostock einen starken Partner an unserer Seite.

Bleiben Sie mit dem TIMETOACT GROUP Newsletter auf dem Laufenden!