Joubin Rahimi:
Grandios, dass Du wieder dabei bist bei einer neuen Folge von insights!. Mein Name ist Joubin Rahimi und heute geht es um das Thema Managed Services im E-Commerce. Im Studio ist heute Marc Achsnich. Hallo, Marc. Marc haben wir heute eingeladen, weil Marc Spezialist seit mehreren Jahren zu dem Thema bei uns im Hause ist. Und Marc hat eine Vita, die ist total spannend, denn Marc kommt nicht aus einem Betriebsumfeld oder klassischen Hostingumfeld, sondern hat im Endeffekt die Softwareentwicklung von der Pike auf gelernt, aber auch das Thema „Wie generiere ich Services auf einer kaufmännischen Ebene“. Und das kombiniert natürlich mit dem Wissen, was wir hier haben zu einem Angebot, was wir Managed Commerce nennen. Und das wollen wir Euch heute nicht vorstellen, sondern vielmehr das Thema „Wie mache ich guten Managed Services?“ Was ist da wichtig? Und daher ist die erste Frage an Dich, Marc, was machst Du den ganzen Tag, damit das ein guter Service ist?
Marc Achsnich:
Tatsächlich sind das unterschiedliche Sachen. Einerseits schauen wir, dass die einzelnen Shop-Systeme stabil laufen. Dazu gehört, dass die Warenkörbe funktionieren, dass die Umsysteme angebunden sind. Auf der anderen Seite versuchen wir ständig, unseren E-Commerce Managed Services weiterzuentwickeln. Das heißt, wir sehen das auch mehr oder weniger als Produkt und überlegen, was sind jetzt einzelne Funktionalitäten, die vielleicht noch fehlen? Was sind Services, die noch angeboten werden können, und wie können wir am Ende die Shop-Systeme schneller und stabiler und sicherer machen?
Joubin Rahimi:
Im Endeffekt sind es ja ein paar Themen, wenn ich an so einen Managed Services oder Betrieb von einem E-Commerce denke, die Du gerade angesprochen hast. Wie kann ich so etwas sicher machen? Stabil, schnell, überwachen, gucken, dass die Bestellungen durchgehen? Dann hast Du ja im Endeffekt die Partner noch angesprochen. Direkt mal fünf, sechs Themen dazu, die Ihr ja in Eurem Team bearbeitet, Ihr habt ja ähnliche Thematiken dazu und macht das ja mit durch. Was sind so die zwei, drei Sachen aus der Vergangenheit, wo Du sagst im Managed Services, die waren total wichtig, dass man die auch wirklich im Griff hat? Wo man sagt, das ist ein Game Changer für Kunden, wenn sie das können?
Marc Achsnich:
Letztendlich ist einer der Punkte das Abfangen von Spitzen. Es gibt immer im Shop ein Grundrauschen und da muss der Shop stabil laufen. Aber die Kunden fahren natürlich auch viele Kampagnen und dann gibt es unerwartete Besucherzuwächse und darauf muss ein System skalieren und agieren können. Es ist natürlich besonders schlecht, wenn Besucher wahrnehmen, eine Kampagne wird gefahren, aber der Shop ist nicht da. Und das ist natürlich fatal, weil an sich sind es halt große Marketingkosten, die ausgegeben werden, und wenn da die Basis nicht vorhanden ist, dann ist das letztendlich nicht gut für den Kunden.
Joubin Rahimi:
Dann gibst du einfach Cola aus für nichts. Aber wie macht Ihr das, diese Spitzen abzufangen?
Marc Achsnich:
Wir beispielsweise haben unser System auf Kubernetes aufgesetzt und haben Load Balancer da und haben das System, wenn wir jetzt Shopware als Beispiel nehmen, auf unterschiedliche Beine gesetzt, sodass wir dann das Frontend beliebig skalieren können, sodass wir abfangen können und prüfen, wie viele Benutzer jetzt auf der Seite sind, wie die Last auf dem System ist und dann frühzeitig das System beliebig groß skalieren.
Joubin Rahimi:
Also macht Ihr das dann oder das System selber?
Marc Achsnich:
Das macht das System selber. Also das prüft es, es gibt eigene Statuswerte, die das System selber für die einzelnen Frontend-Applikationen prüft, und wenn es feststellt, dass gewisse Abfragen zu lange dauern, dann werden einfach neue Frontend-Applikationen beigestellt, und das innerhalb von ein bis drei Minuten.
Joubin Rahimi:
Das führt mich direkt eigentlich schon zum nächsten Punkt, wo Du sagst, du hast die Skalierung, die ist wichtig. Aber du musst ja feststellen, wann muss ich skalieren? Also müsst Ihr es ja überwachen. Und insofern überwacht Ihr einmal die Parameter der Geschwindigkeit, wie schnell ist die Reaktionszeit? Aber was überwacht Ihr denn noch? Was ist wichtig in dem Kontext?
Marc Achsnich:
Tatsächlich haben wir etwas, das wir 360-Grad-Überwachung nennen, das heißt, wir versuchen, das System wirklich auf Herz und Nieren zu prüfen. Wir fangen an bei den grundlegenden hardwarenahen Informationen, sei es, wie viel CPU ist vorhanden, wie ist die Memory-Auslastung, wie viel Festplattenplatz habe ich überhaupt noch? Auf der anderen Seite geht es dann aber auch so weit, dass wir überprüfen, wie viel Umsätze macht der Shop gerade? Wie viel Bestellungen sind in den letzten 15 Minuten reingekommen? Gibt es da Anomalien zu der Vorwoche beispielsweise?
Joubin Rahimi:
Warum ist das wichtig?
Marc Achsnich:
Es kann sein, dass beispielsweise Samstagnachmittag normalerweise viel Umsatz da ist im Vergleich zu einem Freitagmorgen. Das heißt, wenn jetzt am Freitagmorgen über 15 Minuten keine Bestellung reinkommt, dann ist das erst mal ein Normalzustand. Wenn jetzt aber am Samstagabend, wo normalerweise die Peak-Zeit ist, über eine gewisse Zeit keine Umsätze da sind und man in der Vorwoche – das ist ein Vergleich, den man nehmen könnte – typischerweise einen gewissen Umsatz hatte, ist das ein Indiz dafür, dass es ein Problem gibt. Und das Problem kann dann an der Schnittstelle zum ERP liegen, es kann daran liegen, dass wirklich in dem Shop ein Fehler eingespielt wurde, sei es durch eine Verbindung der Umsysteme oder weil durch die Entwicklung ein Fehler eingespielt wurde. Und das sind dann Punkte, wo wir frühzeitig agieren können und auch prüfen können, ob es irgendwelche Probleme am System gibt. Denn wenn kein Umsatz gemacht wird, da ist das halt schlecht für den Kunden und am Ende dann auch für uns.
Joubin Rahimi:
Eigentlich habt Ihr mehrere Ebenen der Wartung, des Monitorings. Ich beschreibe das mal mit meinen eigenen Worten und Du kannst dann sagen, falsch, da fehlt etwas. Das Erste ist systemnah, das ist der No Brainer. Das Zweite ist Monitoring von Umsystemen, hast Du ja gesagt. Sind sie da oder nicht da? Und das Dritte, ich würde mal sagen ein Symptom-Monitoring: Wenn keine Bestellung durchgeführt werden kann, warum auch immer, und keines der anderen Systeme anschlägt, dann ist trotzdem ein Problem da, auch wenn man es nicht gemonitort hat. Also zu schauen, passt das aus einer geschäftlichen Perspektive? Und wenn nicht, dass dann ein Mensch darauf guckt? Ist das richtig beschrieben?
Marc Achsnich:
Genau. Wir nennen das konkret funktionelles Monitoring, das heißt, wir prüfen aus Benutzersicht, ist der Shop auch funktionell vorhanden? Funktionieren die Waren, funktioniert der Check-out, funktioniert das Login, das Logout, die Produktsuche? Sind die Artikel überhaupt vorhanden? Es kann letztendlich sein, dass da Probleme sind und der Shop trotzdem existiert. Das heißt, es kommen einfach keine Umsätze rein, obgleich der Shop letztendlich vorhanden ist.
Joubin Rahimi:
Oder wenn einfach keine Verfügbarkeiten mitgegeben werden, kannst du nichts kaufen, bei einigen Shops, nicht bei allen. Okay. Die Anbindung der Backend-Systeme hast Du jetzt ein paarmal angesprochen. Der Shop steht ja nicht für sich alleine. Wie geht Ihr damit um?
Marc Achsnich:
Das ist abhängig davon, wie viel Informationen oder wie nah die Systeme sind. Es reicht teilweise ein grundlegender Check, ob der VPN-Tunnel zwischen uns und dem Umsystem vorhanden ist. Teilweise ist es aber auch möglich, dass man direkt Abfragen im Umsystem wie beim ERP stellen kann. Ist unsere Bestellung, die bei uns da ist, ist die auch im Umsystem letztendlich vorhanden? Das Einfachste, das man prüfen kann, ist prinzipiell das System durch den Tunnel per Ping erreichbar?
Joubin Rahimi:
Okay, das ist dann halt die Basis und die anderen Sachen sind dann wieder die funktionalen Tests und Überwachungen da darauf. Wenn ich irgendwie überwache, kommt ein Alert raus beziehungsweise sollte rauskommen. Wie handhabt Ihr das? Bekommst Du alle naselang Alerts? Oder gar keine, weil alles rund läuft?
Marc Achsnich:
Genau. Die Antwort ist: hoffentlich nicht. Da gibt es auch zwei bis drei unterschiedliche Sichtpunkte. Wir haben proaktives Monitoring, das heißt, wir haben bei uns große Monitore in den einzelnen Offices, wo wir dann die einzelnen Kunden der Spots haben, wo man versuchen kann, direkt Anomalien auch so festzustellen, ohne dass das System es festgestellt hat. Das System kann Anomalien feststellen, und wenn es die feststellt, dann gibt es bei uns drei Wege, wie wir erreicht werden. Das heißt, einerseits haben wir einen Channel, wo wir produktive Störungen und Warnungen erfassen. Wir können per E-Mail informiert werden. Und der letzte Punkt ist, dass das System uns direkt anruft. Das heißt, abhängig vom Kunden und dem SLA ist es auch möglich, dass wir einfach nachts einen Anruf bekommen von dem System selber. Dass das sagt, hier funktioniert der Check-out-Mechanismus nicht, der Shop ist down. Und dann agieren wir und beheben das Problem.
Joubin Rahimi:
Und dieses proaktive Monitoring ist dann, wenn Menschen einfach mal draufgucken.
Marc Achsnich:
Genau. Proaktiv meint, wir versuchen das System zu beheben, bevor das Problem wirklich relevant wird. Das heißt, wir analysieren den Verlauf. Wir sehen vielleicht schon, dass es zu Spitzen kommen kann. Wir sehen, dass die Festplatte dabei ist vollzulaufen. Und wir versuchen dann so zu alarmieren, dass das Problem behoben wird, bevor es kritisch wird.
Joubin Rahimi:
Du hast gesagt, dann kommt auch nachts ein Anruf. Es gibt beispielsweise Follow the Sun, dass verschiedene Teams über die Welt verteilt das annehmen. Ich weiß, das habt Ihr auch mal ausprobiert, Kernteam oder First Level Support draufzusetzen. Wie macht Ihr das? Wie hast Du es aufgesetzt und warum hast Du es so aufgesetzt?
Marc Achsnich:
Wir haben tatsächlich die Erfahrung gemacht, dass das Follow the Sun für unser System nicht funktioniert. An sich haben wir das schon sehr automatisiert und die ganz einfachen Fehler können von dem System selber behoben werden. Das heißt, wenn es notwendig ist, dass man manuell eingreift, dann geht es nicht darum, dass man ein Playbook abarbeitet, sondern man muss halt wissen, wie das System funktioniert. Und daher haben wir einen Mechanismus entwickelt aus einem Kernteam, das während der Kernarbeitszeiten mit unserem Service-Kernteam betreut. Und während den Rufbereitschaftzeiten haben wir ein Team aus unseren Senior Staff Spezialisten, die einerseits die Anwendungsseite kennen, andererseits auch die administrative Seite verstehen. Und die arbeiten im Wochendienst jeweils mit zwei Personen, die sich dann über eine aktive und passive Zeit die Rufbereitschaftzeiten teilen. Und so schaffen wir es dann auch, bis zu 20 Minuten Reaktionszeiten zu erreichen.
Joubin Rahimi:
Was total schnell ist im Vergleich zu anderen Situationen, die man kennt. Auf einen Punkt wollte ich noch hinaus, das fand ich spannend, weil Du gesagt hast, die besten Depth-of-Spezialisten, also Personen, die auch die Anwendung kennen. Wie wichtig ist das mit den Anwendungen?
Marc Achsnich:
Das Problem ist letztendlich, wenn das System erstmal nicht mehr funktioniert, dann muss man kühlen Kopf bewahren, um zu verstehen, was jetzt genau das Problem ist. Beispielsweise die Datenbank nimmt keine Anfrage mehr an. Warum ist das so? Man könnte jetzt die Datenbank neu starten. Danach nimmt sie wieder keine Anfragen an. Dann könnte man sie wieder neu starten und dann hat man das Problem gleichermaßen nochmal. Und das heißt, man muss genau wissen, wo man jetzt prüfen kann, welche Anfragen gerade an die Datenbank gehen. Was ist jetzt für einen Shop beispielsweise notwendig oder typisch? HCL reagiert komplett anders. Und daher muss man halt schon diese einzelnen Systeme verstehen und wissen, wie sie genau funktionieren, wo jetzt die einzelnen Importe aufgeführt werden und wo man jetzt sehen kann, was für einzelne Prozesse gerade laufen. Damit man die dann letztendlich in dem Sinne beheben kann.
Joubin Rahimi:
Danke. So ein Vorfall kann ja auch von außen kommen, ich will jetzt auf die Datensicherheit hinaus. Jemand macht eine DDoS-Attacke oder versucht zu hacken. Es gab auch schon mal Schreiben, wir hacken das System und gebt uns mal bitte ein paar Bitcoins, dann tun wir es nicht. Wir haben das ja nie getan. Aber wie geht Ihr damit um, mit dem Thema Sicherheit und Cyber-Attack-Schutz?
Marc Achsnich:
Das ist ein Thema, das aus mehreren Komponenten besteht. Man kann beispielsweise komplett an den Anfang, bevor es unsere Website überhaupt erreicht, eine Web Application Firewall setzen. Diese würde dann alle Anfragen, die reinkommen, filtern und per se DDoS-Attacken beispielsweise herausfiltern, Hackerangriffe, SQL-Injection. Es gibt da ein Institut für Firmen, die sich um die OWASP kümmern. Letztendlich sind das die Top 10 Angriffsszenarien, die werden klassifiziert und priorisiert, und das spiegelt letztendlich unterschiedliche Angriffsmuster wider. Und die gilt es auf unterschiedlichste Weise zu eliminieren. Ein Punkt ist eine WAP, die man vor die Anwendung setzen kann. Wir arbeiten auch mit Sicherheitskomponenten, sodass wir auch unseren Code wiederum prüfen, das heißt, vor jedem Check-in prüfen wir, ob wir irgendwo gerade Sicherheitslücken öffnen, bevor letztendlich die WAP feststellen würde, dass sie irgendwo schützen muss. Es reicht nicht, eine Komponente zu installieren und zu glauben, damit ist man komplett geschützt, sondern es geht um die Kombination von vielen. Beispielsweise hatten wir das auch bei der Auswahl unseres grundlegenden Hosters immer berücksichtigt. Das heißt, wir haben jetzt unsere Shopware-Cloud Richtung OVHcloud migriert, weil dort gibt es das Angebot, das einerseits datensouverän ist, auf der anderen Seite ist das einer der wenigen, die eine eigene Abteilung für Data Protection anbietet. Das heißt, wenn es irgendwo Hacker gibt, die auf irgendeinem Shopsystem gerade Angriffe fahren, die innerhalb der OVHcloud gehostet sind, dann würde die Abteilung das feststellen und die für unser Netz direkt blocken.
Joubin Rahimi:
Super. Du hast jetzt aus mehreren Komponenten drei rausgenommen. Daraus machen wir nochmal eine zusätzliche Session, würde ich vorschlagen. Wenn Ihr Fragen, Anmerkungen, Kommentare habt, dann bitte einfach unten mit reinposten oder eine Direct Message an uns. Wir freuen uns, Euch hier entsprechend die Antworten geben zu können. Danke Dir, Marc!
Marc Achsnich:
Ich danke Dir.
Joubin Rahimi:
Und dann bis bald.