"Ein Fehler sollte nicht gleich zu einer Katastrophe führen"

Kamingespräch mit Martin Szelgrad (Report Verlag), Klaus Reile (NetApp, Zero Outage), Michael Mayr (Hitachi, Zero Outage), Renate Motschnig und David Haselberger (Uni Wien) zu den Anliegen der Initiative und Maßnahmen für die Vermeidung von Ausfällen von Technik. Fotos: Milena Krobath/Report Verlag Kamingespräch mit Martin Szelgrad (Report Verlag), Klaus Reile (NetApp, Zero Outage), Michael Mayr (Hitachi, Zero Outage), Renate Motschnig und David Haselberger (Uni Wien) zu den Anliegen der Initiative und Maßnahmen für die Vermeidung von Ausfällen von Technik. Fotos: Milena Krobath/Report Verlag

Das Ende des Silodenkens ausrufend richtet sich die Initiative »Zero Outage« (Link) an all jene, die ihre Produkte und Prozesse in Richtung Ausfallssicherheit und Resilienz gestalten wollen. Denn: Wer will das heute nicht?

Sie haben das Ziel, Ausfälle von technischen Infrastrukturen zu vermeiden: Der »Zero Outage Industry Standard« vereint Unternehmen aus dem IT-Markt – Dienstleister, Rechenzentrumsbetreiber und auch Hard- und Software-Hersteller. Report(+)PLUS hat die beiden Leiter der Taskforce »People« der Initiative gemeinsam mit ForscherInnen der Universität Wien zu einem Kamingespräch getroffen. Im Blickpunkt eines gemeinsamen Projekts aktuell steht die Fehlerursache Nummer eins von Ausfällen: der Mensch.

Report: Eine technische Infrastruktur von Unternehmen bietet meist ein buntes Ökosystem von Komponenten verschiedener Anbieter. Sie sind angetreten, dieser Schnittstellen und Reibungspunkten Herr zu werden – indem mit einem neuen Industriestandard Fehler vermieden werden respektive im Ernstfall richtig reagiert werden kann. Wie soll das gelingen?

Michael Mayr, Zero Outage: Für das Vermeiden von Ausfällen von technischen Systemen sehen wir vier zentrale Faktoren: die Technik selbst, Prozesse, Security aber auch den Menschen. Security allein beinhaltet viele Elemente – von klassischen Abwehrmaßnahmen bis hin zu Zugangssicherheit in einem Gebäude oder Verhaltensregeln beim Umgang mit Passwörtern. Unserer Meinung nach ist der Bereich »People«, auf den wir speziell fokussieren, aber am wichtigsten. Über 80 % der Ausfälle werden durch Menschen verursacht. Gleichzeitig haben die Anwender von Technik bisher am wenigsten Beachtung gefunden.



Bild oben: Michael Mayr ist als Global Client Director T-Systems bei dem Technologiekonzern Hitachi Vantara für die Lieferung und Servicequalität der zugesagten Dienstleistungen verantwortlich. Er leitet mit Klaus Reile den Bereich »People« der Zero-Outage-Organisation.

In einer Zusammenarbeit mit der Universität Wien wollen wir dazu neue Erfolgsmodelle entwickeln. Wir alle kommen aus großen Unternehmen und haben unsere Erfahrungen im Bereich People Management, stoßen aber auch mit unserem Wissen an Grenzen. Mit der Universität Wien soll dies in dem Projekt »Soft-Skills for IT-People« nun akademisch aufbereitet werden.

Klaus Reile, Zero Outage: Unternehmen brauchen Mitarbeiterinnen und Mitarbeiter, die nicht nur auf technischem Level gut ausgebildet sind, sondern auch mit ihren Soft Skills und Kompetenzen – in ihrem ganzen Denken – über Problemstellungen die reine Technik hinaus meistern können. Unternehmen können diese Fähigkeiten aktiv unterstützen, indem man etwa ab dem Zeitpunkt einer Anstellung eines Mitarbeiters diesen in die richtige Richtung weiterentwickelt. Es braucht regelmäßige Schulungen und Checks für das Überprüfen des aktuellen Wissensstands.

Auch in Zeiten der Automatisierung hat der Mensch die Zügel in der Hand. Hier braucht es Anleitung, wie sich der Einzelne in diesen Systemen verhalten sollte – zum Wohle aller Beteiligten von beispielsweise IT-Services.



Bild oben: Klaus Reile verantwortet ein internationales Support-Team beim Speicher- und IT-Infrastrukturhersteller NetApp in München und leitet gemeinsam mit Michael Mayr den Bereich »People« bei Zero Outage.

Report: Was geschieht nun in der Zusammenarbeit auf universitärer Seite?

Renate Motschnig, Uni Wien: Bislang hatte man sich in der Informatik – sowie generell beim Thema Digitalisierung – eher mit technischen Spezifikationen auseinandergesetzt. Der Faktor Mensch wurde zwar anerkannt, aber bei Entwicklungen nicht zentral miteinbezogen. Ich arbeite schon längere Zeit daran, diese Notwendigkeit meinen Studierenden zu vermitteln.



Bild oben: Univ. Prof. Renate Motschnig ist in der Fakultät für Informatik der Universität Wien und im Zentrum für LehrerInnenbildung tätig und kooperiert mit dem Verein Zero Outage in dem Projekt »Soft-Skills for IT-People«.

In der Zusammenarbeit werden wir zunächst die Auswirkungen und Effekte aus unseren Kursen zu Soft Skills erforschen, indem wir die Reaktionen der Studierenden systematisch analysieren. In einem zweiten Schritt wollen wir herausfinden, welche Erfahrungen daraus für die Wirtschaft relevant sind. Zu diesen Erwartungen braucht es dann den Austausch mit den Unternehmen, aus dem auch Inhaltliches in die Lehrveranstaltungen zurückfließen kann. Denn der menschliche Faktor erfordert Zeit. Kompetenzen brauchen Raum, um sich entwickeln und reifen zu können. Mit einem Workshop allein ließe sich das nicht abbilden.

David Haselberger, Uni Wien: Wir werden speziell auch untersuchen, welche Kompetenzen für eine Zero-Outage-Kultur in der Wirtschaft wichtig sind. Basierend auf den Ergebnissen sollen Maßnahmen und Lerninhalte konzipiert werden, um die zwischenmenschlichen Kompetenzen von Studierenden und Mitarbeitern im IKT-Bereich zu verbessern. Das sind einige Fragestellungen. Wie kann der Mensch besser in die Digitalisierung integriert werden? Wie sollten IT-Projekte aussehen, damit sich Menschen darin wohlfühlen und gut arbeiten können? Letztlich sind das auch Hebel für verlässliche technische Systeme. Diese werden ja von Menschen gemacht und bedient.



Bild oben: David Haselberger, Fakultät für Informatik der Universität Wien, ist wissenschaftlicher Mitarbeiter des Projekts »Soft-Skills for IT-People«.

Report: Vor welchen Herausforderungen stehen dabei die Unternehmen?

Mayr:
Der menschliche Faktor ist in technischen Systemen bislang eher in Einzelbereichen betrachtet worden, die nie zusammengeführt wurden. Für das Thema Zero Outage müssen wir im Personalbereich der Unternehmen einen Regelkreislauf einführen, wie wir ihn aus anderen Wertschöpfungsketten bereits kennen: Welche Mitarbeiter benötige ich für eine bestimmte Aufgabe? Welche Mitarbeiter stehen überhaupt zu Verfügung? Wie kann ich diese bestmöglich unterstützen – sowohl in der Weiterbildung als auch mit neuen Aufgaben oder Positionen? Zugleich muss Erreichtes auch stets hinterfragt werden. Nur so haben wir tatsächlich dann die richtigen Menschen an den richtigen Stellen. Gerade dessen sind sich viele Firmen nicht bewusst. Ich bringe ein simples Beispiel: Man weiß vielleicht, dass eine zentrale Position in der Technik von einem Unix-Administrator besetzt werden sollte. Es fehlt aber das Wissen, welcher Mitarbeiter besonders zuverlässig und etwa auch gegenüber Kündigungsgedanken resilient ist. Das wäre aber enorm wichtig, denn an dieser Position wird am offenen Herzen des Unternehmens operiert. Ein Einzelner könnte die gesamte Organisation zum Stillstand bringen.

Report: Nun streben Sie mit Zero Outage ein Servicewelt ohne Fehler an. Wie sollte dazu eine Fehlerkultur aussehen?

Mayr:
Wir werden auch in Zukunft nicht verhindern können, dass Fehler passieren. Wie man aber darauf reagiert, das macht den Unterschied aus. Wir sagen: Menschen, Technik, Security und die Prozesse müssen resilient werden. Ein Fehler soll nicht zu einer Katastrophe führen. In der Praxis bedeutet das: Wenn mein Kollege einen Fehler gemacht hat, schwärze ich ihn nicht an, sondern sorge dafür, dass das System nicht zusammenbricht. Und wenn ich an einer Stelle nicht mehr weiterkomme, ist in einer Zero-Outage-Organisation dazu ein Prozess definiert – beispielsweise, um an weitere Informationen zu gelangen. Wir sagen nicht, dass sich der Mensch an Zero Outage anzupassen hat. Damit das Prinzip funktioniert, muss sich Zero Outage an den Menschen anpassen – an das, was überhaupt in einer Unternehmensorganisation verfügbar ist.

Reile: Für das Thema Resilienz gibt es unterschiedliche Ansätze. Zum einen kann man sich technologisch mit redundanten IT-Systemen wappnen. Zum anderen braucht man eben auch Menschen, die verhindern, dass ein Fehler zwangsweise zu einem Datenverlust oder Systemausfall führt.

Report: Sehen Sie auch im Bildungsbereich einen Umbruch von Hierarchien und Systemen, um die Studierenden bestmöglich auf die Anforderungen in unserer Wirtschaft und Gesellschaft vorzubereiten?

Motschnig: In unserem Kurs »Communication and Soft Skills« versuchen wir die Hierarchien möglichst abzubauen und auch als Lehrende gleichzeitig Mitlernende zu sein. Studierende sind anfangs oft noch nicht geübt, sie machen bei Präsentationen Fehler. Wir fördern trotzdem bewusst das Ausprobieren und demokratische Prozesse in der Einteilung von Aufgaben in Gruppen und auch Führungsthemen. Dazu gehören stets auch Selbstreflexion und das Feedback durch andere. Durch dieses Wechseln von Rollen und von Verantwortungen im Arbeiten und in der Kommunikation wächst automatisch eine Kultur der Transparenz und Toleranz. Ziel ist, sich weiterzuentwickeln – es beim nächsten Mal besser zu machen – und sich letztlich das Gelernte auf diese Weise gut zu merken. Natürlich braucht das auch die richtige Einstellung des Lehrpersonals. Würde ich nur hierarchisch mit Noten und Stricherln agieren, wäre dieses Entfalten und die Bereitschaft, offen mit Fehler umzugehen, nicht möglich.

Report: Was wurde aus Ihrer Sicht in der Technik im Zugang zum Menschen bisher verabsäumt?

Motschnig:
Bis heute wird wird die Schnittstelle Mensch-Computer stark vernachlässigt. Man fokussiert oft lieber auf Funktionalitäten und auf eine Schnelligkeit am Markt und vergisst dabei auf gut bedienbare Oberflächen. Leider finden sich viele in der Technik nur mühsam zurecht. Das führt zu einer Verschwendung von Ressourcen. Wie es dagegen gut funktionieren kann, zeigt  ein Human-centered Design. Es bezieht AnwenderInnen bereits in einer frühen Phase der Planung und der Entwicklung ein.

Mayr: Je einfacher ein System in der Bedienung ist, desto günstiger und leistbarer ist es auch für Unternehmen. Also brauchen wir in allen Bereichen der Technik intuitive, leicht bedienbare Lösungen. Schaffe ich es als Hersteller von Software oder Hardware, dass den Menschen meine Produkte angenehm sind, werden sie diese später auch in ihrem Unternehmen haben wollen. Das betrifft sicherlich auch neue Themen wie künstliche Intelligenz. Auch Lösungen dazu müssen verständlich und nachvollziehbar sein, damit sie akzeptiert und genutzt werden.

Reile: Insgesamt wollen wir über alle Bereiche hinweg die Menschen zu einer neuen Denkweise einer Zero-Outage-Mentalität bewegen. Systeme, die über mehrere Tage nicht funktionieren, kann sich keiner mehr leisten. Informationstechnologie ist lebenswichtig geworden. Bei einem Komplettausfall eines Krankenhauses benötigt der Betreiber umfangreiche Notfallpläne. Die Abhängigkeit von der Sicherheit haben wir in der gesamten Anwendungsbreite – bei Herzschrittmachern angefangen bis hin zu vernetzten Fahrzeugen und überhaupt die gesamte Welt des Internet of Things.

Mayr: Bei aller Technik – der Mensch spielt darin die größte Rolle und wird weiter wichtiger. Denn je mehr automatisiert wird, je mehr Technik eingeführt wird, desto mehr Systeme werden von Einzelnen bedient. Das Schadenspotenzial bei einem falschen Umgang und bei falschem Reagieren wird größer. Im Prinzip definiert jedes Unternehmen selbst, welchen Wert Zero Outage tatsächlich hat. Es müssen nicht immer gleich Leben davon abhängen. Für eine Bank kann auch Beweggrund für Maßnahmen sein, Millionenverluste bei Ausfällen zu vermeiden. Ein mittelständisches Unternehmen wiederum weiß: Bei einem Verlust meiner wichtigsten Daten bin ich möglichweise innerhalb eines Jahres pleite.

Report: Welche einfache Maßnahmen hinsichtlich Zero Outage können in Unternehmen ergriffen werden?

Mayr: Zunächst sollte man sich der Sache bewusst werden und überlegen, welche Ressourcen für ausfallsichere Systeme und eine resiliente Organisation nötig sind. Das Einfachste ist sicherlich, redundante technische Systeme auf Plattformebene einzurichten. Dann die eigenen Prozesse zu analysieren und zu überlegen und festzulegen, wie Mitarbeiter im Falle von auftretenden Fehlern reagieren sollten – das kann jeder machen. Weiß ich als Unternehmer auch, wie es den Mitarbeitern wirklich geht? Stehen manche gar bereits vor der inneren Kündigung und droht mir daraus Schaden?

Reile: Wir bieten auf zero-outage.com Leitfäden für Implementierungen. Wer seine Unternehmenskultur ändern möchte, sollte offen in seinem Team darüber diskutieren – und jeden Einzelnen einbeziehen. Zero Outage muss über die gesamte Wertschöpfung betrachtet werden: vom Design über die Produktion, Lieferung und Implementierung eines Produkts, über den Betrieb, in der Kundenbetreuung bis hin zur Deinstallation. Und da eine Wertschöpfungskette heute nicht nur aus einem Haus kommt, brauche ich die gleiche Denkweise auch bei meinen Partner und Lieferanten.


Hintergrund: Vier Säulen für die Sicherheit
Eine Zero-Outage-Strategie umfasst vier grundlegende Punkte, um die Prozesslandschaft in Unternehmen sicherer zu gestalten:

- einfache Prozessbeschreibungen
- Verantwortlichkeiten und Abläufe klar definieren
- regelmäßig den Ernstfall simulieren
- Störfälle konsequent dokumentieren und auswerten


Hintergrund: »Zero Outage Industry Standard«
Zahlreiche Unternehmen im IT-Sektor wie T-Systems, Brocade, Cisco, IBM, Dell, EMC, HDS, Juniper, NetApp, Suse, Sec Consult und Banco Itau haben sich in der »Zero Outage Industry Standard«-Vereinigung zusammengeschlossen, um einen Industriestandard für IT-Qualität zu definieren. Die Idee: Um Unternehmenskunden »Zero Outage« zu garantieren, muss die Qualität von IT-Plattformen, Menschen, Prozessen und Sicherheit über den gesamten Lebenszyklus hinweg standardisiert werden. Ziel ist es, partnerschaftlich zusammenzuarbeiten und einen offenen branchenweiten »Best Practice«-Ansatz zu entwickeln und eine allgemein anwendbarer, stabile und sichere IT zu gewährleisten. Der Verein setzt systematisch auf Qualität – mit dem Ziel, Ausfälle zu vermeiden und voneinander zu lernen.

Weitere Infos: zero-outage.com

Last modified onMontag, 27 Januar 2020 14:42
back to top