Perfect Plant braucht Hochverfügbarkeit

Feature | 23. Januar 2009 von Ulrich Lenz, Senior Consultant, Stratus Technologies GmbH 0

So überzeugend das Konzept der Integration von Produktions- und kaufmännischer IT ist, es weist auch einen kritischen Punkt auf. Je länger die Prozesskette wird, desto stärker wirken sich Unterbrechungen aus. In der perfekten Fabrik, können Störungen im ERP-System sogar zum Produktionsstopp führen.

Seltenere, aber höhere Schäden

Die Entwicklungen in der Hardware-Technik haben Systeme hervorgebracht, die weitaus stabiler sind als ihre Vorgänger. Dank zuverlässiger Betriebssysteme sind Server-Ausfälle eher die große Ausnahme. Fallen die Systeme doch mal aus, sind die Schäden dafür heute höher, denn fast alle Unternehmen sind von der Verfügbarkeit ihrer IT abhängig.

Die IT durch manuelle Verfahren zu ersetzen, ist kaum noch möglich. Auch kurzzeitige Server-Ausfälle führen zu einer Betriebsunterbrechung. Die Risikobeurteilung kann daher zwar von einer geringeren Schadenwahrscheinlichkeit ausgehen, muss aber zugleich mit höheren Schäden rechnen.

In der Produktion können sich selbst sehr kurze Unterbrechungen auswirken. Fertigungsmanagementsysteme (Manufacturing Execution Systems, MES) erfassen Betriebs- und Maschinendaten auch im Bereich von Millisekunden. Die „Kommunikationstiefe“ reicht mitunter bis zu den Sensoren und Zähleinrichtungen der Maschinen. Herkömmliche Produktionsleitsysteme können damit umgehen. Server, die auf Basis der PC-Technologie für die Verarbeitung von Daten optimiert wurden, müssen das noch lernen, wenn sie im Rahmen eines integrierten Fertigungs-Managements in diese Prozesse eingebunden werden.

Praxisbeispiel

REXAM BCNA, der weltweit größte Hersteller von Getränkedosen, setzt ein erweitertes SAP ERP für die Produktionssteuerung einschließlich Qualitäts-Management und Produktionsplanung ein. Dieses System läuft zentral in Chicago und ist durch ein Wide Area Network mit 17 Fabriken verbunden.

In jeder Fabrik ist für die lokale Überwachung und die Fertigungssteuerung eine SAP MII-Lösung implementiert, die auch einen Ausfall des Wide Area Network überstehen kann. Allerdings stellen die lokalen Server, auf denen SAP MII läuft, einen Single Point of Failure dar. Fallen sie aus, so müsste REXAM BCNA auf manuelle Systeme zurückgreifen, die aufwändig und ineffizient sind. Zusätzliche Kosten würden entstehen, wenn bei einem erneuten Hochfahren des Systems Transaktionen manuell nachgearbeitet werden müssten.

REXAM BCNA konnte dieses Problem mit einem Stratus-System lösen, das fehlertolerante Server zur Verfügung stellt, die auch von nicht-technischem Personal in den Fabriken betreut werden können.

Ausfallzeiten in Cluster-Systemen zu hoch

Viele Unternehmen sichern sich gegen Hardware-Ausfälle durch Cluster-Systeme (Verbund von Computern) ab. Cluster können die Ausfallzeiten der Server zwar reduzieren, nicht aber ausschließen. Das Verlagern der Prozesse innerhalb des Clusters im Störungsfall benötigt Zeit, so dass ein wirklich kontinuierlicher Betrieb nicht möglich ist.

Auch wenn ein Cluster nach dem Störfall die unterbrochenen Prozesse wieder aufnimmt, sind die Daten im Memory (Speicher) trotzdem verloren. Damit lässt sich im Cluster auch keine volle Datenintegrität gewährleisten und zeitkritische Prozesse können empfindlich gestört werden.

Cluster können die durchschnittliche Verfügbarkeit auf 99,95 Prozent erhöhen. Bei einer durchgängigen Betriebszeit von 24 Stunden an 365 Tagen bedeutet das eine statistische Ausfallzeit von bis zu vier Stunden – zu lange für eine perfekte Fabrik.

Zudem erfordern Cluster einen hohen Aufwand bei der Implementierung und im Betrieb, für den speziell geschulte Mitarbeiter benötigt werden. Außerdem muss die Anwendungssoftware für den Einsatz im Cluster angepasst werden.

Fehlertolerante Server minimieren Ausfallzeiten

Unternehmen, die für ihre Produktionssysteme einen kontinuierlichen Betrieb sicherstellen wollen, müssen dennoch nicht zu proprietären Spezialsystemen oder zu Großrechnern zurückkehren. Fehlertolerante Server realisieren Hochverfügbarkeit über Standards, mit Intel-Hardware und mit Windows oder Linux als Betriebssystem.

So auch die von Stratus gebauten ftServer. Sie verwenden eine grundlegend andere Technologie als Cluster: Sie schalten nicht redundante Server zusammen, sondern sind selbst komplett redundant aufgebaut. Alle betriebswichtigen Bauteile, wie Prozessoren, Speicher-Chips und I/O-Einheiten, sind doppelt vorhanden. Alle Prozesse des Servers werden ständig simultan ausgeführt. Fällt eine Komponente aus, führt die jeweilige Partner-Komponente automatisch den Betrieb weiter – ein Umschaltvorgang ist nicht notwendig.

Die Anwendungen werden ohne Datenverlust kontinuierlich weitergeführt – ohne, dass ein Administrator eingreifen muss. Service-Maßnahmen sind im laufenden Betrieb möglich.

Integration der IT-Welten ohne Risiko

Mit dieser Technik erreichen ftServer eine Verfügbarkeit von mehr als 99,999 Prozent („Five Nine“), was einer ungeplanten Ausfallzeit von ungefähr 5 Minuten pro Jahr entspricht.

Da sich ein ftServer nach außen wie ein einziges System verhält, können vorhandene Windows-Applikationen ohne Anpassung verwendet werden. Berücksichtigt man den geringeren Aufwand für Implementierung und Administration, ist ein fehlertoleranter Server kostengünstiger als ein Cluster-System.

Fehlertolerante Systeme bilden mit ihrer hohen Ausfallsicherheit eine perfekte Ergänzung für die perfekte Fabrik. Sie sichern die deutlich anspruchsvoller gewordenen Prozesse hardwareseitig ab und sorgen dafür, dass den Unternehmen bei der Integration ihrer IT-Welten keine unkalkulierbaren Risiken entstehen.

Tags:

Leave a Reply