
Die Menge geschäftskritischer Daten explodiert: Jede Firma benötigt immer mehr detaillierte Informationen aus allen Unternehmensteilen. Diese Datenflut muss gebändigt, sprich gespeichert und für die Anwender verfügbar gemacht werden. Auch der IT-Dienstleister RI Solution GmbH hatte mit diesem Problem zu kämpfen. Das rasant wachsende Datenvolumen in den für die Kunden gehosteten SAP-Systemen verursachte nicht nur einen immer größeren Bedarf an Speicherplatz, es beeinträchtigte auch die Systemperformance bei täglichen Arbeiten wie dem Reporting oder dem Aufbau der Statistikdaten und der Aggregate, das sind vorberechnete, redundant gespeicherte Teilmengen eines InfoCubes mit meist geringerer Granularität.
RI Solution betreibt für seine Kunden unter anderem die Lösungen SAP R/3 und SAP NetWeaver – Business Intelligence (SAP NetWeaver BI, das frühere SAP Business Information Warehouse, SAP BW). Mit der Zeit wurde die Datenspeicherung für SAP NetWeaver BI allerdings problematisch, wie Bardo Gutberlet, Leiter SAP Systementwicklung und -betreuung bei RI Solution, erläutert: “Während es für SAP R/3 von Anfang an Archivierungsfunktionalitäten gab, fehlte für SAP NetWeaver BI eine adäquate Lösung. Im Lauf der Jahre wuchs die Zahl der SAP-NetWeaver-BI-Anwender bei unseren Kunden auf etwa 1.300. Die Größe der Datenbank summierte sich auf drei Terabyte.” Ein Drittel davon entfiel auf Daten aus dem PSA-Bereich (Persistent Staging Area), der permanent online gehalten werden muss, da die Kunden die Originaldaten für historische Analysen benötigen.
Lange Laufzeiten für Backup und Recovery
“Neben den nicht unerheblichen Kosten für die Speicherung ergaben sich für uns dadurch Probleme hinsichtlich der Administration. Außerdem machten uns die langen Laufzeiten bei Abfragen oder Backups zu schaffen”, berichtet Gutberlet. Um das Tagesgeschäft nicht zu beeinträchtigen, erfolgte beispielsweise der so genannte Change-Run, also die Anpassung der Aggregate an Stammdatenänderungen, nur noch am Wochenende. Für Reporting und Analyse bedeutete das, dass im Laufe einer Woche zunehmend weniger aktuelle Zuordnungen zu Stammdatenattributen erfolgen konnten und damit das Risiko von Fehlinterpretationen stieg.
Auch die Laufzeiten für Backup und Recovery verlängerten sich stetig. So dauerte die Sicherung der SAP-NetWeaver-BI-Systeme gut zwölf Stunden. Insbesondere die in SAP NetWeaver BI genutzten großen Datenmengen im PSA-Bereich waren wegen der Ladezeiten von bis zu mehreren Tagen nur sehr umständlich aus den SAP-R/3-Quellsystemen wiederherzustellen. Denn dies ist nur in buchungsfreien Zeiten möglich. In einigen Fällen ließen sich die Daten überhaupt nicht wiederherstellen, weil sie in den Quellsystemen gelöscht waren. Dabei sind diese Informationen essentiell für den Aufbau von neuen, anwendungsspezifischen Info-Cubes, die zusätzliche Berichtsanforderungen abdecken.
Datenwachstum drosseln
Die Situation war so nicht haltbar. Die für den Betrieb von SAP NetWeaver BI zuständige Fachabteilung von RI Solution benötigte eine effiziente Lösung für die Archivierung und Wiederherstellung von InfoCubes, PSA- und ODS-Objekten (Operational Data Store). Gleichzeitig war ein flexiblerer Umgang mit den archivierten Daten notwendig, da beispielsweise PSA-Objekte weiterhin als Informationsquellen verfügbar sein mussten. Der Zugriff auf die archivierten Daten durfte für die Anwender nicht mit Performance-Verlusten verbunden sein. “Wir mussten dem Datenwachstum in SAP NetWeaver BI Einhalt gebieten, um die Service-Level-Vereinbarungen für unsere Kunden zu gewährleisten”, erklärt Gutberlet.
Das Unternehmen begann daher im Sommer 2005 mit der Suche nach einer passenden Archivierungs- oder Nearline-Speicherlösung. Letzteres stellt eine Zwischenstufe zwischen einem Offline-Archiv und einem relationalen Online-Speicher dar. Dabei werden selten genutzte Informationen in SAP NetWeaver BI gelöscht, stehen aber weiterhin “nearline” für den Zugriff aus der BI-Lösung zur Verfügung. Nach einer gründlichen Marktanalyse nahm RI Solution drei unterschiedliche Produkte genauer unter die Lupe: eine klassische Archivierungssoftware, eine transaktionale Datenbankerweiterung sowie die Nearline-Speicherlösung SAND/DNA Access des SAP-Partners SAND Technology. Für diese Lösung entschied man sich nach einer Testinstallation dann auch.
Die Implementierung begann Ende April 2006 und wurde im Oktober 2006 abgeschlossen. Verantwortlich war ein kleines Team aus einem Berater von SAND, der auf Abruf zur Verfügung stand, sowie zwei Mitarbeitern von RI Solution, die aufgrund ihrer täglichen Arbeit nur zeitweise an dem Projekt arbeiten konnten. Die Implementierung der Software nahm nur wenige Stunden in Anspruch. Dabei wurde die SAND-Datenbank auf der gleichen Hardware installiert wie das SAP-System. Unproblematisch war auch die Integration in SAP NetWeaver BI.
Kompressionsrate von 96 Prozent
Das Projekt hat sich gelohnt: SAND/DNA Access bietet RI Solution die Möglichkeit, ausgewählte Daten drastisch zu komprimieren, ohne ihre Verfügbarkeit für die Analyse oder als Grundlage für neue ODS-Objekte oder InfoCubes einzuschränken. “Die Originalgröße der Daten, die wir bis jetzt in den Nearline-Speicher verschoben haben, lag bei rund 650 GB. Der Nearline-Speicher fasst dagegen nur rund 25 GB. Wir haben also eine Kompressionsrate von 96 Prozent erreicht”, unterstreicht Gutberlet.
Bereits im Test ließen sich die InfoCubes nun deutlich besser warten. Durch das geringere Datenvolumen ergaben sich insgesamt kürzere Laufzeiten bei Standard-Jobs wie dem Aufbau von Indizes für Statistikdaten oder der Aggregatpflege mit Roll-Up, also der Aktualisierung von Daten nach dem Laden, und Change-Run. Vorteile bringt auch die Archivierung der PSA-Daten: Neue InfoCubes können jetzt deutlich effizienter aufgebaut werden, der Zugriff auf aktuelle PSA-Datentabellen nimmt weniger Zeit in Anspruch als zuvor, so dass erstmal ein Reporting auf PSA-Daten möglich ist. Auch lassen sich Fehler schneller beheben, und der Aufwand für die Administration ist auf ein Minimum gesunken. Das Backup der SAP-NetWeaver-BI-Systeme dauert jetzt nur noch sieben statt bisher zwölf Stunden.
Schlanke Prozesse beim Datenmanagement
“Mit SAND/DNA Access sind Antwortzeiten bei uns kein Thema mehr. Wir haben inzwischen damit begonnen, die InfoCubes zu verschieben, bei denen die Antwortzeiten im Vergleich zum Zugriff auf PSA-Daten noch wichtiger sind, da die Anwender direkt darauf zugreifen. Doch wir sind zuversichtlich, auch hier die Anforderungen unserer Kunden erfüllen zu können”, betont Gutberlet.
Seine Bilanz ist durchweg positiv: “SAND/DNA Access ist für unsere Anforderungen optimal. Die Lösung reduziert das Datenvolumen im aktiven SAP NetWeaver BI deutlich. Dank des hohen Integrationsgrades zwischen SAND/DNA und SAP NetWeaver BI bleiben unsere Datenmanagement-Prozesse schlank. Gleichzeitig werden die relevanten Informationen aber nicht gelöscht oder in ein Offline-Archiv verschoben, sondern sind weiterhin kurzfristig verfügbar. Wir können jederzeit darauf zugreifen und damit dem Wunsch unserer Fachabteilung nach flexibel aufbereiteten Informationen effizient nachkommen.”
