Leistungsfähiges Unternehmensgedächtnis

Feature | 31. Oktober 2007 von admin 0

Die Datenmenge in den Unternehmen steigt stetig an. Das liegt an den gesetzlichen Vorgaben zur Speicherung von Informationen sowie an der zunehmenden Vielfalt betrieblicher Prozesse, für die aktuelle und transparente Zahlen benötigt werden. Dadurch entstehen hohe Speicherkosten, ein großer Aufwand beim Systembetrieb und Engpässe bei routinemäßigen Abfragen sowie bei Datensicherung und Wiederherstellung (Backup and Recovery).
Sinkende Preise für leistungsfähige Festplattenspeicher reichen nicht aus, um diese Entwicklung zu kompensieren, denn die Informationsflut steigt schneller, als sich das Preis-Leistungs-Verhältnis der Speichertechnologie verbessert. Darüber hinaus zieht – so schätzen die Analysten von Dataquest und Gartner – jeder in Festplattenspeicher investierte Euro fünf bis zehn Euro Betriebskosten nach sich. Außerdem lässt sich die mangelnde Systemverfügbarkeit, die bei großen Datenmengen entsteht, mit mehr Speicherkapazität allein nicht beheben; dazu wäre nämlich auch ein größerer Rechner mit mehr CPU- und Rechenkapazität erforderlich.

Datenhaltung in drei Stufen

Das Konzept der zentralen Datenhaltung, bei dem alle Informationen in einer relationalen Datenbank online „lagern“, stößt damit an seine Grenzen. Eine neue Möglichkeit des Data Warehousings hat SAP mit der Nearline-Schnittstelle (NLS) für SAP NetWeaver Business Intelligence 7.0. (SAP NetWeaver BI) geschaffen. Nearline-Speicher sind eine Art Zwischenstufe zwischen der Online-Datenbank und dem Offline-Archiv. Mit einer NLS-Schnittstelle kann man mithilfe von Daten-Archivierungs-Prozessen (DAPs) weniger häufig genutzte InfoCubes und DataStore Objects (DSO) aus der relationalen Datenbank in einen Nearline-Speicher verschieben und sie dafür aus der relationalen Datenbank löschen. SAP NetWeaver BI 7.0 ermöglicht dann den direkten und transparenten Zugriff auf den Nearline-Speicher. Daher sind die Daten weiterhin rasch abrufbar, etwa im Rahmen einer Revision vergangener Jahre oder bei einem Neuaufbau von Kennzahlen und Berichten. Auf diese Weise hält die relationale Datenbank nur noch aktuelle Informationen vor, während alles, was zwar im Moment nicht relevant sind, es aus Sicht der Anwender aber wieder werden könnte oder aus gesetzlichen Gründen nicht gelöscht werden darf, in einer Nearline-Lösung lagert.
SAND/DNA von SAND Technology ist eine datenbankunabhängige Lösung zur Nearline-Speicherung für die Betriebssysteme Windows, 64 Bit Linux, SUN-Solaris, HP-UX, HP Tru64 (Unix) und IBM-AIX. In Verbindung mit der NLS-Schnittstelle ermöglicht SAND/DNA mit seiner Fähigkeit, Daten stark zu komprimieren, den Aufbau eines effizienten und kompakten Nearline-Speichers. Dabei werden die DAPs in die in SAP NetWeaver BI vorhandenen Prozessketten eingebunden und entfernen nach Ablauf der periodischen Prozesse, zum Beispiel dem Transformieren der Daten oder dem Laden der unterschiedlichen Datenebenen, zügig die nicht mehr relevanten DataStore Objects, aber auch „alte“ InfoCubes aus der relationalen Datenbank.

Stark komprimierte Informationen sparen Speicherplatz

Während der Daten-Archivierungs-Prozesse komprimiert SAND/DNA die gespeicherten Informationen, ohne dass ihre Verfügbarkeit leidet. Damit sinkt der Bedarf an Speicherplatz, und die Anwender sparen Kosten. Die bisherigen Erfahrungen in Produktivumgebungen zeigen, dass sich DataStore Objects aus SAP NetWeaver BI 7.0 bei der Speicherung in SAND/DNA generell um mehr als 90 Prozent komprimieren lassen.
Der hohe Komprimierungsgrad wird möglich durch die Kombination von speziellen Komprimierungsverfahren und eine besondere Form der Datenhaltung, die Spalten anstelle von Zeilen nutzt. Die Datenwerte in den Spalten werden durch Platzhalter, so genannte Tokens, ersetzt. Da diese Tokens als ganzzahlige Werte gespeichert werden, beanspruchen sie weniger Platz als die eigentlichen Werte. Außerdem sind die Datenwerte der Spalte nur ein einziges Mal in so genannten Domänen gespeichert. Das vermeidet Redundanzen und spart zusätzlich Platz, und zwar umso mehr, je geringer die Kardinalität der Datenausprägungen und je höher der Platzbedarf jedes einzelnen Wertes ist.
Die Domänen und die Token-Listen werden als Blöcke komprimiert. Dank einer hinterlegten Navigationsstruktur, der Recordmap, lassen sich die relevanten Datenblöcke bei einer Abfrage rasch auffinden und dekomprimieren. Je nach Zusammensetzung der Daten – also abhängig von ihrer Kardinalität, dem Speicherbedarf der einzelnen Werte im Vergleich zum Token und der Komprimierbarkeit der Werteausprägungen – reduzieren sich zum Beispiel zwei Terabyte Daten in DataStore Objects nach der Speicherung in SAND/DNA auf nur noch 150 bis 200 Gigabyte.
Die komprimierten Tokens und die Beschreibungen der Datenwerte werden in SAND Compacted Tables (SCT) gespeichert. Diese sind wiederum in einer eigenen Metadatenverwaltung zusammengefasst, damit sie sich leichter auswerten lassen. Dank der Speicherung in Spalten müssen bei Abfragen weder Tabellen und Spalten angelegt noch Daten indexiert werden, wie dies bei einer Speicherung in Zeilen erforderlich wäre.

Abfragen ohne Zeitverlust

Die Abfrage von Daten in SAND/DNA wird über den OLAP-Prozessor von SAP NetWeaver BI gesteuert. Er führt nach dem einmaligen Setzen der entsprechenden NLS-Berichts-Parameter automatisch die Abfrageergebnisse aus der Online- und der Nearline-Welt zusammen. Damit lassen sich die gespeicherten InfoCubes oder DataStore Objects über den Business Explorer (BEx) oder jedes andere für SAP NetWeaver BI zertifizierte Frontend sowie über die ListCube-Funktion abfragen. Dank der Metadatenverwaltung werden nur die tatsächlich benötigten Daten in den SAND Compacted Tables selektiert, dabei aggregiert und dem OLAP-Prozessor zur weiteren Verarbeitung zur Verfügung gestellt. Eine Dekomprimierung der Daten im Voraus ist nicht erforderlich.
Für den Aufbau von neuen Berichtsszenarien stehen dem Systemadministrator die bekannten Daten-Transfer-Prozesse (DTP) von SAP NetWeaver BI sowie ein neues Nearline-LookUp-API (Application Programming Interface) zur Verfügung. Soll beispielsweise eine neue mehrperiodische Kennzahl erstellt werden, die aus Vergleichsgründen auch Aussagen über die Vergangenheit enthält, weist die Lösung dem DTP den Nearline-Speicher als Datenquelle für „historische“ Informationen zu, während aktuelle Informationen aus der relationalen „Online“-Datenbank in die Kennzahl einfließen.

Effizientes Gedächtnis für Unternehmen

Die Kombination aus SAP NetWeaver BI und Nearline-Speicher verringert das Datenvolumen der DataStore Objects und InfoCubes und vereinfacht Administrationsaufgaben schon allein durch die kürzeren Backup-Zeiten. Die Kosten für den Systembetrieb sowie für Speichermedien, Hauptspeicher oder CPUs sinken und Service Level Agreements (SLAs) lassen sich leichter einhalten.
Gleichzeitig entsteht ein effizientes und kompaktes Unternehmensgedächtnis, das so genannte Corporate Memory, das alle granularen Daten auf Basis der DataStore Objects rasch abrufbar hält, ohne die relationale Datenbank zu belasten, und den Aufbau von unvorhergesehenen Berichtsszenarien oder den Abruf von Kennzahlen ermöglicht, ohne dass auf Archivierungs- oder ERP-Systeme zugegriffen werden muss.

Tags:

Leave a Reply