Daten schrumpfen, Kosten sinken

Feature | 19. September 2005 von admin 0

Um genaue Einblicke in ihre Geschäftsaktivitäten zu erhalten, setzen Unternehmen auf Data Warehouses und Business-Intelligence-Lösungen. Dort werden Daten sinnvoll zusammengeführt und zu nützlichen Informationen aufbereitet. Aufgrund unterschiedlicher Bedürfnisse in den Abteilungen und auf den Entscheidungsebenen haben sich über die Jahre eine Vielzahl technischer Lösungen angesammelt. Deren Wartung ist zu aufwändig und kostenintensiv. Als Folge sind die gespeicherten Geschäftsinformationen häufig inkonsistent. Das verzögert Entscheidungen, Geschäftsziele lassen sich nur unzureichend umsetzen.
Weltweit operierende Unternehmen erkennen diesen Sachverhalt als Wettbewerbsnachteil und führen darum unternehmensweite Enterprise Data Warehouses ein. Dabei konsolidieren sie gezielt Business-Intelligence-Lösungen. Für die Unternehmen bedeutet dies meist den Umbau ihrer Anwendungsarchitektur. Es entsteht eine umfangreiche Data-Warehouse-Architektur, die sich aus Datenbanken des gesamten Unternehmens zusammensetzt. Diese löst Business-Intelligence-Lösungen ab, die bisher über so genannte Data Marts nur eine eingegrenzte und rein summarische Sicht auf einzelne Abteilungen oder Funktionsbereiche erlauben.

Daten in Reinform

Mit der neuen Architektur wird – im Idealfall zentral und unternehmensweit – ein SAP BW Data Warehouse Layer implementiert. Er speichert die Geschäftsdaten unverändert und zeitlich geordnet in Reinform und sorgt für deren Konsistenz. Aus diesem bis auf die feinste Detailebene “granulierten” Datenbestand lässt sich die Data-Mart-Ebene befüllen. Daten werden vorgehalten, um weitere, neue Analysen zu ermöglichen.
Diese Technologie bietet viele Vorteile: Da die Datenquellen konsistent und im Original zur Verfügung stehen, lassen sich die gewonnenen Geschäftsinformationen und Kennzahlen leicht überprüfen und vereinheitlichen. Es ist auch möglich, rasch Analysen zu erstellen, die unvermittelt angefordert werden. Denn die neue Architektur basiert auf InfoCubes, die sich schnell aufbauen lassen. Administrations- und Ausbildungskosten sinken, weil die Gesamtlösung bisherige heterogene BI-Insellösungen im Unternehmen ersetzt.
Allerdings bedeutet diese Lösung eine technische Herausforderung und ist zudem mit nicht unerheblichen Kosten für die Datenhaltung verbunden. Denn abhängig von Unternehmensgröße, Branchenzugehörigkeit sowie der geforderten Granularität und Historie der Informationen haben Unternehmen meist sehr hohe und schnell wachsende Datenmengen zu bewältigen. Zudem wird ein Großteil der Daten nur selten benötigt, muss aber fortlaufend verwaltet werden und belegt in der Regel teure Speichermedien. Beispiele sind Daten aus der Kundenhistorie oder ältere Daten aus der Abbildung von Lieferantenprozessen.

Spalten statt Zeilen

Um diese Daten in SAP NetWeaver Business Intelligence (SAP NetWeaver BI) bestmöglich zu verwalten, hat sich Sand Technology mit SAP als Software- und Entwicklungspartner zusammengetan. Als Ergebnis der Partnerschaft lässt sich Sand Searchable Archive in eine “Nearline-Architektur” für SAP NetWeaver BI integrieren. Nearline bedeutet, die Lösung hält zeitlich zurückliegende Daten vor, die insgesamt zwar seltener als aktuelle Online-Daten, aber trotzdem rasch zugänglich sein müssen.
Mit der Sand-Lösung lassen sich die im SAP BW Data Warehouse Layer als ODS-Objekte gespeicherten Daten hocheffizient verdichten – in der Regel um mehr als 85 Prozent, verglichen mit relationalen Datenbanken, ohne dadurch beim Zugriff auf die ODS-Objekte für den SAP-BI-Prozessablauf oder bei der direkten Analyse eingeschränkt zu sein. Administratoren haben mit SAP BW 3.x haben die Möglichkeit, Sand Searchable Archive über die zentrale, leicht bedienbare grafische Oberfläche zu steuern. Eine entsprechende Integration in SAP NetWeaver 2004s ist vereinbart.
Wie lassen sich die hohen Komprimierungsraten erreichen? Sand Searchable Archive ist eine reine Softwarelösung und für die Betriebssysteme Windows, 64 Bit Linux, SUN-Solaris, HP-UX und IBM-AIX verfügbar. Es basiert auf einer besonderen Datenhaltung. Diese speichert die Daten in Spalten statt wie üblich in Zeilen. Die in den Spalten enthaltenen Datenwerte werden durch wenig Speicherplatz beanspruchende Kürzel oder Platzhalter, so genannte Tokens, ersetzt und gleichzeitig in eindeutigen Wertetabellen gespeichert. Diese Trennung in Datenwerte und Tokens führt zu einem geringeren Datenvolumen und beschleunigt die Abfragen. Zudem sorgt die Lösung dafür, dass in die Spalten nur einheitliche Datentypen gelangen.
Die Ergebnisse der beschriebenen Ablageprozesse werden in Sand Compacted Tables (SCT) gespeichert. Diese enthalten komprimierte Tokens sowie Beschreibungen der Datenwerte. Alle Sand Compacted Tables werden wiederum in einer eigenen Metadatenverwaltung zusammengefasst, um für Berichte und Analysen auswertbar zu sein. In Verbindung mit dem jetzt verfügbaren Sand Nearline Integration Controler für SAP BW 3.x lassen sich ODS-Objekte oder InfoCubes ganz oder auch teilweise im Sand Searchable Archive hoch komprimiert speichern. Das erübrigt das Anlegen von Tabellen und Spalten oder gar eine Indexierung für nachgelagerte Abfragen. Je nach Hardwarearchitektur und Anzahl der zugeordneten CPUs werden die Sand Compacted Tables mittels eines Rechners mit einer oder mehreren CPUs oder im Rechnerverbund aufgebaut und entweder “remote” oder extern gespeichert.

Aus Zehn mach Eins

Je nach Datenzusammensetzung ergeben so zum Beispiel zehn Terabyte Daten in ODS-Objekten nach Speicherung im SAND Searchable Archive in der Regel einen hocheffizient gespeicherten SAP BW Data Warehouse Layer mit etwa 0,5 bis 1,5 Terabyte. Bei Bedarf lassen sich die im Sand Searchable Archive auf Infoprovider-Ebene gespeicherten Daten auch wieder in den Infoprovider des SAP Business Information Warehouse (SAP BW) zurückspielen. Damit stehen dann auf Vorrat gespeicherte Daten des SAP BW Data Warehouse Layers in Form von ODS-Objekten zur Verfügung, mit denen sich sehr rasch InfoCubes im SAP BW aufbauen lassen.
Der Datenzugriff auf Sand Searchable Archive erfolgt über sogenannte virtuelle InfoProvider, die automatisch angelegt werden. Dabei wird im SAP BW nur eine Strukturbeschreibung für die im Sand Searchable Archive abgelegten Daten gehalten. Der eigentliche Datenzugriff im SAP BW OLAP-Prozessor erfolgt dann über eine Schnittstelle, deren Implementierung Teil der Sand-Lösung ist. Diese virtuellen InfoProvider unterstützen gerade unvermittelt aufkommende Anfragen, die für weit zurückliegende Zeiträume rasch und sehr detailliert beantwortet werden müssen. Berichte mit Werten und Vergleichen aus aktiven und im Sand Searchable Archive befindlichen ODS-Objekten werden über MultiProvider erstellt. Aufgrund der Metadatenverwaltung werden nur die jeweils für die Analyse benötigten Daten in den jeweiligen SAND Compacted Tables selektiert und dem virtuellen InfoProvider und SAP BW OLAP-Prozessor zur weiteren Verarbeitung rasch zur Verfügung gestellt. Eine vorherige Dekomprimierung der Daten im Sand Searchable Archive entfällt.
Unternehmen, die sich für die Implementierung eines unternehmensweiten Informations-Repository auf Basis von SAP NetWeaver Business Intelligence entschieden haben, steht mit der Sand-Lösung ein einfach zu integrierender Baustein für den Aufbau einer auf hohe Datenvolumina ausgelegten Nearline-Lösung für den SAP BW Data Warehouse Layer zur Verfügung. Er speichert die Daten hocheffizient und kostengünstig ohne Leistungseinbußen für den SAP-NetWeaver-BI-Prozessablauf oder für die direkte Analyse.

Dr. Peter Zimmerer

Dr. Peter Zimmerer

Roland Markowski

Roland Markowski

Tags: ,

Leave a Reply