Für Datenanalysen den Turbo zünden

Feature | 21. März 2007 von admin 0

Nach einer Umfrage der Marktforscher von IDC rechnen 30 Prozent der Unternehmen mit einem Jahresumsatz von mehr als 500 Millionen US-Dollar damit, dass sich ihre in einem zentralen Data Warehouse gespeicherten Informationen innerhalb der nächsten drei Jahre verdoppeln werden. Im Gegenzug gehen nur 15 Prozent davon aus, dass die IT-Abteilung die richtigen Daten zur richtigen Zeit an die richtigen Mitarbeiter bringt.

Einfache Anbindung an SAP NetWeaver

Doch genau davon hängt der Geschäftserfolg maßgeblich ab: Blitzschnell wichtige Daten und Informationen zu analysieren und daraus marktrelevantes Wissen zu extrahieren. Mit dem SAP NetWeaver Business Intelligence Accelerator (SAP NetWeaver BI Accelerator), den SAP gemeinsam mit dem Technologiepartner Intel entwickelt, Ende 2005 im Ramp-Up an ausgewählte Kunden geliefert und Mitte 2006 auf den Markt gebracht hat, erhalten Anwender hierfür das richtige Werkzeug.
Der SAP NetWeaver BI Accelerator basiert auf der SAP-eigenen Such- und Klassifikationstechnologie und lässt sich als vorinstallierte Paketlösung ausschließlich in Verbindung SAP NetWeaver (ab Version 2004s) verwenden. Die Software stellt Analyse-Funktionen auf Blade Servern von Hewlett Packard und IBM bereit, die seit kurzem mit Dual-Core Intel Xeon Prozessoren ausgestattet werden. Sie läuft unter dem Betriebssystem 64-Bit Novell SuSe Linux. Ausgeliefert wird der SAP NetWeaver BI Accelerator als so genannte Appliance, d.h. die Software ist auf definierter Hardware bereits installiert und konfiguriert. Zur Aktivierung wird er einfach über eine RFC-Verbindung an SAP NetWeaver Business Intelligence angekoppelt.

Dynamisch verdichten, flexibel analysieren

Der SAP NetWeaver BI Accelerator ergänzt und erhöht die Leistungsfähigkeit von Auswertungen auf Basis von SAP NetWeaver Business Intelligence deutlich. Abfragen werden durchschnittlich um das 10- bis 100-fache beschleunigt. Das bringt gerade bei Datenmengen im Terabyte-Bereich Vorteile. Zur höheren Abfragegeschwindigkeit und Flexibilität der Analysen tragen maßgeblich die innovativen Schlüsseltechnologien des SAP NetWeaver BI Accelerator bei. Die Daten werden dabei – im Gegensatz zur zeilenweisen Ablage in relationalen Datenbanken – spaltenweise abgelegt und hoch komprimiert. Dadurch können Abfrageprozesse im Hauptspeicher durchgeführt (in-memory-processing) und parallel auf allen CPUs ausgeführt werden.
Für die parallelisierten Abfragen werden Indices aufgebaut und mit allen Daten aus den InfoCubes von SAP NetWeaver Business Intelligence befüllt. Der Index enthält sämtliche Daten des InfoCubes in hochkomprimierter, nicht aber, wie bei Relationalen-OLAP-basierten Abfragetechnologien, in aggregierter Form. Im SAP NetWeaver BI Accelerator werden Daten erst dynamisch während einer Abfrage aggregiert. Das ermöglicht Anwendern, die Daten jederzeit in Echtzeit zu durchsuchen und sie im Detail nach bestimmten Kriterien auszuwerten – etwa Umsatz pro Woche, pro Region oder pro Produkt.
Gegenüber Relationalen-OLAP-basierten Technologien bietet das Verfahren vor allem bei großen Datenmengen Vorteile. Bei OLAP-Auswertungen müssen die zu analysierenden Geschäftsdaten bereits vor einer Abfrage nach bestimmten Merkmalen aggregiertwerden, um performant auf die Daten zuzugreifen. Zu diesem Zweck muss die IT-Abteilung eigens ein neues Aggregat aufbauen und warten. Das ist zeitaufwändig und verursacht etwa bei vielen verschiedenen Abfragetypen hohe Pflegeaufwände.

Parallele Abfragen, schnelle Ergebnisse

Architektur

Architektur

Ist der SAP NetWeaver BI Accelerator an SAP NetWeaver angedockt, wählen die Anwender diejenigen InfoCubes in der BI-Lösung aus, deren Antwortzeiten optimiert werden sollen. Die InfoCubes sind als mehrdimensionale Datenmodelle aufgebaut und enthalten Merkmale und Kennzahlen aus beliebigen Quellsystemen, die betriebswirtschaftlich zusammengehören. Diese mehrdimensionalen Daten aus den InfoCubes werden nun an den SAP NetWeaver BI Accelerator übergeben und in einem so genannten Index gespeichert. Neue Daten im InfoCube können schnell via Delta-Mechanismus indiziert werden.
Beim ersten Ausführen einer Query werden die Indices in den Hauptspeicher des BI Accelerator geladen, dort aufbereitet und horizontal über die unterschiedlichen physikalischen Partitionen der Blades verteilt. Für schnelle Ergebnisse sorgen parallele Abfragen über die einzelnen Server hinweg. Dem US-Beratungshaus Winter Corporation zufolge durchsucht ein SAP NetWeaver BI Accelerator mit zehn Blade-Servern und 20 Partitionen einen InfoCube 20mal schneller als eine Abfrage ohne SAP NetWeaver BI Accelerator.
Die Abfrageergebnisse übergibt der SAP NetWeaver BI Accelerator dann an die BI Analytic Engine von SAP NetWeaver Business Intelligence, die Geschäftsinformationen aufbereitet und dem Anwender über Analyse-Frontends zur Verfügung stellt.

Datenflüsse verringern, Speicherplatz sparen

Darüber hinaus ermöglichen hohe Kompressionsraten sowie eine spaltenweise Ablage der Daten aus den InfoCubes von SAP NetWeaver Business Intelligence schnelle Abfrageergebnisse. Die hohen Kompressionsraten erreicht SAP NetWeaver BI Accelerator – technisch gesehen – durch ein Dictionary-basiertes Verfahren sowie eine numerische Kodierung der indexierten Daten. Mehrfach vorhandene Informationen bzw. Objekte werden als Referenz auf das erste Vorkommen gespeichert. Jedem Eintrag wird genau eine ganze Zahl zugewiesen. So lassen sich große Datenmengen, die bei verschiedenen Verarbeitungsschritten übertragen und zwischengespeichert werden müssen, durchschnittlich – und zwar abhängig vom Datenbanksystem – um den Faktor zehn verringern. Tests der Winter Corporation ergaben, dass 670 GB große Quelldaten aus einem InfoCube im SAP NetWeaver BI Accelerator nur noch 55 GB Speicherplatz benötigen.
Durch das spaltenweise Ablegen der Daten greift der SAP NetWeaver BI Accelerator jederzeit gezielt und direkt auf die im Rahmen einer Abfrage relevanten Datenspalten zu. Die einzelnen Spalten werden sortiert und die wichtigsten Ergebnisse an den Anfang gestellt. Das ist effizienter als die zeilenbasierte Speicherung in relationalen Datenbanksystemen, bei der prinzipiell immer alle Felder gelesen werden, auch wenn diese für eine Abfrage nicht relevant sind.

Weniger Last auf der Datenbank senkt Kosten

Der Einsatz des SAP NetWeaver BI Accelerators umgeht die Datenbankablage beim Lesen von Abfragen und reduziert somit die Last auf der Datenbank. Da die Lizenzpreise von Datenbanken oft von der Auslastung der CPU abhängen, sinken hierdurch die Gesamtbetriebskosten; zusätzlich reduziert sich der auf der Datenbank benötigte Speicherplatz. Darüber hinaus hat die IT-Abteilung einen deutlich geringeren administrativen Aufwand, da das zeitintensive Design und der Aufbau von Aggregaten, etwa nach Verkaufsanalysen pro Regionen oder Verkaufsorganisation, entfällt. Ändern sich beispielsweise Kunden- oder Produktstammdaten müssen im SAP NetWeaver BI Accelerator die geänderten Datensätze einfach nur in die Indices „nachgeladen“ werden; Aggregate dagegen müssen bei Änderungen von Stammdaten oder Hierarchien üblicherweise komplett neu aufgebaut werden.
Davon profitieren speziell große Unternehmen mit großen Datenvolumina, etwa Energieversorger, Telekommunikations-Unternehmen, Firmen mit hohen Anforderungen an das Ad-hoc-Reporting sowie der Handel. Beispielsweise fallen in einer Einzelhandelskette pro Tag Millionen von Bondaten an. Mit dem SAP NetWeaver BI Accelerator lassen sich Analysen und Abfragen direkt auf die Bondaten erstellen, die Antwortzeiten liegen im Sekundenbereich. Wichtige Kundeninformationen stehen unmittelbar zur Verfügung, Änderungen im Konsumentenverhalten sind sofort nachvollziehbar. Prozesse wie Absatzplanung, Beschaffung und Marketing-Maßnahmen lassen sich auf diese Weise rasch an neue Kundenwünsche anpassen.

Abfragen bis zu 300-mal schneller

Antwortzeiten

Antwortzeiten

Im Vergleich zu Datenbank-Abfragen ist die Hauptspeicher-basierte Analysemethode des SAP NetWeaver BI Accelerator nachweisbar schneller. Die Winter Corporation ermittelte bei einer Analyse von 1,3 Milliarden Datensätzen mit der Software durchschnittliche Antwortzeiten von nur 0,9 Sekunden. Auch in Punkto Skalierbarkeit und Leistungsfähigkeit überzeugte der SAP NetWeaver BI Accelerator die Analysten. SAP-Kunden, die die Auswirkungen der Analyse-Software auf ihre Unternehmensleistung umfassend untersucht haben, bestätigen die unter „Laborbedingungen“ erreichten Ergebnisse.
Der Erdölkonzern BP beispielsweise bewältigte in einem Pilotversuch mit dem SAP NetWeaver BI Accelerator eine Kontrollabfrage, die sämtliche Geschäftsdaten aus dem Jahr 2004 beinhaltete, in weniger als 2,6 Sekunden. Zum Vergleich: Bislang hatte eine Abfrage fast 13 Minuten gedauert. Der Konzern will künftig sämtliche Geschäfts- und Marktdaten – insgesamt zehn Terabyte – mit dem SAP NetWeaver BI Accelerator analysieren, um Markttrends rascher zu erkennen.
Auch den Getränkekonzern Brown-Forman (Jack Daniel’s) hat SAP NetWeaver BI Accelerator überzeugt. Bei 650 Millionen Datensätzen laufen Queries bis zu 300-mal schneller. Die für eine Analyse nötigen BI-Accelerator-Indices konnten innerhalb von 6,5 Stunden aufgebaut werden, für Aggregate benötigte der Konzern bisher 44 Stunden. Indexaktualisierungen sind nun in weniger als eine Minute durchgeführt, während das Hochrollen der Deltadaten in die Aggregate 30 bis 60 Minuten dauerte.

Weitere Informationen:

http://www.bia-solution.com/de/bobw/index_campaign.html
und
http://www.intelalliance.com/sap

Dr. Andreas Schaffry

Dr. Andreas Schaffry

Tags:

1 comment

Leave a Reply