Big Data richtig einsetzen

Feature | 23. Januar 2013 von Shandy Lo 0

Foto: iStockphoto

Pavlo Baron arbeitet bei der Codecentric AG, die auf Software-Entwicklung und innovative Technologien spezialisiert ist. Der IT-Architekt leitet das Kompetenz-Center Architektur. Dort beschäftigt er sich hauptsächlich mit Technologiemanagement in Unternehmen und verschiedenen Ansätzen rund um das Thema Big Data. Neben seiner Arbeit ist er Autor und schreibt aktuell an dem Buch „Big Data für IT-Entscheider: Riesige Datenmengen und moderne Technologien gewinnbringend nutzen“.

SAP.info: Wie kamen Sie zu dem Thema Big Data?

Pavlo Baron: Ich habe vor ein paar Jahren angefangen mich wieder stärker mit Statistik und Analyse zu beschäftigen und bin da über das Thema Machine Learning „gestolpert“. Darunter versteht man die Technik, das Wissen und die Erfahrung, die man sich aneignet. Zudem habe ich mich schon länger mit verteilten Systemen befasst. Aus dieser Kombination der verschiedenen Bereiche beschloss ich dann, außerhalb des Hypes, das Thema „Big Data“ zu hinterfragen und was es bedeutet, große, kaum strukturierte Datenmengen zu verarbeiten.

Sie sprechen von einem speziellen Typus von Entwicklern, dem Big-Data-Developer. Was darf man sich darunter vorstellen?

Nicht alles, was als „Big Data“ bezeichnet wird, ist auch Big Data. Der Begriff wurde von Marketingfirmen stark gehypt, weil es eine neue Art ist, Geld zu verdienen. Meine Botschaft ist, dass man sich als Big-Data-Developer sehr tief mit der Wissenschaft beschäftigen muss, sei es mit Analyse, Verarbeitung oder der Speicherungen von großen Datenmengen. Nur so kann man die vielen existierenden Tools sinnvoll einsetzen. Ein Entwickler muss Kenntnisse über analytische Verfahren, Statistik und Machine Learning haben, z.B. muss man wissen, wie man Algorithmen trainiert, um nützliche Informationen aus vielen Daten zu extrahieren. In erster Linie dreht sich alles um die analytische Seite, aber man braucht einen wissenschaftlichen Hintergrund oder einen gewissen Forschungsdrang und muss die Tools, mit denen man arbeitet auch in der technischen Tiefe beherrschen, um Herr dieser „großen Daten“ zu werden. Es gibt kein Tool, welches per se alle Probleme löst.

Welche Anforderungen sollten Entwickler bzw. Big-Data-Entwickler erfüllen?

Entwickler müssen die Maschinen verstehen, z.B. wie eine Festplatte oder ein Hauptspeicher funktioniert und wie diese verwendet werden sollen. Viele verlassen sich in der Regel zu sehr auf das Tool. Das ist insbesondere bei großen Datenmengen gefährlich und nicht zielführend, da man aus den zur Verfügung stehenden Maschinen das Maximum herausholen sollte. Dafür ist tieferes Verständnis erforderlich.

Welche Karriere-Tipps können Sie jungen Entwicklern geben?

In erster Linie: Lernen. Junge Entwickler sollten sich mehr mit der Wissenschaft und Mathematik beschäftigen. Wenn sie ein Tool in die Hand bekommen, auch mal hinter die Fassade schauen und nicht immer nur auf den Hersteller XY vertrauen.

Auf der nächsten Seite: Wie Unternehmen Big Data sinnvoll nutzen können.

Welche Probleme haben Unternehmen mit Big Data?

Das eigentliche Problem ist, dass sie nicht wissen, wie und wofür sie Daten sammeln können, welche Business Cases daraus resultieren oder welche Ersparnisse möglich sind. Sie sind es gewohnt, die Daten strukturiert zu organisieren, was bei dem Chaos von z.B. Web-Daten nicht möglich ist. Außerdem befinden sich im Moment die meisten klassischen Unternehmen in der Situation, den Begriff „Big Data“ zu hören, jedoch nichts damit anfangen zu können. Sie benötigen spezielle Expertise, externe Impulse, um auf den Geschmack der Auswertung von großen und unstrukturierten Daten zu kommen, um neue Technologien in der IT zu etablieren und diese in richtige Tool-Chains zu setzen.

Was können CIOs tun, um Big Data sinnvoll zu nutzen?

Die Unternehmen müssen in die eigenen Mitarbeiter investieren. Eine Möglichkeit: Angestellte in Workshops oder Trainee-Programme schicken. Firmen stecken ihr Geld lieber in die großen Boliden. Da ist es viel einfacher, aufgrund von Verträgen mit dem Hersteller, bei Problemen den Schuldigen auszumachen, doch ist das keine dauerhaft profitable Lösung. Wenn Unternehmen heute große Datenmengen verarbeiten wollen, müssen sie in den eigenen Betrieb investieren. Eine Lösung wäre hier die DevOps-Bewegung. (Anmerk. der Red.: Der Begriff setzt sich aus „Dev“, der die Softwareentwickler bezeichnet (Developers) und „Ops“, der für den IT-Betrieb (Operations) steht, zusammen.) Die Mitarbeiter kommen in interdisziplinären Teams zusammen. Dort wird sowohl die Idee entwickelt als auch dann in den Vertrieb überführt. Es wird nicht mehr zwischen Entwicklung und Vertrieb getrennt. Alle werden in einem Topf zusammengeworfen und entwickeln gemeinsam eine Lösung, die sie schließlich dann auch betreiben bzw. am Leben erhalten.

In den klassischen Unternehmen wird noch nicht so gearbeitet, da die Tools, die zum Einsatz kommen, sehr anspruchsvoll sind, müssen hier sowohl die Entwickler als auch die Mitarbeiter vom Vertrieb an einem Strang ziehen. Zudem sollten sich CIOs und Mitarbeiter stärker mit Data Science beschäftigen. Eine Möglichkeit wäre es, Datenexperten einzustellen, um den Nutzen von Daten zu vermitteln, besser auf dessen Bedürfnisse einzugehen und aus den Daten neue Ideen abzuleiten.

In welchen Bereichen ist Big Data wirklich hilfreich?

Nachdem die Menschen immer stärker von Computern abhängig werden, denke ich, dass wir immer mehr „Empfehlungssysteme“ nutzen werden. Diese dienen dazu, dass die Maschinen im Vorfeld Analysen durchführen und uns bestimmte Vorschläge geben, was wir tun sollen. Es ist eine Erleichterung im Alltag. Der Mensch tut sich viel leichter, aus einigen vorgerechneten Optionen auszuwählen, als aus Millionen von Möglichkeiten. Ein Beispiel für ein solches System wäre Siri von Apple. Es ist ein persönlicher Assistent, der auf Fragen des Nutzers antwortet oder Kommandos ausführt.

Auf der nächsten Seite: Die Perspektiven

 Welche Zukunftsperspektiven gibt es im Rahmen von Big Data?

Ich halte sehr viel vom Denkansatz Big Data, aber nicht von dem Hype um den Begriff. Im Ausland gibt es aufsteigende Ausbildungsberufe für junge IT-ler. Ein Beispiel ist der sogenannte Data Scientist. Das ist jemand, der einen starken mathematischen Hintergrund hat, aber auch sehr gut programmieren kann und die Maschine beherrscht. Dieser kann aus vielen Daten so viele Infos wie möglich, in so kurzer Zeit wie möglich herausziehen. Diese Art von Informationsgewinnung kann Strategien für Unternehmen bestimmen.

Für klassische Unternehmen bedeutet es, Research-Abteilungen aufzubauen und die Informationsgewinnung proaktiv voranzutreiben. Sie sollten offen sein und nicht nur vom Anbieter XY Produkte kaufen. Entwickler sollten die Chance bekommen, wie bei Startups, bei null zu beginnen und Prozesse und Tools selbst zu entwickeln, zu adoptieren bzw. überhaupt auszuprobieren. Damit können Unternehmen auch High Potentials gewinnen.

Welche Entwicklung erwarten Sie in den nächsten Jahren?

Die Unternehmen haben mittlerweile gemerkt, dass Informationsgewinnung extrem wichtig ist, um konkurrenzfähig zu bleiben. Es müssen schnelle Entscheidungen getroffen werden, damit sie sich auf die Marktsituation einstellen können. Der Faktor Zeit spielt eine entscheidende Rolle. Ob Handel-, Industrie- oder Finanzsektor, sie werden alle proaktiv Daten aus verschiedenen Quellen auswerten und sich daraus einen Wettbewerbsvorteil verschaffen. Die Informationsgewinnung, zwecks besserer Marktposition, wird mittels Big Data neue Dimensionen erreichen. Menschen werden sich stärker von Maschinen helfen lassen.

 

 

 

Tags: ,

Leave a Reply