Soccer team in a huddle

Den Organismus besser verstehen

Feature | 19. Februar 2015 von Michael Zipf 0

Mit der ProteomicsDB powered by SAP HANA unterstützt die SAP Forscher weltweit bei ihrer Arbeit am menschlichen Organismus und legt die Grundlagen für die Entwicklung neuer Therapien gegen Krebs, Demenz oder Diabetes.

Dr. Hans-Christian Ehrlich ist Bioinformatiker am SAP Innovation Center in Potsdam. Das Verständnis von molekularen Prozessen kombiniert mit der Fähigkeit, Software zur Analyse von biologischen Massendaten zu entwickeln, gehören zu seinem Fachgebiet. „Ich finde die Arbeit an der Schnittstelle zwischen Wissenschaft und Wirtschaft interessant.“ Ehrlich leitet am SAP Innovation Center unter anderem das Projekt „ProteomicsDB“.

„ProteomicsDB“ heißt die auf SAP HANA-basierende Plattform, die SAP zusammen mit der TU München im Mai 2013 erstmals vorgestellt hat und die seitdem in der Fachwelt auf große Resonanz gestoßen ist. Ziel der Plattform ist es, zur Entschlüsselung des menschlichen Proteoms, also der Gesamtheit aller Proteine im menschlichen Körper, beizutragen. Dieses Wissen ermöglicht es Forschern, Krankheiten besser zu verstehen, und bietet die Grundlage, um neue Therapien und bessere Diagnoseverfahren zu entwickeln.

„Das Proteom erzählt viel über den menschlichen Körper“, erläutert der Bioinformatiker. Eine kranke Zelle könne von einer gesunden Zelle anhand ihrer Proteine unterschieden werden. Forscher versuchen nun, Proteine, die auf Krebs, Demenz, Diabetes oder andere Krankheiten hinweisen, zu erkennen und Verbindungen zwischen diesen Proteinmustern und den Krankheiten herzustellen. „ProteomicsDB ist ein bedeutender Meilenstein auf unserem Weg, Krankheiten besser zu verstehen und neue Therapiemöglichkeiten auszuloten. Die Software unterstützt Wissenschaftler und andere Zielgruppen dabei, experimentelle Daten zu speichern, zu verknüpfen und in Echt-Zeit auszuwerten. Damit können wir biologische Systeme wesentlich genauer untersuchen als bisher“, sagt Professor Bernhard Küster, Leiter des Lehrstuhls für Proteomik und Bioanalytik an der TU München.

Veröffentlichung in „Nature“

Die grundlegende Technik, um Proteine in Körperzellen sichtbar zu machen, ist die Massenspektrometrie. Hier kommt SAP ins Spiel: Ein einziges Massenspektrometrie-Experiment ergibt rund 2,4 Gigabyte an Daten. Selbst die vollständig analysierten Daten haben ein Volumen von mehreren Terabytes. Um diese Daten schnell zur Verfügung stellen zu können, brachte SAP ihre In-Memory-Datenbank SAP HANA in die Kooperation mit der TU München ein. „Während die TU sich vor allem um die wissenschaftliche Seite, die Proteomik kümmert, treiben wir die technische Seite aktiv voran. Die Kollegen in München überlegen sich, welche Analysestrategien sie für die Daten anbieten wollen, und wir schauen dann, wie man das auf SAP HANA umsetzen kann“, so Ehrlich.

Im Mai 2014 publizierte die TU München zusammen mit SAP die gewonnenen Erkenntnisse im Wissenschaftsmagazin „Nature“, eines der wichtigsten Magazine in der Wissenschaft. Wer es ins Magazin schafft, weiß, dass er wahrgenommen wird. Häufig wird die ProteomicsDB seitdem in wissenschaftlichen Publikationen erwähnt und Forscher nutzen die Datenbank täglich. So begrüßen die Proteomik-Forscher in aller Welt, dass sie hier eine Plattform finden, die ihnen den Blick auf das große Bild des menschlichen Proteoms ermöglicht.

Vision ist die „Multi-Omics-Plattform“

„Der Mensch hat ca. 20.000 Gene und jedes dieser Gene wird in mindestens ein Protein übersetzt. Bislang konnten wir etwas mehr als 18.000 Proteine katalogisieren, das sind rund 93 Prozent. Das menschliche Proteom ist aber weitaus komplexer. So gibt es unterschiedliche Varianten eines Proteins und diese werden in der Zelle häufig modifiziert, so dass man von mehreren Millionen möglicher Proteine im menschlichen Proteom ausgehen kann“, berichtet Ehrlich. Es gebe also auf diesem Gebiet noch reichlich zu tun. So wolle die TU München zusammen mit dem SAP Innovation Center einzelne Massenspektren jedes Proteins aufnehmen und analysieren.

Ehrlichs Gedanken und die seiner Kollegen am SAP Innovation Center, an der TU München und bei SAP gehen aber längst darüber hinaus. „Wir könnten uns vorstellen, eine Plattform zu entwickeln, die gleichzeitig mit Genom-, Transkriptom-, Proteom-, und Metabolom-Daten umgehen und weitere klinische Daten integrieren kann.“ An diesem „Multi-Omics-Ansatz“ ist neben der TU München auch der „Forschungscampus Modal“ der Freien Universität Berlin beteiligt. „In einem solchen multi-dimensionalen Ansatz steckt großes Potenzial“, so Ehrlich.

Erste Anfragen gibt es inzwischen auch von der Industrie, die eine solche Datenbank gerne mit eigenen Daten hinter der Firewall betreiben würde. „So könnte aus diesem Projekt auch schnell ein Produkt werden“, sagt Ehrlich. SAP lerne mit Projekten wie der ProteomicsDB, wie solch spezielle Daten mit SAP HANA prozessiert und visualisiert werden können. Ehrlich: „All das hilft am Ende hoffentlich auch der medizinischen Forschung, Krankheiten besser zu verstehen und Partnern die benötigte technologische Voraussetzung zu bieten, um Fortschritte im Bereich der personalisierten Medizin zu machen.“

Über ProteomicsDB

In Zusammenarbeit mit der TU München hat SAP die online frei verfügbare Plattform ProteomicsDB geschaffen. Hier können Interessierte wichtige Informationen über das menschliche Proteom – sei es für Körperzellen, -flüssigkeiten oder Krebszelllinien – in Echtzeit abrufen. Forscher können Suchanfragen laufen lassen und sich die Ergebnisse auf unterschiedliche Weise darstellen oder über Schnittstellen eigene Anwendungen programmieren und die Daten herunterladen. SAP stellt sowohl die Infrastruktur bestehend aus 160 CPUs und 2 Terabyte Hauptspeicher (RAM) als auch die Plattform SAP HANA zur Verfügung.

Am Projekt sind das SAP Innovation Center Potsdam und verschiedene Abteilungen bei SAP beteiligt.

Nützliche Links

Bildquelle: Shutterstock

Tags: , , ,

Leave a Reply