Daten-Management, -Modellierung, und -Integration

AG Beule

Die Core Unit Bioinformatik (CUBI), unter der Leitung von Dieter Beule, stellt sich der Herausforderung schnell wachsende Mengen komplexer molekularer Daten zu verwalten und bietet Lösungen und Analysen, die für die biomedizinische Forschung und die klinische Anwendung genutzt werden können. Das CUBI Team fokussiert seine Arbeit auf die Methodenentwicklung und Erstellung von Algorithmen für eine effiziente, reproduzierbare und verlässliche omics Daten Prozessierung und Interpretation sowie neuartige Technologien zum Datenzugang. Die omics Datenanalyse umfasst die Bereiche Genetik seltener Erkrankungen, Krebs sowie funktionelle Genomik, Einzelzell-Transkriptomik sowie Metabolomik und Proteomik. CUBI hat systems for omics data access and retrieval (SODAR) entwickelt, dass den Umgang mit proteomischen, metabolomischen und genomischen Rohdaten, zugehörigen pseudonymisierten Metadaten und prozessierten Ergebnissen inklusive zugehöriger log files, ermöglicht.
Als Teil des MSTARS Konsortiums designen Dieter Beule und das CUBI Team neue Metadaten-Modelle für neue Datentypen, die unter anderem aus MALDI Imaging oder CyTOF Experimenten stammen. Darauf aufbauen werden neue Datenimport Pipelines für diese Metadaten in SODAR etabliert und validiert. Die Pipelines garantieren eine hohe Datenqualität und Konsistenz. Zusätzlich unterstützt das Team von Dieter Beule die Datenanalyse der einzelnen Arbeitspakete und führt Datenintegrationen von omics Datensätzen durch, um Signaturen mit biomedizinischer Relevanz zu erhalten und vergleicht die Ergebnisse mit existierenden und Validierten Methoden für die Therapieentscheidungsfindung. Auf längere Sicht wird die Nutzbarkeit der gewonnenen Informationen für die molekulare Tumorkonferenz evaluiert.

AG Blüthgen

Das Labor von Nils Blüthgen nutzt mathematische Modellierungen, Methoden der Bioinformatik und quantitative Zellbiologie, um intrazelluläre Signalgebungen und genregulatorische Netzwerke zu untersuchen. Wie onkogene Signalwege und ihre downstream gelegenen regulatorischen Netzwerke ihr onkologisches Potential entfalten, wie Medikamente diese Netzwerke modulieren können und wie Resistenzen gegenüber zielgerichteten Kinaseinhibitoren enststehen, sind drei Hauptfragestellungen, die die Arbeitsgruppe verfolgt. Das Team analysiert und integriert mithilfe von modernsten bioinformatischen Methoden und mathematischen Modellen quantitative oder Genom-weite Daten.
Innerhalb des MSTARS Konsortiums entwickelt das Blüthgen Labor semi-mechanistische, computer-gestützte Modelle, die die Analyse und Integration von Perturbationsdaten präklinischer Modelle ermöglichen und in Biomarkern oder Signaturen resultieren, die auf klinischen Patientenproben getestet werden können. Zuerst werden die Modelle genutzt, um die vielfältigen Antworten nach Inhibition von Signalwegen zu ergründen, um Therapieresistenzen besser zu verstehen und assoziierte mechanistische Marker abzuleiten. Daraus können verbesserte Therapieempfehlungen resultieren, die experimentell oder in Patientenkohorten getestet werden können. Basierend auf den gewonnenen Daten werden die Modelle iterativ optimiert. Zusätzlich werden die räumlichen Daten interessanter Analyten aus den MS- und Imaging-basierten Daten extrahiert und für die weitere Verbesserung der Modelle verwendet. Schlussendlich wird diese Herangehensweise auf mindestens zwei weitere Krebsentitäten angewendet.

Copyright: Charité – Universitätsmedizin Berlin
Copyright: Nils Blüthgen

AG Klauschen

Mit ihrer Arbeit verfolgt die Arbeitsgruppe von Frederick Klauschen einen systemmedizinischen Ansatz, in dem sie histomorphologische, genomische und proteomische Analysen integrieren, um klinisch und therapeutisch relevante molekulare Veränderungen in Tumoren zu identifizieren. Das Labor nutzt experimentelle Methoden und bioinformatische Ansätze, zu denen Machine Learning und Simulationen zählen, um pathologische Charakteristika von Tumoren besser zu verstehen und das Wissen für die Vorhersage besserer und zielgerichteter Therapien für individuelle Patienten einzusetzen. Um die Integration von proteomischen Datensätzen zu ermöglichen, arbeitet das Team an Methoden, die die Effizienz und Aufkonzentrierung der sensitiven Proben für proteomische MS-Analysen als Ziel hat. Die Kombination der proteomischen mit weiteren omics Daten und ihre nachfolgende Integration über Netzwerkmodelle ermöglicht Einblicke in die funktionelle Relevanz von Mutationsprofilen und erlaubt die Simulation von Effekten aktivierender Mutationen und ihrer Inhibition durch medikamentöse Behandlungen.
Im Kontext von MSTARS verwendet AG Klauschen Machine Learning und neuronale Netzwerke, verbunden mit layer-wise relevance propagation (LRP), um klinisch relevante Charakteristika von multi-omics und histologischen Daten vorherzusagen. Das Team entwickelt neue Machine Learning Ansätze, mit denen klinische Kohorten und experimentelle Modelle analysiert werden können, um unter anderem die Fragen zu beantworten, ob metabolomische proteomische Daten vorhersagen können und vice versa und ob Methylierungsmuster aus proteomischen Daten vorhergesagt werden können. Darüber hinaus adaptiert die Arbeitsgruppe die Machine Learning Ansätze an heterogene Input Daten von Imaging-basierten, histologischen und multi-omics Analysen, um dadurch die Frage zu adressieren, wie Imaging-basierte und histologische Daten multi-omics Daten komplettieren können, um klinische Parameter und Therapieantworten vorherzusagen.