Bei der Analyse molekularer Prozesse auf Basis einzelner Zellen entstehen schnell große Datenmengen. Ein Münchner Forscherteam zeigt jetzt, welche Möglichkeiten der Computer-Algorithmus PAGA bietet: Auf der Basis von Big Data erstellt es eine graphische, leicht interpretierbare Karte, die zelluläre Prozesse und Schicksale in komplexen Zusammenhängen aufzeigt.

Das Schicksal einzelner Zellen im Körper ist in vielerlei Hinsicht relevant. Forscher wollen Entwicklungsprozesse untersuchen, aber auch verstehen, wie es zur Entstehung von Krankheiten kommt. „Bei Experimenten entstehen große Datensätze, sprich Big Data“, erklärt Prof. Dr. Dr. Fabian Theis, Direktor des Institute of Computational Biology (ICB) am Helmholtz Zentrum München und Professor für Mathematische Modellierung biologischer Systeme an der Technischen Universität München (TUM).

Forscher erfassen nicht nur Informationen über die Zelle selbst (u.a. über das Transkriptom, das Proteom, die Morphologie bzw. das Epigenom), sondern auch über Wechselwirkungen mit anderen Zellen oder anderen Gewebetypen. Theis: „Bislang gab es jedoch keine Möglichkeiten, um komplexe Prozesse auf zellulärer Ebene verständlich abzubilden.“

PAGA interpretiert Big Data

Forscher arbeiteten dabei bislang mit zwei Ansätzen zur Datenanalyse. Entweder suchten sie nach Zellen mit ähnlichen Eigenschaften und gruppierten diese („Clustering“). Oder sie beschrieben den zeitlichen Ablauf von Zellen auf ihren Entwicklungspfaden („Trajektorieninferenz“). „Wenn man diese sehr unterschiedlichen „Brillen“ nimmt, um auf die Daten zu sehen, entstehen natürlich abweichende und unklare Interpretationen“, ergänzt Dr. Dr. Alex Wolf.

Wolf, der den Algorithmus PAGA entwickelt hat, leitete bis vor kurzem ein Machine-Learning-Team am ICB. PAGA steht für „partition-based graph abstraction“ und ermöglicht, dass verschiedene Ansätze wie die Gruppierung von Zellen nach Eigenschaften und die zeitliche Entwicklung gemeinsam betrachtet werden können.

„PAGA leistet alles, was Clustering und Trajektorieninferenz kann, in einer einzigen Analyse, mit einer einzigen Methode und einem einzigen schlüssigen Ansatz zur Modellierung.“ Je nach gewünschter Auflösung gruppiert das Tool Zellen beispielsweise anhand ihres Zelltyps (etwa Hautzellen), ihres biologischen Zustands (beispielsweise in Teilung) und zeigt die dabei zelluläre Übergänge zwischen Typen und Zuständen auf.

Unter Federführung von Wolf veröffentlichten die Wissenschaftler des Helmholtz Zentrums München und der Technischen Universität München ihre Erkenntnisse im Fachmagazin Genome Biology.

Anwendung in der Forschung

In den letzten Monaten sind mehrere Fachartikel erschienen, die zeigen, welche Möglichkeiten PAGA bietet:

Theis sieht im Tool auch künftig große Potenziale: „Im Grunde kann jedes biologische Phänomen, das sich auf einen zellulären Prozess zurückführen lässt, mit PAGA analysiert werden, sobald auch Daten vorhanden sind.“


Quelle: Pressemitteilung des Helmholtz Zentrums München - Deutsches Forschungszentrum für Gesundheit und Umwelt (HMGU)