Detection of cell markers from single cell RNA-seq with sc2marker

Li, Ronghui; Zimmer-Bensch, Geraldine Marion (Thesis advisor); Costa, Ivan G. (Thesis advisor)

Aachen : RWTH Aachen University (2022)
Doktorarbeit

Dissertation, RWTH Aachen University, 2022

Kurzfassung

Fortschritte in der Einzelzell-RNA-Sequenzierung (scRNA-seq) haben die biomedizinische Forschung revolutioniert, da sie die simultane Untersuchung der Transkriptome von Millionen von Zellen ermöglichen. Dies hat dazu beigetragen molekulare Prozesse aufzudecken, die die Zelldifferenzierung steuern und komplexe Krankheiten verursachen. Für die Analyse von scRNA-seq-Daten wurden zahlreiche computergestützte Methoden vorgeschlagen, darunter die unüberwachte Analyse zur Charakterisierung neuartiger und krankheitsspezifischer Zellsubpopulationen wie seltene Stroma- und Immunzellen, die mit anderen Methoden nicht erkannt werden können. Die Abgrenzung kleiner Panele mit Markergenen, die solche Subpopulationen charakterisieren, ist für die weitere molekulare Charakterisierung und Validierung der nachgewiesenen Zellen von besonderer Bedeutung. Die Durchflusszytometrie kann beispielsweise zur physischen Isolierung von Zellen und zur Quantifizierung von Zellpopulationen oder der Expression von Markern sowohl für die Forschung als auch für klinische Anwendungen eingesetzt werden. Die Durchflusszytometrie erfordert jedoch eine kleine Auswahl an Antikörpern (<50), die auf zuvor charakterisierte Zelloberflächenproteine abzielen, welche als Marker für die gewünschten Zelltypen verwendet werden können. Mit der Multiplex-Immunhistochemie (IHC) kann die Proteinhäufigkeit auf zellulärer Ebene in Gewebequerschnitten gemessen werden, was die Identifizierung von Zellen in einem räumlichen Kontext ermöglicht. IHC kann auch mit kleinen Panele von Markern mit IHC-kompatiblen Antikörpern durchgeführt werden. Es mangelt jedoch an computergestützten Methoden, um die hohe Genabdeckung von scRNA-seq für die Abgrenzung von Zellmarkern von neuartigen Zellsubtypen zu untersuchen, wie sie durch die Clusteranalyse von scRNA-seq-Daten erkannt werden, um sie dann mit antikörperbasierter Durchflusszytometrie oder IHC-Bildgebung weiter abzugrenzen. Wir schlagen hier sc2marker vor, ein nicht-parametrisches Maximum-Margin-Verfahren zur Auswahl von Merkmalen, um in geclusterten scRNA-seq-Daten nach Markergenen zu suchen. sc2marker berücksichtigt den Abstand von wahr positiven und wahr negativen Zellen zum optimalen Schwellenwert (maximum margin), um die besten Markergene zu ermitteln, was von konkurrierenden Verfahren nicht untersucht wird. sc2marker verfügt über Datenbanken, welche Marker mit Antikörpern enthalten, die für bestimmte Anwendungen, einschließlich IHC und Durchflusszytometrie, maßgeschneidert sind. Diese Datenbanken unterstützen die Aufgabe der Merkmalsauswahl, da die Merkmalsauswahl auf die mit diesen Proteinen verbundenen Genräume beschränkt werden kann. Wir bewerten die Fähigkeit von sc2marker und konkurrierenden Methoden bekannte durchflusszytometrische und bildgebende Marker von gut charakterisierten Immunzellen zu erkennen. Dazu verwendeten wir fünf öffentlich verfügbare scRNA-seq-Datensätze von Immunzellen und bewerteten die Leistung dieser Methoden beim Ranking bekannter Markergene. Außerdem haben wir sc2marker mit einem neuartigen scRNA-seq-Datensatz von Stromazellen aus dem Knochenmark von Mäusen verwendet, welcher iii anschließend mit einer Flussanalyse validiert wurde. Insgesamt zeigten unsere Analyseergebnisse, dass sc2marker ein nützlicher computergestützter Ansatz zur Erkennung zelltypspezifischer Marker in scRNA-seq-Daten ist.

Einrichtungen

  • Fachgruppe Biologie [160000]
  • Lehr- und Forschungsgebiet Neuroepigenetik [164620]

Identifikationsnummern

Downloads